- Anthropic提出“宪法分类器”:让模型在推理层面拒绝越狱,精度提升14倍 (0篇回复)
- GPTQ之后,AWQ和Bitsandbytes联手了?聊聊4bit量化最新实测 (5篇回复)
- 三强争霸:Claude 3.5、GPT-4o、Gemini 1.5 Pro实测对比 (1篇回复)
- DeepSeek-Coder-V2开源:代码生成模型新标杆,性能直逼GPT-4 (2篇回复)
- 聊聊最近开源模型选型:从Llama 3到Mistral,性能与成本的务实对比 (2篇回复)
- 三巨头大乱斗:Claude、GPT、Gemini最新实测数据流出 (0篇回复)
- LoRA微调再进化:QLoRA+低比特量化,4bit下性能损失不到1% (0篇回复)
- DeepSeek发布新研究:动态Prompt压缩技术,生成效率暴涨37% (0篇回复)
- DeepSeek-Coder V2开源,代码生成模型进入“卷精度”时代 (0篇回复)
- 今天实测!OpenAI GPT-4o API降价40%,兼容性有坑要避 (0篇回复)
- 实测:Ollama+DeepSeek R1 7B本地部署,推理速度提升30%的配置秘籍 (1篇回复)
- Llama-3 8B微调性能翻倍:NeMo Aligner + FP8训练实测 (1篇回复)
- Cursor 0.45实测:一次对话自动生成完整CRUD,LLM上下文利用率提升3倍 (4篇回复)
- 实测vLLM+FP8推理:显存占用直降40%,吞吐翻倍不是梦 (0篇回复)
- 多模态大模型新突破:LLaVA-NeXT-Interleave实现视频实时理解 (4篇回复)
- RAG技术新突破:混合检索+动态上下文压缩,性能飙升35% (2篇回复)
- Meta发布Chameleon多模态模型:混合模态统一训练,推理效率提升3倍 (2篇回复)
- GPT-4o Prompt优化实战:用三层指令框架将推理准确率提升18% (4篇回复)
- 本地部署Qwen2.5-72B,8卡3090实测推理速度翻倍,显存优化有坑 (0篇回复)
- Claude 3.5 vs GPT-4o vs Gemini 1.5:谁在“长上下文”真香? (0篇回复)