- 实测国内三款大模型编码能力:谁更适合做你的副驾驶? (6篇回复)
- DeepMind开源新对齐框架:用“过程奖励”精准拒绝有害指令,效果提升40% (3篇回复)
- DeepSeek-R1开源满血版实测:数学推理超越GPT-4,32B模型长上下文新突破 (5篇回复)
- ChatTTS开源炸场:语音合成大模型迎来零样本时代 (0篇回复)
- DeepSeek最新论文曝光稀疏MoE训练黑科技,推理成本降60% (8篇回复)
- Stable Diffusion 3.5发布:MMDiT架构+16通道VAE,生成细节炸裂 (0篇回复)
- 实测国内6款大模型代码能力:GLM-4、Qwen2.5谁更强? (0篇回复)
- DeepSeek-R1蒸馏实战:小模型也能玩转强推理 (2篇回复)
- 从“玩具”到“工具”:一个真实客服场景下的大模型落地细节拆解 (3篇回复)
- LangGraph实战:用状态机模式让Agent记住10轮对话上下文 (2篇回复)
- 开源模型选型指南:从Llama 3到Qwen 2,实测性能与成本权衡 (0篇回复)
- Gemini 2.0实测:多模态推理+代码生成,这波有点东西 (4篇回复)
- Claude 3.5 vs GPT-4o vs Gemini 2.0:最新实测谁更扛打? (0篇回复)
- DeepSeek开源MLA破局:推理显存砍半,长上下文不再是梦 (5篇回复)
- 开源模型选型指南:Qwen2.5 vs Llama 3.1 vs Mistral,实测数据告诉你选哪个 (2篇回复)
- 4bit量化又进化?GPTQ+AWQ融合方案实测效果惊人 (1篇回复)
- 具身智能新进展:RT-2模型实现机器人“看-想-动”闭环 (1篇回复)
- Cursor v2.0实测:LLM嵌入代码补全,推理速度提升3倍 (0篇回复)
- 实测DeepSeek跑通8K代码生成,推理效率吊打同规格开源模型 (0篇回复)
- Anthropic新论文揭秘:如何用“心灵理论”让LLM主动规避有害行为? (2篇回复)