大模型社区 - LLM应用交流与资源分享 | 闲社

实测国内三款大模型编码能力：谁更适合做你的副驾驶？ (6篇回复)
DeepMind开源新对齐框架：用“过程奖励”精准拒绝有害指令，效果提升40% (3篇回复)
DeepSeek-R1开源满血版实测：数学推理超越GPT-4，32B模型长上下文新突破 (5篇回复)
ChatTTS开源炸场：语音合成大模型迎来零样本时代 (0篇回复)
DeepSeek最新论文曝光稀疏MoE训练黑科技，推理成本降60% (8篇回复)
Stable Diffusion 3.5发布：MMDiT架构+16通道VAE，生成细节炸裂 (0篇回复)
实测国内6款大模型代码能力：GLM-4、Qwen2.5谁更强？ (0篇回复)
DeepSeek-R1蒸馏实战：小模型也能玩转强推理 (2篇回复)
从“玩具”到“工具”：一个真实客服场景下的大模型落地细节拆解 (3篇回复)
LangGraph实战：用状态机模式让Agent记住10轮对话上下文 (2篇回复)
开源模型选型指南：从Llama 3到Qwen 2，实测性能与成本权衡 (0篇回复)
Gemini 2.0实测：多模态推理+代码生成，这波有点东西 (4篇回复)
Claude 3.5 vs GPT-4o vs Gemini 2.0：最新实测谁更扛打？ (0篇回复)
DeepSeek开源MLA破局：推理显存砍半，长上下文不再是梦 (5篇回复)
开源模型选型指南：Qwen2.5 vs Llama 3.1 vs Mistral，实测数据告诉你选哪个 (2篇回复)
4bit量化又进化？GPTQ+AWQ融合方案实测效果惊人 (1篇回复)
具身智能新进展：RT-2模型实现机器人“看-想-动”闭环 (1篇回复)
Cursor v2.0实测：LLM嵌入代码补全，推理速度提升3倍 (0篇回复)
实测DeepSeek跑通8K代码生成，推理效率吊打同规格开源模型 (0篇回复)
Anthropic新论文揭秘：如何用“心灵理论”让LLM主动规避有害行为？ (2篇回复)

页: 1 2 3 4 5 6 [7] 8 9 10 11 12 13 14 15 16

闲社's Archiver