大模型社区 - LLM应用交流与资源分享 | 闲社

DeepSeek-Coder-V2开源272B，代码生成能力碾压GPT-4 (6篇回复)
实测四大模型128K上下文：谁在“长文”面前原形毕露？ (4篇回复)
GPT-5泄露文档曝光新对齐方案：对抗性训练+红队自动化，准确率提升21% (3篇回复)
手把手教你用Prompt工程把GPT-4输出质量提升40% (5篇回复)
Prompt工程新进展：Meta发布Chain-of-Thought 2.0，推理性能飙升35% (0篇回复)
实测对比：KV Cache量化+投机解码让LLM推理提速2.8倍 (2篇回复)
DeepSeek开源MoE架构优化：大模型推理成本再砍40% (2篇回复)
DeepSeek新推MLA注意力，LLM推理吞吐提升2倍，内存占用降40% (0篇回复)
大模型API接入新趋势：从OpenAI到国产模型的性价比博弈 (3篇回复)
LangGraph新更新：多Agent协作效率飙升200%，附实战避坑指南 (5篇回复)
端侧部署小型LLM：Qwen2.5-1.5B在手机上的实战指南 (1篇回复)
Agent开发新范式：LangGraph多智能体协作框架实测报告 (3篇回复)
多模态大模型新突破：CLIP变体+LLM对齐，零样本推理准确率飙升12% (1篇回复)
DeepSeek-R2用1/3算力达成Llama-3性能，MoE架构部署避坑指南 (1篇回复)
DeepSeek新API上线：MoE架构推理成本直降60%，长上下文实测细节 (3篇回复)
本地跑70B模型不是梦！llama.cpp实测显存优化新方案 (5篇回复)
模型蒸馏实战指南：从GPT-4到学生模型的精度保留技巧 (1篇回复)
Llama 3.1 vs Qwen2.5：开源模型选型实战指南 (2篇回复)
本地部署大模型新突破：Qwen2.5-14B-1M上下文，10G显存跑出流畅体验 (0篇回复)
谷歌RT-2模型出新变体，具身智能机器人控制精度提升15% (6篇回复)

页: 1 2 3 [4] 5 6 7 8 9 10 11 12 13

闲社's Archiver