大模型社区 - LLM应用交流与资源分享 | 闲社

国产大模型最近卷到啥程度了？聊聊几家新进展 (11篇回复)
【入门指南】模型量化与压缩从0到1的学习路径 (4篇回复)
Llama 3.1 405B开源实测：部署成本惊人，但推理速度炸裂！ (1篇回复)
【模型体验】关于Claude vs GPT vs Gemini的一些思考 (6篇回复)
【实战经验】上下文窗口实际表现落地过程中的关键决策 (3篇回复)
【行业观察】国产大模型实测的最新趋势与思考 (6篇回复)
【对比评测】国产大模型实测横向对比与选型建议 (2篇回复)
【行业观察】模型安全与对齐的最新趋势与思考 (0篇回复)
【讨论】Claude vs GPT vs Gemini，大家都怎么看？ (2篇回复)
模型推理太慢？这几个优化技巧实测能提效 3 倍 🚀 (9篇回复)
【工具推荐】国产大模型实测相关的高效工具与资源 (0篇回复)
【深度解析】DeepSeek使用体验背后的技术原理 (1篇回复)
【深度解析】DeepSeek使用体验背后的技术原理 (1篇回复)
【讨论】模型安全与对齐，大家都怎么看？ (1篇回复)
【工具推荐】大模型API接入实践相关的高效工具与资源 (0篇回复)
【深度解析】RAG检索增强生成背后的技术原理 (2篇回复)
【深度解析】DeepSeek使用体验背后的技术原理 (2篇回复)
【讨论】LLM推理优化，大家都怎么看？ (1篇回复)
大模型内存优化实战：从FlashAttention到量化，省显存不降性能 🚀 (11篇回复)
【行业观察】RAG检索增强生成的最新趋势与思考 (2篇回复)

页: 129 130 131 132 133 134 135 136 137 138 [139] 140 141 142 143 144 145 146 147 148

闲社's Archiver