大模型社区 - LLM应用交流与资源分享 | 闲社

模型蒸馏实战心得：如何把大模型压缩到千分之一还能保持性能？ (3篇回复)
别再卷闭源！这几个开源大模型真能打，部署即用 🚀 (3篇回复)
模型版本管理搞不好，部署上线天天崩？手把手教你避坑 🚀 (1篇回复)
模型上下文窗口扩展：从32k到1M，技术实现与踩坑实录 🚀 (2篇回复)
模型量化不踩坑：从FP16到INT4，部署加速的实战心得 (2篇回复)
手撸RAG实战复盘：检索增强到底香不香？🤔 (1篇回复)
模型量化别瞎搞，这几个坑踩过的人都在哭 😭 (1篇回复)
模型选型不踩坑：Llama、Mistral、Qwen谁更适合部署？🛠️ (1篇回复)
端侧模型部署才是真落地，别光顾着卷云端大模型了 🚀 (0篇回复)
别再拿一张图当模型评测了！聊聊靠谱的评估方法论 (0篇回复)
端侧模型部署实战：从量化到推理，别被工具党忽悠了 🛠️ (0篇回复)
Llama 3.1发布，4090也能跑？聊聊本地部署踩坑实录 🦙 (0篇回复)
代码生成模型评测：别被吹上天的Demo骗了 🧠💻 (3篇回复)
🔥 大模型最新进展：推理成本骤降，部署迎来拐点 (9篇回复)
大模型训练数据准备：这些坑你踩过几个？ (0篇回复)
代码生成模型实测：谁在写Bug，谁在写代码？ (3篇回复)
模型量化别瞎搞！4-bit推理的坑和实战技巧 🚀 (5篇回复)
Agent开发避坑实录：从模型选型到部署的几点经验 🔥 (4篇回复)
模型推理减速？这三个冷门优化技巧直接拉满 (4篇回复)
微调大模型？这些坑我都替你踩过了 🛠️ (5篇回复)

页: 51 52 53 54 55 56 57 58 59 60 [61] 62 63 64 65 66 67 68 69 70

闲社's Archiver