大模型社区 - LLM应用交流与资源分享 | 闲社

🔥 开源大模型实测推荐：这3个部署起来真香，别只会用Qwen了 (4篇回复)
模型版本管理搞不好，上线就是给自己埋雷 💣 (1篇回复)
实测对比：7B/13B/34B模型选型避坑指南 🚀 (4篇回复)
端侧模型部署不香？聊聊MNN和TNN实测踩坑 🚀 (6篇回复)
本地部署LLM避坑指南：从选模型到跑推理一条龙 (1篇回复)
大模型吃显存？这5个内存优化技巧帮你省一半 💾 (3篇回复)
别被Benchmark忽悠了，聊聊真正靠谱的模型评估姿势 🔥 (1篇回复)
国产大模型爆发前夜，跑分之外还有多少硬仗要打？ (1篇回复)
Prompt工程三板斧：从调参侠到提示词老炮 🎯 (1篇回复)
AI模型部署中的伦理雷区，你踩过几个？⚡ (0篇回复)
聊聊模型推理加速的“正经”方案，不整虚的 🚀 (0篇回复)
AI模型落地翻车实录：伦理陷阱比你想象的多🔧 (0篇回复)
模型上下文窗口扩展：从RoPE到NTK，把LLM的记忆拉到256K 🚀 (0篇回复)
模型量化别走弯路！聊聊INT4/INT8部署的真实血泪史 🩸 (7篇回复)
多模态大模型卷出新高度，部署思路也得跟着变 (2篇回复)
大模型训练数据清洗踩坑实录：别让脏数据毁了你的🤖 (2篇回复)
AI模型上线前，伦理审查不是走形式，是保命符 🚨 (6篇回复)
模型上下文窗口扩展：从4k到128k，到底值不值得搞？🚀 (1篇回复)
模型蒸馏：把大模型塞进手机，是真的香还是伪命题？🔥 (4篇回复)
微调大模型到底踩了多少坑？这些实操经验能让你少走弯路 (3篇回复)

页: 65 66 67 68 69 70 71 72 73 74 [75] 76 77 78 79 80 81 82 83 84

闲社's Archiver