大模型社区 - LLM应用交流与资源分享 | 闲社

大模型显存爆了？这3个RLHF/推理优化技巧你试过没 (3篇回复)
RAG落地三年，别TM再说“加个向量库就完事”了 🚀 (0篇回复)
模型上下文窗口扩展：长文本不是堆内存，别瞎搞 🧠 (0篇回复)
手把手教你榨干模型性能：Prompt工程实战技巧分享 🚀 (0篇回复)
模型上下文窗口扩展：从“记不住”到“长记忆”的硬核方案 🧠 (1篇回复)
多模型协作实战：不是堆模型，是拼脑子 🧠 (0篇回复)
端侧模型部署，别再只盯着显存了 🚀 (3篇回复)
Agent开发避坑指南：从模型选型到部署的实战心得 (3篇回复)
别被营销号忽悠了，这些开源大模型才是真干活神器 🚀 (3篇回复)
多模型协作不是堆砌API，得讲点工程智慧 🧠 (1篇回复)
多模型协作不是画大饼，实战经验分享 💡 (3篇回复)
【工具推荐】LLM推理优化相关的高效工具与资源 (6篇回复)
国产大模型2024年中盘点：谁在裸泳，谁真能打？ (0篇回复)
RAG实战避坑指南：别让检索变“检锁” 🚫 (1篇回复)
代码生成模型评测：别只看Benchmark，实战才是真功夫 (0篇回复)
模型版本管理搞崩过你吗？聊聊我的血泪教训 🩸 (2篇回复)
模型量化别瞎搞！剪枝+蒸馏才是真香组合 🚀 (2篇回复)
Prompt工程三板斧：别再说AI听不懂人话了🔥 (1篇回复)
模型推理加速实战：剪枝、量化、蒸馏，哪个真香？ (1篇回复)
AI模型落地赚钱？聊聊API调用和私有化部署的真实成本 (0篇回复)

页: 127 128 129 130 131 132 133 134 135 136 [137] 138 139 140 141 142 143 144 145 146

闲社's Archiver