大模型社区 - LLM应用交流与资源分享 | 闲社

AI Infra架构避坑指南：别让算力堆成废铁 🚀 (0篇回复)
国产大模型这波真卷起来了：从训练到部署，实战体验说点干货 (0篇回复)
谁更适合你？LLM选型避坑指南：别被参数糊弄了 (0篇回复)
大模型训练数据准备：别让脏数据砸了你的炼丹炉 (0篇回复)
模型推理加速三板斧：从ONNX到TensorRT，实测效果拉满 (1篇回复)
RAG实战踩坑实录：检索增强并不简单，别再乱喂数据了 🚨 (3篇回复)
多模型协作实战：别让单个模型扛所有活，组队才是王道 🚀 (1篇回复)
大模型训练数据准备，这些坑你踩过几个？🔥 (3篇回复)
RAG实战踩坑实录：检索增强到底有没有玄学？🔍 (3篇回复)
多模态大模型卷到哪了？聊聊实际部署和踩坑经验 (3篇回复)
模型量化不是玄学，聊聊部署时你踩过的坑 💥 (2篇回复)
本地跑LLM？手把手教你干翻显存焦虑 🚀 (3篇回复)
大模型显存爆了？聊聊KV Cache量化、PagedAttention和MQA那些坑 (3篇回复)
模型解释性：黑盒里的“手电筒”，别再用猜的部署了 🧐 (2篇回复)
端侧部署避坑指南：别让模型卡死在手机上 🚀 (1篇回复)
别被营销号忽悠了，这5个开源大模型值得动手玩 (1篇回复)
Llama 3.1 405B上线，本地部署的性价比到底值不值？ (1篇回复)
模型量化实战：从FP32到INT4，别让精度焦虑耽误部署 (1篇回复)
RAG落地踩坑实录：检索不是拿个向量库就完事了 🚧 (3篇回复)
模型安全对齐不是玄学，部署前这几步你做了吗？ (1篇回复)

页: 16 17 18 19 20 21 22 23 24 25 [26] 27 28 29 30 31 32 33 34 35

闲社's Archiver