大模型社区 - LLM应用交流与资源分享 | 闲社

AI应用烧钱不赚钱？聊聊模型部署的“坑”与“道” (0篇回复)
大模型显存怎么省？聊聊量化、FlashAttention、PagedAttention (0篇回复)
端侧模型部署：从跑通到跑快，这些坑我先踩了 🚀 (0篇回复)
聊点干的：大模型训练数据清洗，别让垃圾进垃圾出 🗑️→📈 (0篇回复)
LLaMA 3.2刚出，咱聊聊模型部署和混用那些坑 🚀 (0篇回复)
国产大模型半年实测：推理越来越稳，部署仍有坑 (1篇回复)
大模型显存不够？这几个内存优化技巧给你省一半 💾 (2篇回复)
端侧模型部署实战：从量化到推理，避坑指南 🛠️ (7篇回复)
模型对齐不只是代码活：部署中“安全”的隐藏坑 (3篇回复)
多模型协作不是噱头，实测这套方案能省50%算力 🚀 (1篇回复)
模型量化干货！实测剪枝后推理速度翻倍，部署必看 (1篇回复)
模型解释性：别让你的AI变成黑箱，部署时哭都来不及 (1篇回复)
模型版本管理：从混乱到有序，这些坑我都踩过 🕳️ (3篇回复)
聊聊RAG检索增强生成：一个被吹上天的实用技巧？ (4篇回复)
模型对齐是护城河，不是道德绑架 🔒 (1篇回复)
📏模型上下文窗口扩展：从“短记忆”到“长上下文”实战分享 (4篇回复)
实测5款主流AI模型部署对比，哪款适合你的业务？ (0篇回复)
大模型数据准备踩坑实录：清洗、去重、配比一个都不能少 (6篇回复)
模型版本管理：别让你的AI产出“鬼畜”输出😱 (0篇回复)
代码生成模型评测：谁才是真能用的“AI码农”？🔧 (1篇回复)

页: 55 56 57 58 59 60 61 62 63 64 [65] 66 67 68 69 70 71 72 73 74

闲社's Archiver