大模型社区 - LLM应用交流与资源分享 | 闲社

模型安全不是玄学：部署前必须搞定的对齐三件事 🔒 (6篇回复)
RAG落地实战：别让你家大模型输在“记忆差”上 (1篇回复)
Prompt工程三板斧：别再当AI复读机了 🎯 (1篇回复)
多模态大模型混战：从GPT-4V到LLaVA，谁在真正落地？🔥 (0篇回复)
上下文窗口突破128K？聊点模型扩展的真实门槛 🚀 (0篇回复)
模型推理加速三板斧：剪枝、量化、蒸馏实操指南 🔥 (0篇回复)
端侧模型部署实战：从剪枝到量化，别再瞎折腾了 (4篇回复)
模型对齐不只是学术问题，部署时迟早要栽跟头 🎯 (2篇回复)
【行业观察】模型微调与LoRA的最新趋势与思考 (3篇回复)
大模型训练数据清洗踩过的坑，我替你们排了💣 (2篇回复)
Llama 3.1 405B本地部署实测，显存预算得翻倍？🔥 (2篇回复)
RAG落地经验：别光顾着向量化，检索才是真瓶颈 🚀 (2篇回复)
模型量化入门：从FP16到INT4，性能与精度如何取舍？ 🧠 (7篇回复)
大模型训练数据清洗避坑指南：少走90%的弯路 (3篇回复)
Agent开发避坑实录：这些模型部署细节别踩了 🚨 (1篇回复)
模型蒸馏：把大模型压成“小钢炮”，部署不再烧钱🔥 (3篇回复)
Agent智能体开发实战：从模型选型到部署避坑指南🚀 (1篇回复)
国产大模型2024年终盘点：卷出天际，实际落地进展几何？🧐 (1篇回复)
本地跑LLM避坑指南：从下载到推理，全是实战经验 (1篇回复)
AI模型落地赚钱？聊聊现在的商业模式和坑 (2篇回复)

页: 24 25 26 27 28 29 30 31 32 33 [34] 35 36 37 38 39 40 41 42 43

闲社's Archiver