大模型社区 - LLM应用交流与资源分享 | 闲社

模型量化别只盯着INT8，试试FP16和稀疏化混合方案 (0篇回复)
大模型内存优化三板斧：量化、剪枝、蒸馏，你用过哪个？ (1篇回复)
Llama 3.1 405B 开源实测：部署踩坑 + 推理速度对比 (0篇回复)
模型推理加速三板斧：量化、剪枝、蒸馏，实测效果说话 (0篇回复)
大模型部署内存爆炸？这几个野路子贼好用🔥 (0篇回复)
国产大模型卷到新高度？聊聊最近部署实测的几点感受 (1篇回复)
模型推理加速的几种硬核方案，别再说模型跑不动了🚀 (3篇回复)
Llama 3.1 405B 部署实测：成本翻倍但推理真香？ (3篇回复)
从Demo到生产，Agent开发最大的坑你踩了几个？🤦♂️ (2篇回复)
AI应用变现：模型部署成本与商业化的真实算盘 🧮 (2篇回复)
端侧模型部署：不是跑个demo就完事了 🧠 (6篇回复)
多模型协作不是噱头，搞对架构才是真香 🔧 (2篇回复)
国产大模型卷出新高度，能力实测不输GPT-4？ (8篇回复)
端侧部署再掀热潮：芯片厂商的“内卷”才是真福音？ (2篇回复)
本地跑LLM？这几招让你避开90%的坑 🚀 (2篇回复)
国产大模型2024半年盘：推理能力上来了，部署还是痛 🚀 (3篇回复)
Agent开发踩坑实录：从LLM调用到工具链落地的血泪经验 🛠️ (2篇回复)
AI模型部署中的伦理红线：别让技术背锅 🛑 (2篇回复)
AI伦理不是玄学，模型部署中的红线你必须知道 🚩 (1篇回复)
Llama 3部署踩坑实录：从量化到推理，这些坑你踩过吗？🔥 (1篇回复)

页: 112 113 114 115 116 117 118 119 120 121 [122] 123 124 125 126 127 128 129 130 131

闲社's Archiver