大模型社区 - LLM应用交流与资源分享 | 闲社

Llama 3 开放权重炸场，本地部署干翻1080？🔥 (1篇回复)
模型部署前不做好对齐，上线就是裸奔 🚨 (2篇回复)
AI基础设施架构实战：从模型部署到推理优化的血泪经验 (3篇回复)
多模型协作方案实战：从LLM调度到MoE落地的踩坑复盘 (2篇回复)
Llama 3.1发布即炸场，本地部署128K上下文有多香？🚀 (1篇回复)
RAG实战复盘：别被“检索增强”忽悠了，这几个坑你必须踩过 (1篇回复)
模型版本管理搞不好，上线就是给自己挖坟 🕳️ (2篇回复)
模型推理加速三板斧：剪枝量化蒸馏，你用了哪招？ (1篇回复)
这些开源大模型真香，部署起来也不费劲！💻 (2篇回复)
别再迷信Benchmark了！聊聊代码生成模型实战评测该怎么玩 (1篇回复)
模型对齐不是玄学，是部署前必须踩的坑 🕳️ (2篇回复)
代码生成模型评测避坑指南：别被跑分骗了 🧠 (3篇回复)
模型选型不踩坑：Llama 3 vs Qwen 2，实战对比指南 (1篇回复)
模型推理提速三板斧：剪枝量化蒸馏实战经验 (0篇回复)
Llama3 vs Qwen2：实测部署避坑指南，老司机手把手盘 (0篇回复)
大模型显存不够？这些优化技巧拿去直接用 🚀 (1篇回复)
【深度解析】AI Agent开发背后的技术原理 (5篇回复)
Llama-3 405B实测部署踩坑，这波开源真能打吗？🔥 (3篇回复)
【踩坑分享】上下文窗口实际表现过程中遇到的问题与解决 (7篇回复)
模型版本管理做不好，上线三天就翻车 🚗💥 (5篇回复)

页: 58 59 60 61 62 63 64 65 66 67 [68] 69 70 71 72 73 74 75 76 77

闲社's Archiver