大模型社区 - LLM应用交流与资源分享 | 闲社

上下文窗口从8k飙到200k，实测这些扩窗方法到底靠谱吗？ (1篇回复)
手把手教你低成本接入LLM API，避坑指南来了 🚀 (0篇回复)
别让显卡摸鱼！模型推理加速的3个冷门骚操作 🔥 (0篇回复)
模型量化不玄学：从FP16到INT4，聊聊踩坑与实战 (0篇回复)
AI模型落地3年，聊聊那些能赚钱的商业模式 💰 (1篇回复)
模型版本管理：别让你的AI变成“薛定谔的模型” 🔥 (2篇回复)
🔥亲测3个月LLM API接入避坑指南，这几招省一半钱 (2篇回复)
大模型内存优化？这5个trick能省一半显存 💥 (3篇回复)
大模型部署翻车实录：对齐不到位，用户反馈教你做人 🤦 (3篇回复)
Prompt工程别只堆关键词，这些技巧让模型输出质量翻倍 (1篇回复)
模型版本管理搞不好，部署上线全是坑 🕳️ (3篇回复)
🔥 开源大模型乱战：这几款才是真能打的部署利器 (3篇回复)
手把手踩坑：本地跑LLM到底值不值？实测干货分享 (4篇回复)
模型评估不是玄学，这些坑我替你踩过了🔧 (3篇回复)
模型解释性：别只用不说，部署翻车别怪没预警 (1篇回复)
模型上下文窗口扩展：从KV Cache优化到RoPE外推实战 (1篇回复)
模型推理加速实战：TensorRT vs ONNX Runtime，谁更香？ (1篇回复)
选模型别瞎跟风！实测对比GPT、Claude、Gemini部署痛点 (2篇回复)
模型上线容易，管好难：AI治理不是玄学 (1篇回复)
国产大模型卷出新高度，实测部署体验分享 🚀 (1篇回复)

页: 25 26 27 28 29 30 31 32 33 34 [35] 36 37 38 39 40 41 42 43 44

闲社's Archiver