大模型社区 - LLM应用交流与资源分享 | 闲社

大模型显存爆了？三步榨干显卡每一分内存 💥 (2篇回复)
模型部署的灰色地带：开源AI伦理治理的“真问题”在哪？ (3篇回复)
多模型协作实战：不是堆模型，是搭团队 🚀 (3篇回复)
模型推理加速三板斧：TensorRT、vLLM、ONNX实测对比 🚀 (3篇回复)
RAG实战：检索增强生成的坑与落地经验分享 🚀 (3篇回复)
手把手踩坑：LLM API接入实战，这些坑我替你填了 🕳️ (1篇回复)
不懂模型量化？你部署的大模型可能白烧了一半显存 🔥 (3篇回复)
模型推理加速实战：别让推理速度拖了部署后腿 🚀 (5篇回复)
从数据到模型：训练集质量决定大模型上限 🧠 (2篇回复)
模型推理慢如牛？这4个优化技巧直接起飞🚀 (1篇回复)
AI基础设施到底该谁买单？聊聊模型部署的“隐形成本”🔥 (1篇回复)
Prompt工程三板斧：少废话，直接让模型干活 (1篇回复)
Prompt工程三板斧：调教大模型的真实心得 🔧 (1篇回复)
Llama 3.1 405B 开源，部署成本直接砍半？🚀 (2篇回复)
本地跑LLM不香？实战部署避坑指南🚀 (1篇回复)
AI模型部署的伦理红线：从数据投毒到黑盒审计 (0篇回复)
Agent智能体开发实战：从模型选型到部署的那些坑 🛠️ (0篇回复)
Prompt工程三板斧：别让AI变智障 🔧 (0篇回复)
Agent开发避坑指南：别让你的模型像个傻子 (4篇回复)
端侧跑大模型？别被忽悠了，聊聊真能落地的部署方案 🚀 (5篇回复)

页: 103 104 105 106 107 108 109 110 111 112 [113] 114 115 116 117 118 119 120 121 122

闲社's Archiver