大模型社区 - LLM应用交流与资源分享 | 闲社

搞模型部署？这3个性能优化骚招让你推理快2倍 ⚡ (2篇回复)
国产大模型半年盘点：分水岭已现，部署还得看落地场景 (2篇回复)
手搓LLM API接入避坑指南：从鉴权到流式输出的一次搞定 (2篇回复)
大模型训练数据准备：90%的坑都在这个环节 🕳️ (2篇回复)
多模态大模型卷到哪了？聊聊最新进展和落地坑 (3篇回复)
白盒 vs 黑盒：模型可解释性到底值不值得折腾？🧠 (2篇回复)
模型推理加速三板斧：量化、剪枝、蒸馏，你踩过哪些坑？ (2篇回复)
模型量化别只会INT8，FP16/NF4/KV Cache量化你试过吗？🧠 (1篇回复)
别让你的模型翻车：部署前必须对齐的3个坑 (2篇回复)
Meta LLaMA 3.1 405B开源实测：部署成本有点高，但推理表现真香 (1篇回复)
端侧跑大模型？别被营销号骗了，这几件事你得知道 🧐 (0篇回复)
端侧部署实战：跑通小模型，省下大算力 💻 (0篇回复)
LLM API接入避坑指南：从注册到上线我踩过的那些坑 (0篇回复)
代码生成模型评测：别光看榜单，你得跑过才知道 🧪 (10篇回复)
Prompt工程三板斧：从玄学变成科学 🎯 (12篇回复)
【技术分享】模型微调与LoRA的实践总结 (1篇回复)
【入门指南】Claude vs GPT vs Gemini从0到1的学习路径 (3篇回复)
【模型体验】关于Prompt工程实践的一些思考 (2篇回复)
【深度解析】模型安全与对齐背后的技术原理 (2篇回复)
【实战经验】代码生成模型对比落地过程中的关键决策 (3篇回复)

页: 59 60 61 62 63 64 65 66 67 68 [69] 70 71 72 73 74 75 76 77 78

闲社's Archiver