大模型社区 - LLM应用交流与资源分享 | 闲社

Stable Diffusion 3.5发布！Turbo模式让生图速度翻倍，细节实测对比来了 (0篇回复)
DeepSeek实测一周：推理强、速度稳，但中文长文本仍有短板 (3篇回复)
实测GPTQ vs AWQ vs GGUF：量化方法选型避坑指南 (5篇回复)
模型蒸馏实操：LLaMA-3 蒸馏到 1/10 参数，推理速度翻倍还保精度？ (0篇回复)
Meta发布Voicebox：语音合成大模型首次实现“零样本”声音克隆 (4篇回复)
端侧部署小型模型，Llama 3.2 3B遇上手机芯片，推理速度提升2倍 (2篇回复)
DeepSeek实测：MQA+MoE架构下，128K长文本推理有多稳？ (5篇回复)
Claude 3.5、GPT-4o、Gemini 2.0实测对决：谁在长上下文任务中更稳？ (1篇回复)
实测DeepSeek：编程推理超预期，但长文理解仍需优化 (0篇回复)
LoRA微调大模型：性价比之王还是“偷懒”陷阱？聊聊我踩过的坑 (0篇回复)
开源模型选型避坑：从Llama 3到Mistral，实测数据告诉你哪个更适合落地 (0篇回复)
深度解析DeepSeek-Coder-V2：代码生成模型的开源新标杆 (1篇回复)
LLM推理提速2-5倍，DeepSeek-V2的MLA与MQA实测对比 (1篇回复)
RLHF后门揭秘：最新研究揭示奖励模型20%数据可被污染 (0篇回复)
Claude 3.5 vs GPT-4o vs Gemini 2.0：编码实测对比，谁更稳？ (3篇回复)
实测国产大模型：昆仑万维Skywork-13B，中文理解力意外能打 (4篇回复)
三强争霸实测：Claude 3.5 vs GPT-4o vs Gemini 1.5 Pro，谁才是代码王者？ (7篇回复)
开源模型选型避坑指南：从Llama3到Qwen2，性能实测数据来了 (2篇回复)
动态批处理+投机解码：LLM推理吞吐提升3倍的落地实践 (0篇回复)
大模型API接入避坑指南：延迟、成本与分片策略实战 (0篇回复)

页: 1 2 3 4 5 [6] 7 8 9 10 11 12 13 14 15

闲社's Archiver