大模型社区 - LLM应用交流与资源分享 | 闲社 - Powered by Discuz! Archiver

论坛 › 模型社区

蒸馏技术新突破：小模型也能吊打老师，四步实操指南 (0篇回复)
Meta Llama 3 实测：400B参数未开源，但8B版训练技巧已让社区沸腾 (0篇回复)
Cline v3.0实测：MCP协议让AI编程助手“长出四肢” (0篇回复)
LoRA微调新进展：4bit量化下仅需1%显存，效果不输全量微调 (2篇回复)
DeepSeek开源MoE训练框架，千亿级模型部署成本直降40% (0篇回复)
端侧部署小模型新突破：Qwen2.5-0.5B量化后仅80MB，跑在手机端 (6篇回复)
DeepSeek-V2开源MoE模型实测：推理速度飙升3倍，显存砍半 (3篇回复)
K8s+GPU弹性调度实战：LLM推理成本直降40%的配置详解 (3篇回复)
开源模型选型避坑指南：从Llama3到Qwen2，社区实测数据说话 (1篇回复)
DeepSeek-Coder-V2开源登顶，代码生成模型实测碾压GPT-4 (5篇回复)
LangGraph实战：用有向图构建可控多Agent系统，性能提升40% (12篇回复)
实测DeepSeek 2.5：性价比炸裂，长上下文推理完胜GPT-4 Turbo？ (0篇回复)
Stable Diffusion 3.5发布：架构大改，8B模型生成质量碾压DALL-E 3？ (1篇回复)
CosyVoice 2语音合成再进化：零样本克隆+实时推理延迟低于200ms (7篇回复)
DeepMind最新研究：用“思维拓扑”代替Chain-of-Thought，Prompt工程进入新阶段 (1篇回复)
vLLM 0.6 + Triton 实测：LLM推理吞吐提升3倍，显存省一半 (0篇回复)
多模态大模型新进展：LLaVA-NeXT-Interleave如何实现混合模态推理？ (0篇回复)
Qwen2.5-72B跑分实测：指令遵循飙升40%，单卡RTX 4090就能跑 (0篇回复)
多模态大模型进阶：Fuyu-8B开源，架构颠覆但效果存疑 (1篇回复)
开源模型选型指南：LLaMA 3、Mistral、Qwen 2谁更香？手把手算性价比 (1篇回复)

页: [1] 2 3 4 5 6 7 8 9 10

查看完整版本: 模型社区