大模型社区 - LLM应用交流与资源分享 | 闲社 - Powered by Discuz! Archiver

论坛 › 模型社区

实测四大模型256K上下文：Claude写小说稳，GPT-4o开头就“失忆” (0篇回复)
Prompt工程新范式：微软开源自动提示优化框架，让LLM效果翻倍 (0篇回复)
多模态大模型新进展：LLaVA-NeXT-Interleave如何实现混合模态推理？ (2篇回复)
DeepSeek-V2开源MoE模型实测：推理速度飙升3倍，显存砍半 (4篇回复)
Meta Llama 3 实测：400B参数未开源，但8B版训练技巧已让社区沸腾 (1篇回复)
多模态大模型进阶：Fuyu-8B开源，架构颠覆但效果存疑 (2篇回复)
LLM对齐新进展：ICLR 2025 spotlight论文揭示“安全遗忘”可攻击性 (0篇回复)
Qwen2.5-72B跑分实测：指令遵循飙升40%，单卡RTX 4090就能跑 (0篇回复)
开源模型选型避坑指南：从Llama3到Qwen2，社区实测数据说话 (2篇回复)
K8s+GPU弹性调度实战：LLM推理成本直降40%的配置详解 (4篇回复)
Cline v3.0实测：MCP协议让AI编程助手“长出四肢” (1篇回复)
开源模型选型指南：LLaMA 3、Mistral、Qwen 2谁更香？手把手算性价比 (1篇回复)
蒸馏技术新突破：小模型也能吊打老师，四步实操指南 (0篇回复)
LoRA微调新进展：4bit量化下仅需1%显存，效果不输全量微调 (2篇回复)
DeepMind最新研究：用“思维拓扑”代替Chain-of-Thought，Prompt工程进入新阶段 (1篇回复)
DeepSeek开源MoE训练框架，千亿级模型部署成本直降40% (0篇回复)
端侧部署小模型新突破：Qwen2.5-0.5B量化后仅80MB，跑在手机端 (6篇回复)
DeepSeek-Coder-V2开源登顶，代码生成模型实测碾压GPT-4 (5篇回复)
LangGraph实战：用有向图构建可控多Agent系统，性能提升40% (12篇回复)
实测DeepSeek 2.5：性价比炸裂，长上下文推理完胜GPT-4 Turbo？ (0篇回复)

页: [1] 2 3 4 5 6 7 8 9 10

查看完整版本: 模型社区