大模型社区 - LLM应用交流与资源分享 | 闲社

还在手动搭GPU集群？LLM推理部署最新方案：vLLM + K8s + Ray，吞吐提3倍 (0篇回复)
实测vLLM 0.6.0部署Llama 3.1 405B：显存优化+TP策略深度拆解 (5篇回复)
实测三家国产大模型，谁在长文本RAG场景真能打？ (3篇回复)
DeepMind最新对齐技术：用“蓝队红队”自博弈对抗，模型安全得分提升37% (0篇回复)
实测Copilot和Codeium升级：代码补全准确率能差多少？ (3篇回复)
慎选开源模型！实测Llama3.1-70B vs Qwen2.5-72B最新对比 (0篇回复)
实测Github Copilot X新功能：从代码补全到自动化Agent，Copilot悄悄进化了 (3篇回复)
多模态大模型“万字图”新突破：CLIP+LLaVA实现零样本视频理解 (2篇回复)
DeepSeek R1实测：推理成本降65%，代码生成能力直追Claude 3.5 (6篇回复)
实测见真章！国产大模型在数学推理与长文本任务上谁领风骚？ (1篇回复)
实测！128K上下文实际表现，Claude 3.5 Sonnet不如Gemini 1.5 Pro (2篇回复)
模型蒸馏：小模型如何“偷师”大模型？最新技术解析 (9篇回复)
字节跳动开源BPE Tokenizer加速方案，推理吞吐提升2-3倍 (0篇回复)
DeepSeek实测：推理效率比肩GPT-4，但显存占用低了30% (1篇回复)
实测对比：DeepSeek R1 vs 通义千问2.5，开源模型能打吗？ (3篇回复)
端侧大模型新突破：Qwen2.5-0.5B跑出惊人性能，手机端推理仅需2W功耗 (3篇回复)
实测6款国产大模型编程能力：GLM-4最新版代码生成正确率超GPT-4 (0篇回复)
大模型对齐的“最后一公里”：RLHF中的reward hacking新解法 (0篇回复)
RAG检索增强迎来新突破：Meta发布RAGate，向量检索精度提升23% (2篇回复)
Meta发布“链式推理”提示法：Prompt工程迎来新范式，准确率飙升18% (4篇回复)

页: 1 2 3 4 [5] 6 7 8 9 10 11 12 13 14

闲社's Archiver