返回顶部

导读首页

发新帖
更多 »

最新热门

  • 6人参与 · 端侧部署小模型新突破:Qwen2.5-0.5B量化后仅80MB,跑在手机端 模型社区
  • 3人参与 · DeepSeek-V2开源MoE模型实测:推理速度飙升3倍,显存砍半 模型社区
  • 7人参与 · K8s+GPU弹性调度实战:LLM推理成本直降40%的配置详解 模型社区
  • 9人参与 · 开源模型选型避坑指南:从Llama3到Qwen2,社区实测数据说话 模型社区
  • 12人参与 · DeepSeek-Coder-V2开源登顶,代码生成模型实测碾压GPT-4 模型社区
  • 20人参与 · LangGraph实战:用有向图构建可控多Agent系统,性能提升40% 模型社区
  • 10人参与 · CosyVoice 2语音合成再进化:零样本克隆+实时推理延迟低于200ms 模型社区
  • 3人参与 · Stable Diffusion 3.5发布:架构大改,8B模型生成质量碾压DALL-E 3? 模型社区
  • 3人参与 · DeepMind最新研究:用“思维拓扑”代替Chain-of-Thought,Prompt工程进入新阶段 模型社区
  • 5人参与 · 多模态大模型新进展:LLaVA-NeXT-Interleave如何实现混合模态推理? 模型社区
  • 11人参与 · 多模态大模型进阶:Fuyu-8B开源,架构颠覆但效果存疑 模型社区
  • 3人参与 · 开源模型选型指南:LLaMA 3、Mistral、Qwen 2谁更香?手把手算性价比 模型社区
  • 7人参与 · GPTQ之后,AWQ和Bitsandbytes联手了?聊聊4bit量化最新实测 模型社区
  • 4人参与 · DeepSeek-Coder-V2开源:代码生成模型新标杆,性能直逼GPT-4 模型社区
  • 5人参与 · 聊聊最近开源模型选型:从Llama 3到Mistral,性能与成本的务实对比 模型社区
  • 3人参与 · DeepSeek发布新研究:动态Prompt压缩技术,生成效率暴涨37% 模型社区
  • 3人参与 · Llama-3 8B微调性能翻倍:NeMo Aligner + FP8训练实测 模型社区
  • 6人参与 · Cursor 0.45实测:一次对话自动生成完整CRUD,LLM上下文利用率提升3倍 模型社区
  • 10人参与 · 多模态大模型新突破:LLaVA-NeXT-Interleave实现视频实时理解 模型社区
  • 4人参与 · Meta发布Chameleon多模态模型:混合模态统一训练,推理效率提升3倍 模型社区
  • 6人参与 · GPT-4o Prompt优化实战:用三层指令框架将推理准确率提升18% 模型社区
  • 3人参与 · 本地部署Qwen2.5-72B,8卡3090实测推理速度翻倍,显存优化有坑 模型社区
  • 4人参与 · Claude 3.5 vs GPT-4o vs Gemini 1.5:谁在“长上下文”真香? 模型社区
  • 9人参与 · 128K上下文全用满?实测Claude/GPT-4/Kimi的“有效记忆”有多长 模型社区
  • 9人参与 · 三大模型对决:Claude 3.5 vs GPT-4o vs Gemini 2.0,谁才是代码王者? 模型社区
  • 6人参与 · 开源模型选型避坑指南:从7B到70B的实战经验 模型社区
  • 5人参与 · 三大模型实测对比:Claude 3.5、GPT-4o、Gemini 1.5谁更香? 模型社区
  • 3人参与 · 实测Yuan2.0 vs Baichuan2:国产大模型推理能力全维度对比 模型社区
  • 3人参与 · 聊聊语音合成大模型新进展:F5-TTS与CosyVoice 2.0的“实时对抗” 模型社区
  • 8人参与 · 大模型量化新突破:4-bit推理成本直降50%,精度仅损1.2% 模型社区
  • 更多 »

    最新精华

    暂时还没有帖子

    更多 »

    最新回复

  • 昨天 21:02 · 蒸馏技术新突破:小模型也能吊打老师,四步实操指南 模型社区
  • 昨天 21:01 · Meta Llama 3 实测:400B参数未开源,但8B版训练技巧已让社区沸腾 模型社区
  • 昨天 21:01 · Cline v3.0实测:MCP协议让AI编程助手“长出四肢” 模型社区
  • 昨天 21:01 · LoRA微调新进展:4bit量化下仅需1%显存,效果不输全量微调 模型社区
  • 昨天 21:01 · DeepSeek开源MoE训练框架,千亿级模型部署成本直降40% 模型社区
  • 昨天 21:01 · 端侧部署小模型新突破:Qwen2.5-0.5B量化后仅80MB,跑在手机端 模型社区
  • 昨天 21:01 · DeepSeek-V2开源MoE模型实测:推理速度飙升3倍,显存砍半 模型社区
  • 昨天 21:00 · K8s+GPU弹性调度实战:LLM推理成本直降40%的配置详解 模型社区
  • 昨天 21:00 · 开源模型选型避坑指南:从Llama3到Qwen2,社区实测数据说话 模型社区
  • 昨天 21:00 · DeepSeek-Coder-V2开源登顶,代码生成模型实测碾压GPT-4 模型社区
  • 昨天 21:00 · LangGraph实战:用有向图构建可控多Agent系统,性能提升40% 模型社区
  • 昨天 21:00 · 实测DeepSeek 2.5:性价比炸裂,长上下文推理完胜GPT-4 Turbo? 模型社区
  • 昨天 21:00 · Stable Diffusion 3.5发布:架构大改,8B模型生成质量碾压DALL-E 3? 模型社区
  • 昨天 21:00 · CosyVoice 2语音合成再进化:零样本克隆+实时推理延迟低于200ms 模型社区
  • 昨天 21:00 · DeepMind最新研究:用“思维拓扑”代替Chain-of-Thought,Prompt工程进入新阶段 模型社区
  • 昨天 21:00 · vLLM 0.6 + Triton 实测:LLM推理吞吐提升3倍,显存省一半 模型社区
  • 昨天 20:59 · 多模态大模型新进展:LLaVA-NeXT-Interleave如何实现混合模态推理? 模型社区
  • 昨天 20:59 · Qwen2.5-72B跑分实测:指令遵循飙升40%,单卡RTX 4090就能跑 模型社区
  • 昨天 20:59 · 多模态大模型进阶:Fuyu-8B开源,架构颠覆但效果存疑 模型社区
  • 昨天 15:04 · 开源模型选型指南:LLaMA 3、Mistral、Qwen 2谁更香?手把手算性价比 模型社区
  • 昨天 15:01 · Anthropic提出“宪法分类器”:让模型在推理层面拒绝越狱,精度提升14倍 模型社区
  • 昨天 15:00 · GPTQ之后,AWQ和Bitsandbytes联手了?聊聊4bit量化最新实测 模型社区
  • 昨天 15:00 · 三强争霸:Claude 3.5、GPT-4o、Gemini 1.5 Pro实测对比 模型社区
  • 昨天 14:59 · DeepSeek-Coder-V2开源:代码生成模型新标杆,性能直逼GPT-4 模型社区
  • 昨天 14:59 · 聊聊最近开源模型选型:从Llama 3到Mistral,性能与成本的务实对比 模型社区
  • 昨天 09:01 · 三巨头大乱斗:Claude、GPT、Gemini最新实测数据流出 模型社区
  • 昨天 09:01 · LoRA微调再进化:QLoRA+低比特量化,4bit下性能损失不到1% 模型社区
  • 昨天 08:59 · DeepSeek发布新研究:动态Prompt压缩技术,生成效率暴涨37% 模型社区
  • 前天 21:04 · DeepSeek-Coder V2开源,代码生成模型进入“卷精度”时代 模型社区
  • 前天 21:02 · 今天实测!OpenAI GPT-4o API降价40%,兼容性有坑要避 模型社区
  • 更多 »

    最新发表

  • · 蒸馏技术新突破:小模型也能吊打老师,四步实操指南 模型社区
  • · Meta Llama 3 实测:400B参数未开源,但8B版训练技巧已让社区沸腾 模型社区
  • · Cline v3.0实测:MCP协议让AI编程助手“长出四肢” 模型社区
  • · DeepSeek开源MoE训练框架,千亿级模型部署成本直降40% 模型社区
  • · Qwen2.5-72B跑分实测:指令遵循飙升40%,单卡RTX 4090就能跑 模型社区
  • · 实测DeepSeek 2.5:性价比炸裂,长上下文推理完胜GPT-4 Turbo? 模型社区
  • · vLLM 0.6 + Triton 实测:LLM推理吞吐提升3倍,显存省一半 模型社区
  • · Anthropic提出“宪法分类器”:让模型在推理层面拒绝越狱,精度提升14倍 模型社区
  • · LoRA微调新进展:4bit量化下仅需1%显存,效果不输全量微调 模型社区
  • · DeepSeek-V2开源MoE模型实测:推理速度飙升3倍,显存砍半 模型社区
  • · 三强争霸:Claude 3.5、GPT-4o、Gemini 1.5 Pro实测对比 模型社区
  • · Stable Diffusion 3.5发布:架构大改,8B模型生成质量碾压DALL-E 3? 模型社区
  • · LoRA微调再进化:QLoRA+低比特量化,4bit下性能损失不到1% 模型社区
  • · DeepSeek-Coder V2开源,代码生成模型进入“卷精度”时代 模型社区
  • · 三巨头大乱斗:Claude、GPT、Gemini最新实测数据流出 模型社区
  • · DeepMind最新研究:用“思维拓扑”代替Chain-of-Thought,Prompt工程进入新阶段 模型社区
  • · 开源模型选型指南:LLaMA 3、Mistral、Qwen 2谁更香?手把手算性价比 模型社区
  • · 实测:Ollama+DeepSeek R1 7B本地部署,推理速度提升30%的配置秘籍 模型社区
  • · DeepSeek-Coder-V2开源:代码生成模型新标杆,性能直逼GPT-4 模型社区
  • · DeepSeek发布新研究:动态Prompt压缩技术,生成效率暴涨37% 模型社区
  • · 今天实测!OpenAI GPT-4o API降价40%,兼容性有坑要避 模型社区
  • · K8s+GPU弹性调度实战:LLM推理成本直降40%的配置详解 模型社区
  • · 聊聊最近开源模型选型:从Llama 3到Mistral,性能与成本的务实对比 模型社区
  • · 端侧部署小模型新突破:Qwen2.5-0.5B量化后仅80MB,跑在手机端 模型社区
  • · 多模态大模型新进展:LLaVA-NeXT-Interleave如何实现混合模态推理? 模型社区
  • · Llama-3 8B微调性能翻倍:NeMo Aligner + FP8训练实测 模型社区
  • · RAG技术新突破:混合检索+动态上下文压缩,性能飙升35% 模型社区
  • · 实测vLLM+FP8推理:显存占用直降40%,吞吐翻倍不是梦 模型社区
  • · GPTQ之后,AWQ和Bitsandbytes联手了?聊聊4bit量化最新实测 模型社区
  • · 实测打脸:大模型上下文窗口,真能用到长文本的少之又少 模型社区
  • Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

    Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

    p2p_official_large
    返回顶部