q_code

扫码关注官方微信

cell_code

扫码下载APP

返回顶部

导读首页

发新帖

最新热门

6人参与 · 端侧部署小模型新突破：Qwen2.5-0.5B量化后仅80MB，跑在手机端 模型社区

3人参与 · DeepSeek-V2开源MoE模型实测：推理速度飙升3倍，显存砍半 模型社区

7人参与 · K8s+GPU弹性调度实战：LLM推理成本直降40%的配置详解 模型社区

9人参与 · 开源模型选型避坑指南：从Llama3到Qwen2，社区实测数据说话 模型社区

12人参与 · DeepSeek-Coder-V2开源登顶，代码生成模型实测碾压GPT-4 模型社区

20人参与 · LangGraph实战：用有向图构建可控多Agent系统，性能提升40% 模型社区

10人参与 · CosyVoice 2语音合成再进化：零样本克隆+实时推理延迟低于200ms 模型社区

3人参与 · Stable Diffusion 3.5发布：架构大改，8B模型生成质量碾压DALL-E 3？ 模型社区

3人参与 · DeepMind最新研究：用“思维拓扑”代替Chain-of-Thought，Prompt工程进入新阶段 模型社区

5人参与 · 多模态大模型新进展：LLaVA-NeXT-Interleave如何实现混合模态推理？ 模型社区

11人参与 · 多模态大模型进阶：Fuyu-8B开源，架构颠覆但效果存疑 模型社区

3人参与 · 开源模型选型指南：LLaMA 3、Mistral、Qwen 2谁更香？手把手算性价比 模型社区

7人参与 · GPTQ之后，AWQ和Bitsandbytes联手了？聊聊4bit量化最新实测 模型社区

4人参与 · DeepSeek-Coder-V2开源：代码生成模型新标杆，性能直逼GPT-4 模型社区

5人参与 · 聊聊最近开源模型选型：从Llama 3到Mistral，性能与成本的务实对比 模型社区

3人参与 · DeepSeek发布新研究：动态Prompt压缩技术，生成效率暴涨37% 模型社区

3人参与 · Llama-3 8B微调性能翻倍：NeMo Aligner + FP8训练实测 模型社区

6人参与 · Cursor 0.45实测：一次对话自动生成完整CRUD，LLM上下文利用率提升3倍 模型社区

10人参与 · 多模态大模型新突破：LLaVA-NeXT-Interleave实现视频实时理解 模型社区

4人参与 · Meta发布Chameleon多模态模型：混合模态统一训练，推理效率提升3倍 模型社区

6人参与 · GPT-4o Prompt优化实战：用三层指令框架将推理准确率提升18% 模型社区

3人参与 · 本地部署Qwen2.5-72B，8卡3090实测推理速度翻倍，显存优化有坑 模型社区

4人参与 · Claude 3.5 vs GPT-4o vs Gemini 1.5：谁在“长上下文”真香？ 模型社区

9人参与 · 128K上下文全用满？实测Claude/GPT-4/Kimi的“有效记忆”有多长 模型社区

9人参与 · 三大模型对决：Claude 3.5 vs GPT-4o vs Gemini 2.0，谁才是代码王者？ 模型社区

6人参与 · 开源模型选型避坑指南：从7B到70B的实战经验 模型社区

5人参与 · 三大模型实测对比：Claude 3.5、GPT-4o、Gemini 1.5谁更香？ 模型社区

3人参与 · 实测Yuan2.0 vs Baichuan2：国产大模型推理能力全维度对比 模型社区

3人参与 · 聊聊语音合成大模型新进展：F5-TTS与CosyVoice 2.0的“实时对抗” 模型社区

8人参与 · 大模型量化新突破：4-bit推理成本直降50%，精度仅损1.2% 模型社区

最新精华

暂时还没有帖子

最新回复

昨天 21:02 · 蒸馏技术新突破：小模型也能吊打老师，四步实操指南 模型社区

昨天 21:01 · Meta Llama 3 实测：400B参数未开源，但8B版训练技巧已让社区沸腾 模型社区

昨天 21:01 · Cline v3.0实测：MCP协议让AI编程助手“长出四肢” 模型社区

昨天 21:01 · LoRA微调新进展：4bit量化下仅需1%显存，效果不输全量微调 模型社区

昨天 21:01 · DeepSeek开源MoE训练框架，千亿级模型部署成本直降40% 模型社区

昨天 21:01 · 端侧部署小模型新突破：Qwen2.5-0.5B量化后仅80MB，跑在手机端 模型社区

昨天 21:01 · DeepSeek-V2开源MoE模型实测：推理速度飙升3倍，显存砍半 模型社区

昨天 21:00 · K8s+GPU弹性调度实战：LLM推理成本直降40%的配置详解 模型社区

昨天 21:00 · 开源模型选型避坑指南：从Llama3到Qwen2，社区实测数据说话 模型社区

昨天 21:00 · DeepSeek-Coder-V2开源登顶，代码生成模型实测碾压GPT-4 模型社区

昨天 21:00 · LangGraph实战：用有向图构建可控多Agent系统，性能提升40% 模型社区

昨天 21:00 · 实测DeepSeek 2.5：性价比炸裂，长上下文推理完胜GPT-4 Turbo？ 模型社区

昨天 21:00 · Stable Diffusion 3.5发布：架构大改，8B模型生成质量碾压DALL-E 3？ 模型社区

昨天 21:00 · CosyVoice 2语音合成再进化：零样本克隆+实时推理延迟低于200ms 模型社区

昨天 21:00 · DeepMind最新研究：用“思维拓扑”代替Chain-of-Thought，Prompt工程进入新阶段 模型社区

昨天 21:00 · vLLM 0.6 + Triton 实测：LLM推理吞吐提升3倍，显存省一半 模型社区

昨天 20:59 · 多模态大模型新进展：LLaVA-NeXT-Interleave如何实现混合模态推理？ 模型社区

昨天 20:59 · Qwen2.5-72B跑分实测：指令遵循飙升40%，单卡RTX 4090就能跑 模型社区

昨天 20:59 · 多模态大模型进阶：Fuyu-8B开源，架构颠覆但效果存疑 模型社区

昨天 15:04 · 开源模型选型指南：LLaMA 3、Mistral、Qwen 2谁更香？手把手算性价比 模型社区

昨天 15:01 · Anthropic提出“宪法分类器”：让模型在推理层面拒绝越狱，精度提升14倍 模型社区

昨天 15:00 · GPTQ之后，AWQ和Bitsandbytes联手了？聊聊4bit量化最新实测 模型社区

昨天 15:00 · 三强争霸：Claude 3.5、GPT-4o、Gemini 1.5 Pro实测对比 模型社区

昨天 14:59 · DeepSeek-Coder-V2开源：代码生成模型新标杆，性能直逼GPT-4 模型社区

昨天 14:59 · 聊聊最近开源模型选型：从Llama 3到Mistral，性能与成本的务实对比 模型社区

昨天 09:01 · 三巨头大乱斗：Claude、GPT、Gemini最新实测数据流出 模型社区

昨天 09:01 · LoRA微调再进化：QLoRA+低比特量化，4bit下性能损失不到1% 模型社区

昨天 08:59 · DeepSeek发布新研究：动态Prompt压缩技术，生成效率暴涨37% 模型社区

前天 21:04 · DeepSeek-Coder V2开源，代码生成模型进入“卷精度”时代 模型社区

前天 21:02 · 今天实测！OpenAI GPT-4o API降价40%，兼容性有坑要避 模型社区

最新发表

· 蒸馏技术新突破：小模型也能吊打老师，四步实操指南 模型社区

· Meta Llama 3 实测：400B参数未开源，但8B版训练技巧已让社区沸腾 模型社区

· Cline v3.0实测：MCP协议让AI编程助手“长出四肢” 模型社区

· DeepSeek开源MoE训练框架，千亿级模型部署成本直降40% 模型社区

· Qwen2.5-72B跑分实测：指令遵循飙升40%，单卡RTX 4090就能跑 模型社区

· 实测DeepSeek 2.5：性价比炸裂，长上下文推理完胜GPT-4 Turbo？ 模型社区

· vLLM 0.6 + Triton 实测：LLM推理吞吐提升3倍，显存省一半 模型社区

· Anthropic提出“宪法分类器”：让模型在推理层面拒绝越狱，精度提升14倍 模型社区

· LoRA微调新进展：4bit量化下仅需1%显存，效果不输全量微调 模型社区

· DeepSeek-V2开源MoE模型实测：推理速度飙升3倍，显存砍半 模型社区

· 三强争霸：Claude 3.5、GPT-4o、Gemini 1.5 Pro实测对比 模型社区

· Stable Diffusion 3.5发布：架构大改，8B模型生成质量碾压DALL-E 3？ 模型社区

· LoRA微调再进化：QLoRA+低比特量化，4bit下性能损失不到1% 模型社区

· DeepSeek-Coder V2开源，代码生成模型进入“卷精度”时代 模型社区

· 三巨头大乱斗：Claude、GPT、Gemini最新实测数据流出 模型社区

· DeepMind最新研究：用“思维拓扑”代替Chain-of-Thought，Prompt工程进入新阶段 模型社区

· 开源模型选型指南：LLaMA 3、Mistral、Qwen 2谁更香？手把手算性价比 模型社区

· 实测：Ollama+DeepSeek R1 7B本地部署，推理速度提升30%的配置秘籍 模型社区

· DeepSeek-Coder-V2开源：代码生成模型新标杆，性能直逼GPT-4 模型社区

· DeepSeek发布新研究：动态Prompt压缩技术，生成效率暴涨37% 模型社区

· 今天实测！OpenAI GPT-4o API降价40%，兼容性有坑要避 模型社区

· K8s+GPU弹性调度实战：LLM推理成本直降40%的配置详解 模型社区

· 聊聊最近开源模型选型：从Llama 3到Mistral，性能与成本的务实对比 模型社区

· 端侧部署小模型新突破：Qwen2.5-0.5B量化后仅80MB，跑在手机端 模型社区

· 多模态大模型新进展：LLaVA-NeXT-Interleave如何实现混合模态推理？ 模型社区

· Llama-3 8B微调性能翻倍：NeMo Aligner + FP8训练实测 模型社区

· RAG技术新突破：混合检索+动态上下文压缩，性能飙升35% 模型社区

· 实测vLLM+FP8推理：显存占用直降40%，吞吐翻倍不是梦 模型社区

· GPTQ之后，AWQ和Bitsandbytes联手了？聊聊4bit量化最新实测 模型社区

· 实测打脸：大模型上下文窗口，真能用到长文本的少之又少 模型社区

闲社论坛
关于我们会员介绍开通会员羊毛论坛
闲社论坛
羊毛交流论坛线报讨论社区优惠分享交流线报更新服务
网站服务
会员咨询：515151560 广告合作：515151570 投诉建议：515151580 售后指导：515151590

多链集团旗下-闲社网

闲社网热线

免费联系电话

0527-80111111

服务时间：周一到周日 8:00-24:00

公众号
闲社闲社线报社区

关注闲社网

闲社在线客服
关注闲社网微信
闲社网APP

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0 © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large

返回顶部