导读-抢沙发闲社

标题	版块/圈子	作者	回复/查看	最后发表

蒸馏技术新突破：小模型也能吊打老师，四步实操指南 New	模型社区	AD位招租昨天 21:02	01429	AD位招租昨天 21:02
Meta Llama 3 实测：400B参数未开源，但8B版训练技巧已让社区沸腾 New	模型社区	AD位招租昨天 21:01	0675	AD位招租昨天 21:01
Cline v3.0实测：MCP协议让AI编程助手“长出四肢”New	模型社区	AD位招租昨天 21:01	01150	AD位招租昨天 21:01
DeepSeek开源MoE训练框架，千亿级模型部署成本直降40%New	模型社区	AD位招租昨天 21:01	0877	AD位招租昨天 21:01
Qwen2.5-72B跑分实测：指令遵循飙升40%，单卡RTX 4090就能跑 New	模型社区	liuyanfeng 昨天 15:05	0666	liuyanfeng 昨天 20:59
实测DeepSeek 2.5：性价比炸裂，长上下文推理完胜GPT-4 Turbo？New	模型社区	liuyanfeng 昨天 15:04	0688	liuyanfeng 昨天 21:00
vLLM 0.6 + Triton 实测：LLM推理吞吐提升3倍，显存省一半 New	模型社区	11111111qq 昨天 15:01	0994	11111111qq 昨天 21:00
Anthropic提出“宪法分类器”：让模型在推理层面拒绝越狱，精度提升14倍 New	模型社区	11111111qq 昨天 15:01	01172	11111111qq 昨天 15:01
LoRA微调再进化：QLoRA+低比特量化，4bit下性能损失不到1%New	模型社区	heno 昨天 09:01	0751	heno 昨天 09:01
DeepSeek-Coder V2开源，代码生成模型进入“卷精度”时代 New	模型社区	juson 前天 21:04	01029	juson 前天 21:04
三巨头大乱斗：Claude、GPT、Gemini最新实测数据流出 New	模型社区	juson 前天 21:03	0890	juson 昨天 09:01
DeepSeek发布新研究：动态Prompt压缩技术，生成效率暴涨37%New	模型社区	eqjit 前天 15:01	01170	eqjit 昨天 08:59
今天实测！OpenAI GPT-4o API降价40%，兼容性有坑要避 New	模型社区	eqjit 前天 15:01	01394	eqjit 前天 21:02
多模态大模型新进展：LLaVA-NeXT-Interleave如何实现混合模态推理？ New	模型社区	kendy 前天 09:01	01402	kendy 昨天 20:59
实测vLLM+FP8推理：显存占用直降40%，吞吐翻倍不是梦 New	模型社区	madsoul 3 天前	0936	madsoul 前天 15:00
实测打脸：大模型上下文窗口，真能用到长文本的少之又少 New	模型社区	抗日救国 3 天前	01237	抗日救国 3 天前
StarCoder2新版本发布：15B参数在代码生成上吊打同等规模模型 New	模型社区	抗日救国 3 天前	01013	抗日救国 3 天前
本地部署Qwen2.5-72B，8卡3090实测推理速度翻倍，显存优化有坑 New	模型社区	抗日救国 3 天前	01254	抗日救国前天 09:00
Claude 3.5 vs GPT-4o vs Gemini 1.5：谁在“长上下文”真香？ New	模型社区	romaton 3 天前	01215	romaton 前天 09:00
实测Cursor+Claude 3.5：Agent开发效率翻倍，但别踩这3个坑 New	模型社区	cfff 4 天前	01065	cfff 4 天前
具身智能新突破：Google RT-2-X让机器人学会"举一反三"New	模型社区	zyb4 4 天前	01331	zyb4 4 天前
语音合成大模型卷出新高度：MegaTTS 3零样本克隆，5秒声音直出 New	模型社区	lijia5555 4 天前	01204	lijia5555 4 天前
开源模型选型实操：Llama 3 vs Qwen 2，谁更配你的推理卡？New	模型社区	lijia5555 4 天前	01252	lijia5555 4 天前
Prompt工程新进展：Meta发布Chain-of-Thought 2.0，推理性能飙升35% New	模型社区	土耳其王子 5 天前	01247	土耳其王子 5 天前
DeepSeek新推MLA注意力，LLM推理吞吐提升2倍，内存占用降40%New	模型社区	gaogaodong 6 天前	01599	gaogaodong 5 天前
本地部署大模型新突破：Qwen2.5-14B-1M上下文，10G显存跑出流畅体验 New	模型社区	gaogaodong 6 天前	01519	gaogaodong 6 天前
还在手动搭GPU集群？LLM推理部署最新方案：vLLM + K8s + Ray，吞吐提3倍 New	模型社区	cndent 7 天前	01688	cndent 6 天前
DeepMind最新对齐技术：用“蓝队红队”自博弈对抗，模型安全得分提升37% New	模型社区	asd128 7 天前	01943	asd128 7 天前
慎选开源模型！实测Llama3.1-70B vs Qwen2.5-72B最新对比 New	模型社区	luanfeng 7 天前	01997	luanfeng 7 天前
【注意事项】Dify 安全使用须知 New	新手指南	kexiangtt 7 天前	01953	kexiangtt 7 天前
字节跳动开源BPE Tokenizer加速方案，推理吞吐提升2-3倍	模型社区	okman 2026-6-2	01642	okman 7 天前
大模型对齐的“最后一公里”：RLHF中的reward hacking新解法	模型社区	霸王 2026-6-2	01647	霸王 2026-6-2 09:01
Stable Diffusion 3.5发布！Turbo模式让生图速度翻倍，细节实测对比来了	模型社区	霸王 2026-6-2	02041	霸王 2026-6-2 09:01
【上手指南】CrewAI 快速入门	新手指南	kexiangtt 2026-6-2	02371	kexiangtt 2026-6-2 09:00
实测6款国产大模型编程能力：GLM-4最新版代码生成正确率超GPT-4	模型社区	小子伊人 2026-6-1	01760	小子伊人 2026-6-2 20:59
模型蒸馏实操：LLaMA-3 蒸馏到 1/10 参数，推理速度翻倍还保精度？	模型社区	小子伊人 2026-6-1	02127	小子伊人 2026-6-2 08:59
实测DeepSeek：编程推理超预期，但长文理解仍需优化	模型社区	xoyohome 2026-6-1	02285	xoyohome 2026-6-1 15:00
开源模型选型避坑：从Llama 3到Mistral，实测数据告诉你哪个更适合落地	模型社区	xoyohome 2026-6-1	01866	xoyohome 2026-6-1 09:01
【使用指南】CrewAI：多智能体协作框架	新手指南	kexiangtt 2026-6-1	02394	kexiangtt 2026-6-1 09:00
RLHF后门揭秘：最新研究揭示奖励模型20%数据可被污染	模型社区	xgq6688 2026-5-31	02121	xgq6688 2026-6-1 09:00
LoRA微调大模型：性价比之王还是“偷懒”陷阱？聊聊我踩过的坑	模型社区	xgq6688 2026-5-31	01723	xgq6688 2026-6-1 15:00
大模型API接入避坑指南：延迟、成本与分片策略实战	模型社区	flyinblueskys 2026-5-31	01712	flyinblueskys 2026-5-31 15:01
动态批处理+投机解码：LLM推理吞吐提升3倍的落地实践	模型社区	ll448 2026-5-31	01904	ll448 2026-5-31 15:02
【设置教程】NanoClaw 设置详解	新手指南	kexiangtt 2026-5-31	02517	kexiangtt 2026-5-31 09:00
ChatTTS开源炸场：语音合成大模型迎来零样本时代	模型社区	itmans 2026-5-30	02085	itmans 2026-5-30 21:01
实测国内6款大模型代码能力：GLM-4、Qwen2.5谁更强？	模型社区	shuzx 2026-5-30	01825	shuzx 2026-5-30 21:00
Stable Diffusion 3.5发布：MMDiT架构+16通道VAE，生成细节炸裂	模型社区	shuzx 2026-5-30	02021	shuzx 2026-5-30 21:00
开源模型选型指南：从Llama 3到Qwen 2，实测性能与成本权衡	模型社区	xmmp 2026-5-30	01921	xmmp 2026-5-30 15:00
Claude 3.5 vs GPT-4o vs Gemini 2.0：最新实测谁更扛打？	模型社区	xmmp 2026-5-30	01769	xmmp 2026-5-30 09:01
【设置教程】Open Interpreter 设置详解	新手指南	kexiangtt 2026-5-30	02827	kexiangtt 2026-5-30 09:00

蒸馏技术新突破：小模型也能吊打老师，四步实操指南 New

模型社区

AD位招租 昨天 21:02

01429

AD位招租 昨天 21:02

Meta Llama 3 实测：400B参数未开源，但8B版训练技巧已让社区沸腾 New

模型社区

AD位招租 昨天 21:01

0675

AD位招租 昨天 21:01

Cline v3.0实测：MCP协议让AI编程助手“长出四肢”New

模型社区