导读-最新回复闲社

标题	版块/圈子	作者	回复/查看	最后发表

大模型对齐的“最后一公里”：RLHF中的reward hacking新解法	模型社区	霸王 2026-6-2	01647	霸王 2026-6-2 09:01
RAG检索增强迎来新突破：Meta发布RAGate，向量检索精度提升23%	模型社区	winlmh 2026-6-1	22039	霸王 2026-6-2 09:01
Meta发布“链式推理”提示法：Prompt工程迎来新范式，准确率飙升18%	模型社区	shuzx 2026-5-30	42602	霸王 2026-6-2 09:01
Stable Diffusion 3.5发布！Turbo模式让生图速度翻倍，细节实测对比来了	模型社区	霸王 2026-6-2	02041	霸王 2026-6-2 09:01
DeepSeek实测一周：推理强、速度稳，但中文长文本仍有短板	模型社区	winlmh 2026-6-1	31880	霸王 2026-6-2 09:00
实测GPTQ vs AWQ vs GGUF：量化方法选型避坑指南	模型社区	yhoo 2026-5-28	52489	xoyohome 2026-6-2 09:00
【上手指南】CrewAI 快速入门	新手指南	kexiangtt 2026-6-2	02354	kexiangtt 2026-6-2 09:00
【使用指南】OpenClaw：最强全能AI助理平台	新手指南	kexiangtt 2026-5-22	33752	kexiangtt 2026-6-2 08:59
模型蒸馏实操：LLaMA-3 蒸馏到 1/10 参数，推理速度翻倍还保精度？	模型社区	小子伊人 2026-6-1	02127	小子伊人 2026-6-2 08:59
Meta发布Voicebox：语音合成大模型首次实现“零样本”声音克隆	模型社区	SL163.net 2026-5-31	42116	小子伊人 2026-6-1 21:01
端侧部署小型模型，Llama 3.2 3B遇上手机芯片，推理速度提升2倍	模型社区	winlmh 2026-6-1	22141	小子伊人 2026-6-1 21:01
DeepSeek实测：MQA+MoE架构下，128K长文本推理有多稳？	模型社区	mv110.com 2026-5-29	52255	winlmh 2026-6-1 21:00
Claude 3.5、GPT-4o、Gemini 2.0实测对决：谁在长上下文任务中更稳？	模型社区	xoyohome 2026-6-1	12099	winlmh 2026-6-1 21:00
实测DeepSeek：编程推理超预期，但长文理解仍需优化	模型社区	xoyohome 2026-6-1	02285	xoyohome 2026-6-1 15:00
LoRA微调大模型：性价比之王还是“偷懒”陷阱？聊聊我踩过的坑	模型社区	xgq6688 2026-5-31	01723	xgq6688 2026-6-1 15:00
开源模型选型避坑：从Llama 3到Mistral，实测数据告诉你哪个更适合落地	模型社区	xoyohome 2026-6-1	01866	xoyohome 2026-6-1 09:01
深度解析DeepSeek-Coder-V2：代码生成模型的开源新标杆	模型社区	itmans 2026-5-30	12515	xoyohome 2026-6-1 09:00
LLM推理提速2-5倍，DeepSeek-V2的MLA与MQA实测对比	模型社区	ll448 2026-5-31	11973	xoyohome 2026-6-1 09:00
【使用指南】CrewAI：多智能体协作框架	新手指南	kexiangtt 2026-6-1	02377	kexiangtt 2026-6-1 09:00
RLHF后门揭秘：最新研究揭示奖励模型20%数据可被污染	模型社区	xgq6688 2026-5-31	02121	xgq6688 2026-6-1 09:00
推荐几个好用的在线工具	新手指南	kjxxzy 2026-5-12	43392	kexiangtt 2026-6-1 08:59
推荐几个不错的开源项目	新手指南	jiangyonghao 2026-5-12	33937	kexiangtt 2026-6-1 08:59
Claude 3.5 vs GPT-4o vs Gemini 2.0：编码实测对比，谁更稳？	模型社区	ll448 2026-5-31	31965	xgq6688 2026-5-31 21:00
实测国产大模型：昆仑万维Skywork-13B，中文理解力意外能打	模型社区	aiwoai 2026-5-29	42211	xgq6688 2026-5-31 21:00
三强争霸实测：Claude 3.5 vs GPT-4o vs Gemini 1.5 Pro，谁才是代码王者？	模型社区	yhoo 2026-5-28	72798	xgq6688 2026-5-31 21:00
开源模型选型避坑指南：从Llama3到Qwen2，性能实测数据来了	模型社区	ll448 2026-5-31	22069	SL163.net 2026-5-31 21:00
动态批处理+投机解码：LLM推理吞吐提升3倍的落地实践	模型社区	ll448 2026-5-31	01904	ll448 2026-5-31 15:02
大模型API接入避坑指南：延迟、成本与分片策略实战	模型社区	flyinblueskys 2026-5-31	01712	flyinblueskys 2026-5-31 15:01
实测国内三款大模型编码能力：谁更适合做你的副驾驶？	模型社区	chjhua 2026-5-29	62239	ll448 2026-5-31 14:59
DeepMind开源新对齐框架：用“过程奖励”精准拒绝有害指令，效果提升40%	模型社区	至尊育 2026-5-28	32420	ll448 2026-5-31 09:00
【设置教程】NanoClaw 设置详解	新手指南	kexiangtt 2026-5-31	02511	kexiangtt 2026-5-31 09:00
【上手指南】n8n 快速入门	新手指南	kexiangtt 2026-5-24	33006	kexiangtt 2026-5-31 08:59
DeepSeek-R1开源满血版实测：数学推理超越GPT-4，32B模型长上下文新突破	模型社区	yhoo 2026-5-28	52594	shuzx 2026-5-31 08:59
ChatTTS开源炸场：语音合成大模型迎来零样本时代	模型社区	itmans 2026-5-30	02085	itmans 2026-5-30 21:01
DeepSeek最新论文曝光稀疏MoE训练黑科技，推理成本降60%	模型社区	wea530 2026-5-25	82669	itmans 2026-5-30 21:01
Stable Diffusion 3.5发布：MMDiT架构+16通道VAE，生成细节炸裂	模型社区	shuzx 2026-5-30	02021	shuzx 2026-5-30 21:00
实测国内6款大模型代码能力：GLM-4、Qwen2.5谁更强？	模型社区	shuzx 2026-5-30	01825	shuzx 2026-5-30 21:00
DeepSeek-R1蒸馏实战：小模型也能玩转强推理	模型社区	至尊育 2026-5-28	22518	shuzx 2026-5-30 15:01
从“玩具”到“工具”：一个真实客服场景下的大模型落地细节拆解	模型社区	至尊育 2026-5-28	32351	shuzx 2026-5-30 15:00
LangGraph实战：用状态机模式让Agent记住10轮对话上下文	模型社区	aiwoai 2026-5-29	22263	shuzx 2026-5-30 15:00
开源模型选型指南：从Llama 3到Qwen 2，实测性能与成本权衡	模型社区	xmmp 2026-5-30	01921	xmmp 2026-5-30 15:00
Gemini 2.0实测：多模态推理+代码生成，这波有点东西	模型社区	Michael1985 2026-5-26	42617	chjhua 2026-5-30 15:00
Claude 3.5 vs GPT-4o vs Gemini 2.0：最新实测谁更扛打？	模型社区	xmmp 2026-5-30	01769	xmmp 2026-5-30 09:01
【设置教程】Open Interpreter 设置详解	新手指南	kexiangtt 2026-5-30	02818	kexiangtt 2026-5-30 09:00
【更新公告】Quivr 新版本发布！	新手指南	kexiangtt 2026-5-28	12958	kexiangtt 2026-5-30 08:59
DeepSeek开源MLA破局：推理显存砍半，长上下文不再是梦	模型社区	bolodr 2026-5-27	52211	aiwoai 2026-5-30 08:59
开源模型选型指南：Qwen2.5 vs Llama 3.1 vs Mistral，实测数据告诉你选哪个	模型社区	t602 2026-5-29	22092	aiwoai 2026-5-29 21:00
4bit量化又进化？GPTQ+AWQ融合方案实测效果惊人	模型社区	yyc821 2026-5-28	12544	t602 2026-5-29 21:00
具身智能新进展：RT-2模型实现机器人“看-想-动”闭环	模型社区	chjhua 2026-5-29	12073	t602 2026-5-29 21:00
Cursor v2.0实测：LLM嵌入代码补全，推理速度提升3倍	模型社区	楚帆 2026-5-29	02082	楚帆 2026-5-29 15:07

大模型对齐的“最后一公里”：RLHF中的reward hacking新解法

模型社区

霸王 2026-6-2

01647

霸王 2026-6-2 09:01

RAG检索增强迎来新突破：Meta发布RAGate，向量检索精度提升23%

模型社区

winlmh 2026-6-1

22039

霸王 2026-6-2 09:01

Meta发布“链式推理”提示法：Prompt工程迎来新范式，准确率飙升18% 新人帖