返回顶部

最新回复

发新帖
标题 版块/圈子 作者 回复/查看 最后发表
大模型对齐的“最后一公里”:RLHF中的reward hacking新解法 模型社区 霸王 2026-6-2 01647 霸王 2026-6-2 09:01
RAG检索增强迎来新突破:Meta发布RAGate,向量检索精度提升23% 模型社区 winlmh 2026-6-1 22039 霸王 2026-6-2 09:01
Meta发布“链式推理”提示法:Prompt工程迎来新范式,准确率飙升18%新人帖 模型社区 shuzx 2026-5-30 42602 霸王 2026-6-2 09:01
Stable Diffusion 3.5发布!Turbo模式让生图速度翻倍,细节实测对比来了新人帖 模型社区 霸王 2026-6-2 02041 霸王 2026-6-2 09:01
DeepSeek实测一周:推理强、速度稳,但中文长文本仍有短板新人帖 模型社区 winlmh 2026-6-1 31880 霸王 2026-6-2 09:00
实测GPTQ vs AWQ vs GGUF:量化方法选型避坑指南新人帖 模型社区 yhoo 2026-5-28 52489 xoyohome 2026-6-2 09:00
【上手指南】CrewAI 快速入门 新手指南 kexiangtt 2026-6-2 02354 kexiangtt 2026-6-2 09:00
【使用指南】OpenClaw:最强全能AI助理平台 新手指南 kexiangtt 2026-5-22 33752 kexiangtt 2026-6-2 08:59
模型蒸馏实操:LLaMA-3 蒸馏到 1/10 参数,推理速度翻倍还保精度? 模型社区 小子伊人 2026-6-1 02127 小子伊人 2026-6-2 08:59
Meta发布Voicebox:语音合成大模型首次实现“零样本”声音克隆新人帖 模型社区 SL163.net 2026-5-31 42116 小子伊人 2026-6-1 21:01
端侧部署小型模型,Llama 3.2 3B遇上手机芯片,推理速度提升2倍 模型社区 winlmh 2026-6-1 22141 小子伊人 2026-6-1 21:01
DeepSeek实测:MQA+MoE架构下,128K长文本推理有多稳?新人帖 模型社区 mv110.com 2026-5-29 52255 winlmh 2026-6-1 21:00
Claude 3.5、GPT-4o、Gemini 2.0实测对决:谁在长上下文任务中更稳? 模型社区 xoyohome 2026-6-1 12099 winlmh 2026-6-1 21:00
实测DeepSeek:编程推理超预期,但长文理解仍需优化 模型社区 xoyohome 2026-6-1 02285 xoyohome 2026-6-1 15:00
LoRA微调大模型:性价比之王还是“偷懒”陷阱?聊聊我踩过的坑新人帖 模型社区 xgq6688 2026-5-31 01723 xgq6688 2026-6-1 15:00
开源模型选型避坑:从Llama 3到Mistral,实测数据告诉你哪个更适合落地新人帖 模型社区 xoyohome 2026-6-1 01866 xoyohome 2026-6-1 09:01
深度解析DeepSeek-Coder-V2:代码生成模型的开源新标杆 模型社区 itmans 2026-5-30 12515 xoyohome 2026-6-1 09:00
LLM推理提速2-5倍,DeepSeek-V2的MLA与MQA实测对比 模型社区 ll448 2026-5-31 11973 xoyohome 2026-6-1 09:00
【使用指南】CrewAI:多智能体协作框架 新手指南 kexiangtt 2026-6-1 02377 kexiangtt 2026-6-1 09:00
RLHF后门揭秘:最新研究揭示奖励模型20%数据可被污染 模型社区 xgq6688 2026-5-31 02121 xgq6688 2026-6-1 09:00
推荐几个好用的在线工具 新手指南 kjxxzy 2026-5-12 43392 kexiangtt 2026-6-1 08:59
推荐几个不错的开源项目 新手指南 jiangyonghao 2026-5-12 33937 kexiangtt 2026-6-1 08:59
Claude 3.5 vs GPT-4o vs Gemini 2.0:编码实测对比,谁更稳?新人帖 模型社区 ll448 2026-5-31 31965 xgq6688 2026-5-31 21:00
实测国产大模型:昆仑万维Skywork-13B,中文理解力意外能打 模型社区 aiwoai 2026-5-29 42211 xgq6688 2026-5-31 21:00
三强争霸实测:Claude 3.5 vs GPT-4o vs Gemini 1.5 Pro,谁才是代码王者? 模型社区 yhoo 2026-5-28 72798 xgq6688 2026-5-31 21:00
开源模型选型避坑指南:从Llama3到Qwen2,性能实测数据来了 模型社区 ll448 2026-5-31 22069 SL163.net 2026-5-31 21:00
动态批处理+投机解码:LLM推理吞吐提升3倍的落地实践 模型社区 ll448 2026-5-31 01904 ll448 2026-5-31 15:02
大模型API接入避坑指南:延迟、成本与分片策略实战 模型社区 flyinblueskys 2026-5-31 01712 flyinblueskys 2026-5-31 15:01
实测国内三款大模型编码能力:谁更适合做你的副驾驶?新人帖 模型社区 chjhua 2026-5-29 62239 ll448 2026-5-31 14:59
DeepMind开源新对齐框架:用“过程奖励”精准拒绝有害指令,效果提升40% 模型社区 至尊育 2026-5-28 32420 ll448 2026-5-31 09:00
【设置教程】NanoClaw 设置详解 新手指南 kexiangtt 2026-5-31 02511 kexiangtt 2026-5-31 09:00
【上手指南】n8n 快速入门 新手指南 kexiangtt 2026-5-24 33006 kexiangtt 2026-5-31 08:59
DeepSeek-R1开源满血版实测:数学推理超越GPT-4,32B模型长上下文新突破 模型社区 yhoo 2026-5-28 52594 shuzx 2026-5-31 08:59
ChatTTS开源炸场:语音合成大模型迎来零样本时代 模型社区 itmans 2026-5-30 02085 itmans 2026-5-30 21:01
DeepSeek最新论文曝光稀疏MoE训练黑科技,推理成本降60% 模型社区 wea530 2026-5-25 82669 itmans 2026-5-30 21:01
Stable Diffusion 3.5发布:MMDiT架构+16通道VAE,生成细节炸裂 模型社区 shuzx 2026-5-30 02021 shuzx 2026-5-30 21:00
实测国内6款大模型代码能力:GLM-4、Qwen2.5谁更强? 模型社区 shuzx 2026-5-30 01825 shuzx 2026-5-30 21:00
DeepSeek-R1蒸馏实战:小模型也能玩转强推理 模型社区 至尊育 2026-5-28 22518 shuzx 2026-5-30 15:01
从“玩具”到“工具”:一个真实客服场景下的大模型落地细节拆解 模型社区 至尊育 2026-5-28 32351 shuzx 2026-5-30 15:00
LangGraph实战:用状态机模式让Agent记住10轮对话上下文新人帖 模型社区 aiwoai 2026-5-29 22263 shuzx 2026-5-30 15:00
开源模型选型指南:从Llama 3到Qwen 2,实测性能与成本权衡 模型社区 xmmp 2026-5-30 01921 xmmp 2026-5-30 15:00
Gemini 2.0实测:多模态推理+代码生成,这波有点东西新人帖 模型社区 Michael1985 2026-5-26 42617 chjhua 2026-5-30 15:00
Claude 3.5 vs GPT-4o vs Gemini 2.0:最新实测谁更扛打?新人帖 模型社区 xmmp 2026-5-30 01769 xmmp 2026-5-30 09:01
【设置教程】Open Interpreter 设置详解 新手指南 kexiangtt 2026-5-30 02818 kexiangtt 2026-5-30 09:00
【更新公告】Quivr 新版本发布! 新手指南 kexiangtt 2026-5-28 12958 kexiangtt 2026-5-30 08:59
DeepSeek开源MLA破局:推理显存砍半,长上下文不再是梦 模型社区 bolodr 2026-5-27 52211 aiwoai 2026-5-30 08:59
开源模型选型指南:Qwen2.5 vs Llama 3.1 vs Mistral,实测数据告诉你选哪个新人帖 模型社区 t602 2026-5-29 22092 aiwoai 2026-5-29 21:00
4bit量化又进化?GPTQ+AWQ融合方案实测效果惊人新人帖 模型社区 yyc821 2026-5-28 12544 t602 2026-5-29 21:00
具身智能新进展:RT-2模型实现机器人“看-想-动”闭环 模型社区 chjhua 2026-5-29 12073 t602 2026-5-29 21:00
Cursor v2.0实测:LLM嵌入代码补全,推理速度提升3倍新人帖 模型社区 楚帆 2026-5-29 02082 楚帆 2026-5-29 15:07

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部