返回顶部

抢沙发

发新帖
标题 版块/圈子 作者 回复/查看 最后发表
蒸馏技术新突破:小模型也能吊打老师,四步实操指南New 模型社区 AD位招租 昨天 21:02 01429 AD位招租 昨天 21:02
Meta Llama 3 实测:400B参数未开源,但8B版训练技巧已让社区沸腾New 模型社区 AD位招租 昨天 21:01 0675 AD位招租 昨天 21:01
Cline v3.0实测:MCP协议让AI编程助手“长出四肢”New 模型社区 AD位招租 昨天 21:01 01150 AD位招租 昨天 21:01
DeepSeek开源MoE训练框架,千亿级模型部署成本直降40%New 模型社区 AD位招租 昨天 21:01 0877 AD位招租 昨天 21:01
Qwen2.5-72B跑分实测:指令遵循飙升40%,单卡RTX 4090就能跑New 模型社区 liuyanfeng 昨天 15:05 0666 liuyanfeng 昨天 20:59
实测DeepSeek 2.5:性价比炸裂,长上下文推理完胜GPT-4 Turbo?New 模型社区 liuyanfeng 昨天 15:04 0688 liuyanfeng 昨天 21:00
vLLM 0.6 + Triton 实测:LLM推理吞吐提升3倍,显存省一半New 模型社区 11111111qq 昨天 15:01 0994 11111111qq 昨天 21:00
Anthropic提出“宪法分类器”:让模型在推理层面拒绝越狱,精度提升14倍New 模型社区 11111111qq 昨天 15:01 01172 11111111qq 昨天 15:01
LoRA微调再进化:QLoRA+低比特量化,4bit下性能损失不到1%New 模型社区 heno 昨天 09:01 0751 heno 昨天 09:01
DeepSeek-Coder V2开源,代码生成模型进入“卷精度”时代New 模型社区 juson 前天 21:04 01029 juson 前天 21:04
三巨头大乱斗:Claude、GPT、Gemini最新实测数据流出New 模型社区 juson 前天 21:03 0890 juson 昨天 09:01
DeepSeek发布新研究:动态Prompt压缩技术,生成效率暴涨37%New 模型社区 eqjit 前天 15:01 01170 eqjit 昨天 08:59
今天实测!OpenAI GPT-4o API降价40%,兼容性有坑要避新人帖 New 模型社区 eqjit 前天 15:01 01394 eqjit 前天 21:02
多模态大模型新进展:LLaVA-NeXT-Interleave如何实现混合模态推理?新人帖 New 模型社区 kendy 前天 09:01 01402 kendy 昨天 20:59
实测vLLM+FP8推理:显存占用直降40%,吞吐翻倍不是梦New 模型社区 madsoul 3 天前 0936 madsoul 前天 15:00
实测打脸:大模型上下文窗口,真能用到长文本的少之又少New 模型社区 抗日救国 3 天前 01237 抗日救国 3 天前
StarCoder2新版本发布:15B参数在代码生成上吊打同等规模模型New 模型社区 抗日救国 3 天前 01013 抗日救国 3 天前
本地部署Qwen2.5-72B,8卡3090实测推理速度翻倍,显存优化有坑新人帖 New 模型社区 抗日救国 3 天前 01254 抗日救国 前天 09:00
Claude 3.5 vs GPT-4o vs Gemini 1.5:谁在“长上下文”真香?新人帖 New 模型社区 romaton 3 天前 01215 romaton 前天 09:00
实测Cursor+Claude 3.5:Agent开发效率翻倍,但别踩这3个坑新人帖 New 模型社区 cfff 4 天前 01065 cfff 4 天前
具身智能新突破:Google RT-2-X让机器人学会"举一反三"New 模型社区 zyb4 4 天前 01331 zyb4 4 天前
语音合成大模型卷出新高度:MegaTTS 3零样本克隆,5秒声音直出New 模型社区 lijia5555 4 天前 01204 lijia5555 4 天前
开源模型选型实操:Llama 3 vs Qwen 2,谁更配你的推理卡?New 模型社区 lijia5555 4 天前 01252 lijia5555 4 天前
Prompt工程新进展:Meta发布Chain-of-Thought 2.0,推理性能飙升35%新人帖 New 模型社区 土耳其王子 5 天前 01247 土耳其王子 5 天前
DeepSeek新推MLA注意力,LLM推理吞吐提升2倍,内存占用降40%New 模型社区 gaogaodong 6 天前 01599 gaogaodong 5 天前
本地部署大模型新突破:Qwen2.5-14B-1M上下文,10G显存跑出流畅体验新人帖 New 模型社区 gaogaodong 6 天前 01519 gaogaodong 6 天前
还在手动搭GPU集群?LLM推理部署最新方案:vLLM + K8s + Ray,吞吐提3倍New 模型社区 cndent 7 天前 01688 cndent 6 天前
DeepMind最新对齐技术:用“蓝队红队”自博弈对抗,模型安全得分提升37%新人帖 New 模型社区 asd128 7 天前 01943 asd128 7 天前
慎选开源模型!实测Llama3.1-70B vs Qwen2.5-72B最新对比New 模型社区 luanfeng 7 天前 01997 luanfeng 7 天前
【注意事项】Dify 安全使用须知New 新手指南 kexiangtt 7 天前 01953 kexiangtt 7 天前
字节跳动开源BPE Tokenizer加速方案,推理吞吐提升2-3倍 模型社区 okman 2026-6-2 01642 okman 7 天前
大模型对齐的“最后一公里”:RLHF中的reward hacking新解法 模型社区 霸王 2026-6-2 01647 霸王 2026-6-2 09:01
Stable Diffusion 3.5发布!Turbo模式让生图速度翻倍,细节实测对比来了新人帖 模型社区 霸王 2026-6-2 02041 霸王 2026-6-2 09:01
【上手指南】CrewAI 快速入门 新手指南 kexiangtt 2026-6-2 02371 kexiangtt 2026-6-2 09:00
实测6款国产大模型编程能力:GLM-4最新版代码生成正确率超GPT-4 模型社区 小子伊人 2026-6-1 01760 小子伊人 2026-6-2 20:59
模型蒸馏实操:LLaMA-3 蒸馏到 1/10 参数,推理速度翻倍还保精度? 模型社区 小子伊人 2026-6-1 02127 小子伊人 2026-6-2 08:59
实测DeepSeek:编程推理超预期,但长文理解仍需优化 模型社区 xoyohome 2026-6-1 02285 xoyohome 2026-6-1 15:00
开源模型选型避坑:从Llama 3到Mistral,实测数据告诉你哪个更适合落地新人帖 模型社区 xoyohome 2026-6-1 01866 xoyohome 2026-6-1 09:01
【使用指南】CrewAI:多智能体协作框架 新手指南 kexiangtt 2026-6-1 02394 kexiangtt 2026-6-1 09:00
RLHF后门揭秘:最新研究揭示奖励模型20%数据可被污染 模型社区 xgq6688 2026-5-31 02121 xgq6688 2026-6-1 09:00
LoRA微调大模型:性价比之王还是“偷懒”陷阱?聊聊我踩过的坑新人帖 模型社区 xgq6688 2026-5-31 01723 xgq6688 2026-6-1 15:00
大模型API接入避坑指南:延迟、成本与分片策略实战 模型社区 flyinblueskys 2026-5-31 01712 flyinblueskys 2026-5-31 15:01
动态批处理+投机解码:LLM推理吞吐提升3倍的落地实践 模型社区 ll448 2026-5-31 01904 ll448 2026-5-31 15:02
【设置教程】NanoClaw 设置详解 新手指南 kexiangtt 2026-5-31 02517 kexiangtt 2026-5-31 09:00
ChatTTS开源炸场:语音合成大模型迎来零样本时代 模型社区 itmans 2026-5-30 02085 itmans 2026-5-30 21:01
实测国内6款大模型代码能力:GLM-4、Qwen2.5谁更强? 模型社区 shuzx 2026-5-30 01825 shuzx 2026-5-30 21:00
Stable Diffusion 3.5发布:MMDiT架构+16通道VAE,生成细节炸裂 模型社区 shuzx 2026-5-30 02021 shuzx 2026-5-30 21:00
开源模型选型指南:从Llama 3到Qwen 2,实测性能与成本权衡 模型社区 xmmp 2026-5-30 01921 xmmp 2026-5-30 15:00
Claude 3.5 vs GPT-4o vs Gemini 2.0:最新实测谁更扛打?新人帖 模型社区 xmmp 2026-5-30 01769 xmmp 2026-5-30 09:01
【设置教程】Open Interpreter 设置详解 新手指南 kexiangtt 2026-5-30 02827 kexiangtt 2026-5-30 09:00

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部