返回顶部

最新发表

发新帖
标题 版块/圈子 作者 回复/查看 最后发表
实测四大模型256K上下文:Claude写小说稳,GPT-4o开头就“失忆”New 模型社区 wjj123 3 小时前 0680 wjj123 3 小时前
Prompt工程新范式:微软开源自动提示优化框架,让LLM效果翻倍New 模型社区 wjj123 3 小时前 0820 wjj123 3 小时前
LLM对齐新进展:ICLR 2025 spotlight论文揭示“安全遗忘”可攻击性New 模型社区 wjj123 3 小时前 0851 wjj123 3 小时前
蒸馏技术新突破:小模型也能吊打老师,四步实操指南New 模型社区 AD位招租 昨天 21:02 01518 AD位招租 3 小时前
Meta Llama 3 实测:400B参数未开源,但8B版训练技巧已让社区沸腾New 模型社区 AD位招租 昨天 21:01 1726 wjj123 3 小时前
Cline v3.0实测:MCP协议让AI编程助手“长出四肢”New 模型社区 AD位招租 昨天 21:01 11192 wjj123 3 小时前
DeepSeek开源MoE训练框架,千亿级模型部署成本直降40%New 模型社区 AD位招租 昨天 21:01 0923 AD位招租 昨天 21:01
Qwen2.5-72B跑分实测:指令遵循飙升40%,单卡RTX 4090就能跑New 模型社区 liuyanfeng 昨天 15:05 0715 liuyanfeng 3 小时前
实测DeepSeek 2.5:性价比炸裂,长上下文推理完胜GPT-4 Turbo?New 模型社区 liuyanfeng 昨天 15:04 0723 liuyanfeng 昨天 21:00
vLLM 0.6 + Triton 实测:LLM推理吞吐提升3倍,显存省一半New 模型社区 11111111qq 昨天 15:01 01036 11111111qq 昨天 21:00
Anthropic提出“宪法分类器”:让模型在推理层面拒绝越狱,精度提升14倍New 模型社区 11111111qq 昨天 15:01 01209 11111111qq 昨天 15:01
LoRA微调新进展:4bit量化下仅需1%显存,效果不输全量微调New 模型社区 11111111qq 昨天 15:01 21170 AD位招租 3 小时前
DeepSeek-V2开源MoE模型实测:推理速度飙升3倍,显存砍半New 模型社区 柯南君 昨天 09:03 4782 wjj123 3 小时前
三强争霸:Claude 3.5、GPT-4o、Gemini 1.5 Pro实测对比New 模型社区 柯南君 昨天 09:02 1930 11111111qq 昨天 15:00
Stable Diffusion 3.5发布:架构大改,8B模型生成质量碾压DALL-E 3?New 模型社区 heno 昨天 09:01 11008 11111111qq 昨天 21:00
LoRA微调再进化:QLoRA+低比特量化,4bit下性能损失不到1%New 模型社区 heno 昨天 09:01 0770 heno 昨天 09:01
DeepSeek-Coder V2开源,代码生成模型进入“卷精度”时代New 模型社区 juson 前天 21:04 01065 juson 前天 21:04
三巨头大乱斗:Claude、GPT、Gemini最新实测数据流出New 模型社区 juson 前天 21:03 0922 juson 昨天 09:01
DeepMind最新研究:用“思维拓扑”代替Chain-of-Thought,Prompt工程进入新阶段New 模型社区 输给眼泪 前天 21:01 11074 heno 3 小时前
开源模型选型指南:LLaMA 3、Mistral、Qwen 2谁更香?手把手算性价比新人帖 New 模型社区 输给眼泪 前天 21:01 11270 liuyanfeng 3 小时前
实测:Ollama+DeepSeek R1 7B本地部署,推理速度提升30%的配置秘籍New 模型社区 eqjit 前天 15:02 11241 输给眼泪 前天 21:00
DeepSeek-Coder-V2开源:代码生成模型新标杆,性能直逼GPT-4New 模型社区 eqjit 前天 15:02 21271 柯南君 昨天 14:59
DeepSeek发布新研究:动态Prompt压缩技术,生成效率暴涨37%New 模型社区 eqjit 前天 15:01 01215 eqjit 昨天 08:59
今天实测!OpenAI GPT-4o API降价40%,兼容性有坑要避新人帖 New 模型社区 eqjit 前天 15:01 01428 eqjit 前天 21:02
K8s+GPU弹性调度实战:LLM推理成本直降40%的配置详解New 模型社区 kendy 前天 09:02 41027 wjj123 3 小时前
聊聊最近开源模型选型:从Llama 3到Mistral,性能与成本的务实对比New 模型社区 kendy 前天 09:01 21099 柯南君 昨天 14:59
端侧部署小模型新突破:Qwen2.5-0.5B量化后仅80MB,跑在手机端New 模型社区 kendy 前天 09:01 61266 AD位招租 昨天 21:01
多模态大模型新进展:LLaVA-NeXT-Interleave如何实现混合模态推理?新人帖 New 模型社区 kendy 前天 09:01 21433 wjj123 3 小时前
Llama-3 8B微调性能翻倍:NeMo Aligner + FP8训练实测New 模型社区 hec 3 天前 11485 输给眼泪 前天 21:00
RAG技术新突破:混合检索+动态上下文压缩,性能飙升35%新人帖 New 模型社区 hec 3 天前 21322 kendy 前天 09:00
实测vLLM+FP8推理:显存占用直降40%,吞吐翻倍不是梦New 模型社区 madsoul 3 天前 0982 madsoul 前天 15:00
GPTQ之后,AWQ和Bitsandbytes联手了?聊聊4bit量化最新实测新人帖 New 模型社区 madsoul 3 天前 51150 11111111qq 昨天 15:00
实测打脸:大模型上下文窗口,真能用到长文本的少之又少New 模型社区 抗日救国 3 天前 01279 抗日救国 3 天前
Meta发布Chameleon多模态模型:混合模态统一训练,推理效率提升3倍New 模型社区 抗日救国 3 天前 21235 kendy 前天 09:00
StarCoder2新版本发布:15B参数在代码生成上吊打同等规模模型New 模型社区 抗日救国 3 天前 01049 抗日救国 3 天前
本地部署Qwen2.5-72B,8卡3090实测推理速度翻倍,显存优化有坑新人帖 New 模型社区 抗日救国 3 天前 01276 抗日救国 前天 09:00
开源模型选型避坑指南:从Llama3到Qwen2,社区实测数据说话New 模型社区 romaton 3 天前 21457 wjj123 3 小时前
多模态大模型进阶:Fuyu-8B开源,架构颠覆但效果存疑New 模型社区 romaton 3 天前 21801 wjj123 3 小时前
Claude 3.5 vs GPT-4o vs Gemini 1.5:谁在“长上下文”真香?新人帖 New 模型社区 romaton 3 天前 01248 romaton 前天 09:00
实测对比:OpenAI、Claude、百度文心大模型API接入延迟与成本New 模型社区 cfff 4 天前 11229 romaton 3 天前
Cursor 0.45实测:一次对话自动生成完整CRUD,LLM上下文利用率提升3倍New 模型社区 cfff 4 天前 41680 eqjit 前天 20:59
实测Cursor+Claude 3.5:Agent开发效率翻倍,但别踩这3个坑新人帖 New 模型社区 cfff 4 天前 01114 cfff 4 天前
具身智能新突破:Google RT-2-X让机器人学会"举一反三"New 模型社区 zyb4 4 天前 01370 zyb4 4 天前
聊聊语音合成大模型新进展:F5-TTS与CosyVoice 2.0的“实时对抗”New 模型社区 zyb4 4 天前 11849 romaton 3 天前
CosyVoice 2语音合成再进化:零样本克隆+实时推理延迟低于200msNew 模型社区 zyb4 4 天前 71444 AD位招租 昨天 21:00
DeepSeek-Coder-V2开源登顶,代码生成模型实测碾压GPT-4新人帖 New 模型社区 zyb4 4 天前 51520 AD位招租 昨天 21:00
语音合成大模型卷出新高度:MegaTTS 3零样本克隆,5秒声音直出New 模型社区 lijia5555 4 天前 01246 lijia5555 4 天前
开源模型选型实操:Llama 3 vs Qwen 2,谁更配你的推理卡?New 模型社区 lijia5555 4 天前 01299 lijia5555 4 天前
实测Yuan2.0 vs Baichuan2:国产大模型推理能力全维度对比New 模型社区 lijia5555 4 天前 21385 cfff 3 天前
开源模型选型避坑指南:从7B到70B的实战经验新人帖 New 模型社区 lijia5555 4 天前 21382 cfff 3 天前

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部