标题	版块/圈子	作者	回复/查看	最后发表

实测四大模型256K上下文：Claude写小说稳，GPT-4o开头就“失忆”New	模型社区	wjj123 3 小时前	0680	wjj123 3 小时前
Prompt工程新范式：微软开源自动提示优化框架，让LLM效果翻倍 New	模型社区	wjj123 3 小时前	0820	wjj123 3 小时前
LLM对齐新进展：ICLR 2025 spotlight论文揭示“安全遗忘”可攻击性 New	模型社区	wjj123 3 小时前	0851	wjj123 3 小时前
蒸馏技术新突破：小模型也能吊打老师，四步实操指南 New	模型社区	AD位招租昨天 21:02	01518	AD位招租 3 小时前
Meta Llama 3 实测：400B参数未开源，但8B版训练技巧已让社区沸腾 New	模型社区	AD位招租昨天 21:01	1726	wjj123 3 小时前
Cline v3.0实测：MCP协议让AI编程助手“长出四肢”New	模型社区	AD位招租昨天 21:01	11192	wjj123 3 小时前
DeepSeek开源MoE训练框架，千亿级模型部署成本直降40%New	模型社区	AD位招租昨天 21:01	0923	AD位招租昨天 21:01
Qwen2.5-72B跑分实测：指令遵循飙升40%，单卡RTX 4090就能跑 New	模型社区	liuyanfeng 昨天 15:05	0715	liuyanfeng 3 小时前
实测DeepSeek 2.5：性价比炸裂，长上下文推理完胜GPT-4 Turbo？New	模型社区	liuyanfeng 昨天 15:04	0723	liuyanfeng 昨天 21:00
vLLM 0.6 + Triton 实测：LLM推理吞吐提升3倍，显存省一半 New	模型社区	11111111qq 昨天 15:01	01036	11111111qq 昨天 21:00
Anthropic提出“宪法分类器”：让模型在推理层面拒绝越狱，精度提升14倍 New	模型社区	11111111qq 昨天 15:01	01209	11111111qq 昨天 15:01
LoRA微调新进展：4bit量化下仅需1%显存，效果不输全量微调 New	模型社区	11111111qq 昨天 15:01	21170	AD位招租 3 小时前
DeepSeek-V2开源MoE模型实测：推理速度飙升3倍，显存砍半 New	模型社区	柯南君昨天 09:03	4782	wjj123 3 小时前
三强争霸：Claude 3.5、GPT-4o、Gemini 1.5 Pro实测对比 New	模型社区	柯南君昨天 09:02	1930	11111111qq 昨天 15:00
Stable Diffusion 3.5发布：架构大改，8B模型生成质量碾压DALL-E 3？New	模型社区	heno 昨天 09:01	11008	11111111qq 昨天 21:00
LoRA微调再进化：QLoRA+低比特量化，4bit下性能损失不到1%New	模型社区	heno 昨天 09:01	0770	heno 昨天 09:01
DeepSeek-Coder V2开源，代码生成模型进入“卷精度”时代 New	模型社区	juson 前天 21:04	01065	juson 前天 21:04
三巨头大乱斗：Claude、GPT、Gemini最新实测数据流出 New	模型社区	juson 前天 21:03	0922	juson 昨天 09:01
DeepMind最新研究：用“思维拓扑”代替Chain-of-Thought，Prompt工程进入新阶段 New	模型社区	输给眼泪前天 21:01	11074	heno 3 小时前
开源模型选型指南：LLaMA 3、Mistral、Qwen 2谁更香？手把手算性价比 New	模型社区	输给眼泪前天 21:01	11270	liuyanfeng 3 小时前
实测：Ollama+DeepSeek R1 7B本地部署，推理速度提升30%的配置秘籍 New	模型社区	eqjit 前天 15:02	11241	输给眼泪前天 21:00
DeepSeek-Coder-V2开源：代码生成模型新标杆，性能直逼GPT-4 New	模型社区	eqjit 前天 15:02	21271	柯南君昨天 14:59
DeepSeek发布新研究：动态Prompt压缩技术，生成效率暴涨37%New	模型社区	eqjit 前天 15:01	01215	eqjit 昨天 08:59
今天实测！OpenAI GPT-4o API降价40%，兼容性有坑要避 New	模型社区	eqjit 前天 15:01	01428	eqjit 前天 21:02
K8s+GPU弹性调度实战：LLM推理成本直降40%的配置详解 New	模型社区	kendy 前天 09:02	41027	wjj123 3 小时前
聊聊最近开源模型选型：从Llama 3到Mistral，性能与成本的务实对比 New	模型社区	kendy 前天 09:01	21099	柯南君昨天 14:59
端侧部署小模型新突破：Qwen2.5-0.5B量化后仅80MB，跑在手机端 New	模型社区	kendy 前天 09:01	61266	AD位招租昨天 21:01
多模态大模型新进展：LLaVA-NeXT-Interleave如何实现混合模态推理？ New	模型社区	kendy 前天 09:01	21433	wjj123 3 小时前
Llama-3 8B微调性能翻倍：NeMo Aligner + FP8训练实测 New	模型社区	hec 3 天前	11485	输给眼泪前天 21:00
RAG技术新突破：混合检索+动态上下文压缩，性能飙升35% New	模型社区	hec 3 天前	21322	kendy 前天 09:00
实测vLLM+FP8推理：显存占用直降40%，吞吐翻倍不是梦 New	模型社区	madsoul 3 天前	0982	madsoul 前天 15:00
GPTQ之后，AWQ和Bitsandbytes联手了？聊聊4bit量化最新实测 New	模型社区	madsoul 3 天前	51150	11111111qq 昨天 15:00
实测打脸：大模型上下文窗口，真能用到长文本的少之又少 New	模型社区	抗日救国 3 天前	01279	抗日救国 3 天前
Meta发布Chameleon多模态模型：混合模态统一训练，推理效率提升3倍 New	模型社区	抗日救国 3 天前	21235	kendy 前天 09:00
StarCoder2新版本发布：15B参数在代码生成上吊打同等规模模型 New	模型社区	抗日救国 3 天前	01049	抗日救国 3 天前
本地部署Qwen2.5-72B，8卡3090实测推理速度翻倍，显存优化有坑 New	模型社区	抗日救国 3 天前	01276	抗日救国前天 09:00
开源模型选型避坑指南：从Llama3到Qwen2，社区实测数据说话 New	模型社区	romaton 3 天前	21457	wjj123 3 小时前
多模态大模型进阶：Fuyu-8B开源，架构颠覆但效果存疑 New	模型社区	romaton 3 天前	21801	wjj123 3 小时前
Claude 3.5 vs GPT-4o vs Gemini 1.5：谁在“长上下文”真香？ New	模型社区	romaton 3 天前	01248	romaton 前天 09:00
实测对比：OpenAI、Claude、百度文心大模型API接入延迟与成本 New	模型社区	cfff 4 天前	11229	romaton 3 天前
Cursor 0.45实测：一次对话自动生成完整CRUD，LLM上下文利用率提升3倍 New	模型社区	cfff 4 天前	41680	eqjit 前天 20:59
实测Cursor+Claude 3.5：Agent开发效率翻倍，但别踩这3个坑 New	模型社区	cfff 4 天前	01114	cfff 4 天前
具身智能新突破：Google RT-2-X让机器人学会"举一反三"New	模型社区	zyb4 4 天前	01370	zyb4 4 天前
聊聊语音合成大模型新进展：F5-TTS与CosyVoice 2.0的“实时对抗”New	模型社区	zyb4 4 天前	11849	romaton 3 天前
CosyVoice 2语音合成再进化：零样本克隆+实时推理延迟低于200ms New	模型社区	zyb4 4 天前	71444	AD位招租昨天 21:00
DeepSeek-Coder-V2开源登顶，代码生成模型实测碾压GPT-4 New	模型社区	zyb4 4 天前	51520	AD位招租昨天 21:00
语音合成大模型卷出新高度：MegaTTS 3零样本克隆，5秒声音直出 New	模型社区	lijia5555 4 天前	01246	lijia5555 4 天前
开源模型选型实操：Llama 3 vs Qwen 2，谁更配你的推理卡？New	模型社区	lijia5555 4 天前	01299	lijia5555 4 天前
实测Yuan2.0 vs Baichuan2：国产大模型推理能力全维度对比 New	模型社区	lijia5555 4 天前	21385	cfff 3 天前
开源模型选型避坑指南：从7B到70B的实战经验 New	模型社区	lijia5555 4 天前	21382	cfff 3 天前

模型社区

wjj123 3 小时前

0680

wjj123 3 小时前

Prompt工程新范式：微软开源自动提示优化框架，让LLM效果翻倍 New

模型社区

wjj123 3 小时前

0820

wjj123 3 小时前

LLM对齐新进展：ICLR 2025 spotlight论文揭示“安全遗忘”可攻击性 New

模型社区

wjj123 3 小时前