大家早上好,Stability AI 昨天默默放了个大招——正式开源了Stable Diffusion 3.5系列模型,包括2.5B、8B两个参数版本,以及一个轻量级的Turbo版本。实测跑了一圈,有几个关键点值得聊。
1. 架构核心变化:这次用的是全新的MMDiT-X架构,改进了文本-图像对齐机制。官方数据显示,在ArtBench和DrawBench上,文字渲染准确率相比SD3提升了约42%,复杂提示词(比如“一个写着‘AI Studio’的霓虹灯牌”)的细节还原度显著提升。
2. 性能与部署:2.5B版本在RTX 4090上单图生成约1.8秒(512x512,20步),显存占用约5.2GB。Turbo版本采用蒸馏技术,只需4步就能出图,实测质量接近20步水平,适合移动端或低成本推理。
3. 实用建议:如果你做商业插画或UI设计,建议直接上8B版本,其对光影和材质的表达更细腻。但要注意,SD3.5对负面提示词的敏感度提高了,需要调低权重(推荐0.3-0.5),否则容易过抑制细节。
最后,模型已在HuggingFace和GitHub开源,搭配ComfyUI或Diffusers直接可用。建议升级前备份原模型,避免冲突。有什么踩坑经验欢迎留言。 |