Stable diffusion 3 正式开源:超强文生图模型SD3-M登场

Stable diffusion 3 正式开源:超强文生图模型SD3-M登场

体验视频:

Stable Diffusion3(简称 SD3)是一款强大的文生图模型,拥有20亿参数,以其高效的推理速度和优秀的生成效果备受瞩目。6月12日晚,知名开源大模型平台 Stability AI 正式开源了 SD3-M 权重,为广大用户带来了免费试用的机会。(试玩视频放在文章上面了!)Stable diffusion 3 正式开源:超强文生图模型SD3-M登场

SD3-M 在平均生成图片时间上极具优势,仅需2—10秒左右,同时对硬件的需求也相对较低,适用于 PC、手机、平板等多种设备。此外,SD3-M 还与英伟达、AMD 合作进行了特定硬件的优化,针对 RTX GPU、TensorRT、最新 CPU 以及 MI-300X 进行了优化,性能最高可提升50%。

该模型采用了多模态扩散变换器(MMDiT)架构,在图片质量、排版、复杂文本提示 / 语义理解和资源效率等方面均取得了极大的提升。SD3-M 使用了包含10亿张图片的公开和合成数据进行了预训练,并针对特定艺术风格和领域,使用了3000万张图片进行微调以及300万张偏好图片,使其对用户的文本提示理解和嵌入图片文字的效果更为优秀。

通过在线 demo 展示,SD3-M 生成效果惊艳非凡。从高耸的摩天大楼到宁静的海滩景色,从热带雨林到20世纪50年代的老式餐厅,SD3-M 展现出了出色的图像生成能力。免费在线试用也为用户提供了无限的探索可能。

需要注意的是,目前 SD3-M 仅用于学术研究,无法进行商业化应用。如有商业需求,用户需要联系 Stability AI 进行商业授权。

SD3-M的开源,用户可以免费试用这一超强的文生图模型,探索其在不同领域的应用潜力。希望这一举措能够为人工智能领域的发展带来更多的可能性和机遇。

试玩地址:https://huggingface.co/spaces/stabilityai/stable-diffusion-3-mediumStable diffusion 3 正式开源:超强文生图模型SD3-M登场
© 版权声明

相关文章

分享