日期:2023年7月26日
稳定AI团队宣布,正式推出SDXL 1.0开放模型,这是文本生成图像模型进化的最新版本。在SDXL 0.9仅限研究用途发布后,全面升级了SDXL,并将其打造成全球最优秀的开放式图像生成模型。
【SDXL 1.0:稳定AI的最佳图像模型】
SDXL 1.0是稳定AI的旗舰图像模型,也是目前最佳的开放式图像生成模型。通过与其他模型进行对比测试,得出结论:人们更喜欢SDXL 1.0生成的图像。这是通过Discord社区和外部测试数周的偏好数据得出的研究结果。
【创造具有挑战性概念和多样风格的优质艺术作品】
SDXL可以生成几乎任何艺术风格的高质量图像,尤其擅长写实风格。无论何种风格,SDXL 1.0都能生成独特的图像,保证创作者的绝对自由。SDXL 1.0特别优化了鲜艳准确的色彩表现,比其前代在对比度、光照和阴影方面表现更出色,并支持本地的1024x1024分辨率。
此外,SDXL 1.0还可以生成传统图像模型难以表现的概念,如复杂的手部和文本,或者空间排列构图等。
【更智能,更简洁的语言输入】
SDXL只需几个简单的词语,就能生成复杂、详细和美观的图像。用户不再需要使用“杰作”等修饰词来获取高质量图像。此外,SDXL还能理解“红场”(著名地点)和“红色正方形”(一种形状)之间的区别。
【迈向更大的开放式图像模型】
SDXL 1.0拥有目前所有开放式图像模型中最大的参数数量,采用了创新的新架构,包括一个拥有35亿参数的基础模型和一个66亿参数的优化模型。
新的模型结构采用混合专家流程进行潜在扩散:首先,基础模型生成带有噪声的潜在特征,然后再由优化模型进一步处理,进行最终的去噪步骤。需要注意的是,基础模型也可以作为一个独立的模块使用。
这一新架构使得图像生成更加稳健,同时不影响速度,也不需要过多的计算资源。SDXL 1.0应该可以在8GB VRAM的消费级GPU或者常见的云服务实例上有效运行。
【更多细调和高级控制】
使用SDXL 1.0,对模型进行自定义数据的微调变得更加容易。可通过定制的LoRAs或检查点实现更少的数据处理。稳定AI团队还在开发下一代任务专用的结构、风格和构图控制,其中T2I / ControlNet将专为SDXL定制。这些功能目前正在进行beta预览,敬请期待细调功能的更新。
【未来影响】
SDXL 1.0的发布标志着文本生成图像技术的重要进步。随着更高质量的图像生成,它将在各种应用场景中发挥重要作用:
- 创意产业:设计师、艺术家和创作者可以使用SDXL 1.0生成更丰富、多样的图像,加速创意产出和内容创作。
- 教育:教育领域可以利用SDXL 1.0生成图像来增强教学材料、图文并茂的展示和辅助教学。
- 营销与广告:SDXL 1.0可以为品牌提供高质量的视觉内容,帮助营销人员更好地传达信息和吸引目标受众。
- 虚拟世界:SDXL 1.0的图像生成能力有望为虚拟现实、增强现实等技术提供更真实、更多样化的视觉内容。
总体而言,SDXL 1.0的发布将推动图像生成技术的进一步发展,为未来的数字化世界带来更多可能性和创新机遇。