简介
稳定扩散是一种先进的人工智能技术,用于生成高质量的图像。它开始于一个带有噪声的原始图像,然后通过一系列步骤逐渐清晰化。想象一下,这就像是从一块粗糙的大理石开始,经过细致雕刻,最终呈现出精美的雕塑。
采样器概述
采样器是稳定扩散中一个关键组件,它负责从模型中选取图像,并逐步去除噪声,使图像清晰。这就像是一步步雕刻和打磨大理石。其中,“采样器”决定了我们如何操作,而“噪声调度器”则决定我们去除多少噪声。
以下测试图像是使用以下参数生成的:
- Checkpoint: .
dreamshaper_631BakedVae.safetensors
- Positive prompt: .
ultra realistic 8k cg, picture-perfect black sports car, desert wasteland road, car drifting, tires churns up the dry earth beneath creating a magnificent sand dust cloud that billows outwards, nuclear mushroom cloud in the background far away, sunset, masterpiece, professional artwork, ultra high resolution, cinematic lighting, cinematic bloom, natural light
- Negative prompt: .
paintings, cartoon, anime, sketches, lowres, sun
- Width/Height: /.
512
512
- CFG Scale: .
7
- Seed: .
1954306091
不同采样器的类型和用途
- DDPM (去噪扩散概率模型):
- 详细用途: 在需要重现细致纹理和复杂光影效果的图像中表现良好,如自然风光摄影。
- 特点: 生成高保真图像,但过程较慢,可能需要数百步才能获得理想结果,适用于不追求快速反馈的专业图像处理。
- 说明:是 Stable Diffusion 中最早可用的采样器之一,在 Automatic1111 中不再可用。
- DDIM (去噪扩散隐式模型):
- 详细用途: 优秀的选择用于快速生成较为简化的艺术作品,如现代艺术风格的人像。
- 特点: 在较短的时间内提供良好的质量,例如在50步内就能得到清晰和具有表现力的图像。
- PLMS (伪线性多步骤):
- 详细用途: 适用于动态场景和活动物体的渲染,如运动场景中的动物或车辆。
- 特点: 相较DDIM,在更短的步骤(如30步)内能够产生更清晰和动态的图像。
- 欧拉 (Euler) 和 亨恩 (Heun):
- LMS (线性多步骤):
- 详细用途: 非常适合于高分辨率和高复杂度的图像生成,如详细的建筑视图或复杂的工程设计图。
- 特点: 对计算资源的需求较高,但能在较高的步骤数(如100步)中产生极端细腻和精确的图像。
- DPM家族 (包括DPM2和DPM++):
如何选择采样器
- 图像质量: 对于那些在细节上有极高要求的项目,如专业级别的产品展示或复杂的艺术作品,DPM++ 2M或其Karras版本能提供最佳的细节和纹理复杂度。
- 生成速度: 在需要快速迭代和测试不同概念的创意过程中,如广告草图或快速原型设计,DDIM或PLMS能够以较少的步骤提供清晰的视觉效果。
- 计算资源: 当处理资源受限或需要在短时间内生成多个设计方案时,如标志设计或简单插图,Euler或Heun会是理想的选择,因为它们能在较少的计算资源下快速生成结果。
- 特定应用: 对于如电影视觉效果或高端游戏资产这样的高端应用,可能需要根据具体需求进行试验和调整。例如,DPM++ SDE Karras由于其能在较少步骤中产生富有创造力和变化的图像,可能非常适合这类应用。
结论
稳定扩散采样器是一个强大且多样化的工具,适合各种图像生成需求。了解不同采样器的特点和用途,可以帮助您更好地利用这项技术,创造出令人惊叹的图像。.
参考文献:Complete guide to samplers in Stable Diffusion - Félix Sanz (felixsanz.dev)
资讯、工具、教程、IT服务!
扫描以下二维码加群
告诉管理员您遇到的问题
我们会第一时间为您挑选优质教程和帮您解决问题
© 版权声明
文章版权归作者所有,未经允许请勿转载。