麦克雷 Mavom.cn

标题: stable diffusion——超级简单级理解(自学理解) [打印本页]

作者: 艾的民 时间: 前天 16:15
标题: stable diffusion——超级简单级理解(自学理解)
stable diffusion——超级简单级理解(自学理解)

作者: IzraelOt 时间: 前天 16:15
stable diffusion是基于latent diffusion model改进的生成模型，核心是通过潜空间的正向加噪与反向去噪过程实现图像生成，其改进主要体现在训练数据、文本编码器、训练分辨率和模型架构上。以下是具体解释：
一、latent diffusion model基础流程latent diffusion model由像素空间、潜空间和条件三部分组成，核心是潜空间中的正向加噪与反向去噪过程：

像素空间

(, 下载次数: 0)
图1 Latent Diffusion Models结构

潜空间

正向过程

反向过程

重建图像

(, 下载次数: 0)
图2 正向和反向过程
二、stable diffusion的改进点stable diffusion在latent diffusion基础上优化了四个关键环节：

训练数据

Text Encoder

训练分辨率

模型架构

三、总结stable diffusion通过扩大训练数据、引入预训练文本编码器、提升训练分辨率和优化模型架构，显著提升了图像生成的质量、细节和语义对齐能力，成为更高效的生成模型。其核心逻辑仍基于latent diffusion的正向加噪与反向去噪框架，但改进后的模型能生成更逼真、符合文本描述的图片。

欢迎光临麦克雷 Mavom.cn (http://www.mavom.cn/)