2024-07-30

AI深度研究员 AI可以怎样帮你赚钱?全面的AI应用与变现教程!

Diffusion模型的缺点及改进版——Stable Diffusion

主理人:
Stable Diffusion

前面我们在介绍整个文字生成图片的架构中,图里面用的都是Stable Diffusion,后面介绍又主要介绍的是Diffusion。其实Stable Diffusion是Diffusion的改进版。

 

在传统的扩散模型中,图像生成过程涉及两个主要阶段:噪声添加和噪声移除。在噪声添加阶段,模型逐渐将数据(如图像)转化为纯噪声;而在噪声移除阶段,也被称为反向扩散过程,模型则需要逐步从噪声中重构出原始数据。这一过程依赖于一个称为 U-Net 的深度学习架构,该架构能够在每个时间步处理带有噪声的图像,逐步减少噪声并恢复图像的细节和质量。

 

然而,当处理的图像尺寸变大或者时间步数(time step t)增多时,这种模型的效率会显著下降。这是因为大尺寸图像需要更多的计算资源来处理,每一个时间步都需要进行复杂的网络运算,导致整个图像生成过程变得非常缓慢。这不仅增加了计算成本,也限制了模型在实时或资源有限的应用场景下的可行性。