2024-07-25

AI深度研究员 AI可以怎样帮你赚钱?全面的AI应用与变现教程!

Diffusion文字生成图片——整体结构

主理人:
我们知道在使用 Diffusion 的时候,是通过文字生成图片

那么文字是怎么转换成Diffusion的输入的呢?加入文字后 Diffusion 又有哪些改变?下图可以找到答案。

 

1 、整个生成过程

实际上 Diffusion 是使用Text Encoder生成文字对应的embedding(Text Encoder使用CLIP模型),然后和随机噪声embedding,time step embedding一起作为Diffusion的输入,最后生成理想的图片。我们看一下完整的图: