ComfyUI学习笔记

文生图/图生图基本原理 基础 AI 文生图(Text-to-Image Generation)是指通过输入文本描述,生成对应图像的技术。文生图的整体流程: 文本编码:将输入的文本描述转换为向量表示,捕捉语义信息。 噪声生成与扩散过程:通过逐步向图像添加噪声,训练模型学习如何逆转噪声过程生成清晰图像。 采样(生成)过程:利用训练好的模型,从随机噪声开始,逐步去噪,生成符合文本描述的图像。 图像解码:将模型生成的潜在空间表示解码为真实图像。 ...

May 24, 2025 · 2315 words · compasty