【SD】 Stable Diffusion(SD)原理详解与ComfyUI使用 2

Stable Diffusion(SD)原理详解与ComfyUI使用

在这里插入图片描述

1. SD整体结构
  • 输入:文本和随机变量(Latent Vector)
  • 输出:图片
  • 核心:由三个模型组成
    1. 文本编码器(Clip)
    2. 生成模型(Unit)
    3. 变分自编码器(VAE)
2. Clip(文本编码器)
  • 专为SD设计的文本编码器
  • 训练步骤:
    1. 有限制性预训练:使用图片和文本描述的数据集,训练文本编码器和图片编码器,使输出向量尽可能接近。
    2. 进一步训练:使用物体名称和描述,训练文本编码器解码能力。
3. Unit(生成模型)
  • 功能:加噪和降噪过程
  • 过程:将图片经过VAE编码器处理,生成与Latent Vector相同大小的图片,然后通过加噪和降噪生成中间结果。
4. VAE(变分自编码器)
  • 功能:降维和升维
  • 过程:
    1. 编码器将图片转换为较小的表示
    2. 解码器将较小的表示还原为原图大小
  • 优点:无需标签,可以从噪声中生成图片
5. 整体工作流程
  1. 文本通过Clip编码成向量
  2. 向量和Latent Vector一起输入到Unit
  3. Unit进行降噪处理,生成中间结果
  4. 中间结果通过VAE解码器还原为最终图片
6. ComfyUI低显存生成图片
  • 利用SD原理,ComfyUI可以在低显存条件下生成高质量图片
  • 通过理解SD的各个部件和工作流程,可以更好地使用ComfyUI
7. 总结
  • SD通过结合文本编码器、生成模型和变分自编码器,实现了从文本到图片的生成
  • ComfyUI利用SD原理,提供了一种在资源受限条件下生成图片的方法
  • 理解SD的架构和组件对于有效使用ComfyUI至关重要

相关推荐

  1. 【WSL2笔记9】Ubuntu 环境ComfyUI 安装使用笔记

    2024-07-23 06:50:03       40 阅读
  2. 详细分析解读NCCL P2P原理概念

    2024-07-23 06:50:03       21 阅读
  3. <span style='color:red;'>ComfyUI</span>

    ComfyUI

    2024-07-23 06:50:03      22 阅读
  4. Cocos Creator 2D MaskLayout 使用详解

    2024-07-23 06:50:03       34 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-23 06:50:03       52 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-23 06:50:03       54 阅读
  3. 在Django里面运行非项目文件

    2024-07-23 06:50:03       45 阅读
  4. Python语言-面向对象

    2024-07-23 06:50:03       55 阅读

热门阅读

  1. 时间和空间复杂度

    2024-07-23 06:50:03       17 阅读
  2. vivado IOBDELAY

    2024-07-23 06:50:03       16 阅读
  3. React/Vue项目解决跨域的方法

    2024-07-23 06:50:03       18 阅读
  4. 第五节shell脚本中的运行流程控制(3.2)

    2024-07-23 06:50:03       15 阅读
  5. 后端存储流程结构的思考

    2024-07-23 06:50:03       12 阅读
  6. 【DevOps系列】构建Devops系统

    2024-07-23 06:50:03       16 阅读
  7. 寻访安康茶韵,共筑乡村振兴

    2024-07-23 06:50:03       15 阅读