ComfyUI学习旅程

一、模型文件(Checkpoint)

首先它很大,这些文件是你从huggingface或者civitai下载而来的,

所以这些大文件如 .ckpt 或 .safetensors ,实际上包含了什么内容呢?

它包含了包含了三种不同模型的权重:CLIP、主模型和VAE。

在默认的ComfyUI工作流中,由这里的CheckpointLoader加载模型到ComfyUI中。

你能看到它会有3种输出。

二、CLIP文本编码器(CLIP Text Encode)

让我们先看CLIP文本编码器这一条分流,注意CLIP又有两条分流,分别流向正面条件和负面条件。

CLIP文本编码器的作用就是把人类语言转换成模型能够理解的数据格式。

三、K 采样器 (KSampler)

CLIP文本编码器会流动到K采样器,图片就是通过这个采样器生成的。

在K采样器中,主要输入是Stable Diffusion的模型。

同时,正向提示词和反向提示词也是作为K采样器的输入。

四、空的潜在图像

最后,需要再来一个空潜在图像作为输入。(Empty Latent Image)

这是因为我们当前的场景是文生图。

五、降噪

于是采样器会利用这个潜在空图像,向这个潜在空图像添加噪声,然后使用Stable Diffusion的模型进行降噪。

具体的降噪过程是:编码后的正面和负面提示被传递给模型,在每个采样步骤中被用来指导去噪。

这种逐渐去噪的图像生成方式,正是Stable Diffusion生成图片的方式。

最终,采样器会输出一张降噪之后的图片。

六、VAE模型解码(VAE Decode)

最后的最后,Stable Diffusion会用到VAE模型。

VAE模型被用于把处于潜在空间的图像,转换成肉眼可见的像素图像。

潜在空间的数据是Stable Diffusion模型能够理解的数据。

而像素空间的图像是图片浏览器和人类能够用肉眼观察到的图像。

这个步骤,你可以看到来自采样器的Latent潜在空间的图像作为VAE编码器的输入,通过VAE解码之后,输出常规图像。

这就是简易的工作流的基本流程

相关推荐

  1. ComfyUI 学习笔记

    2024-04-25 21:14:02       54 阅读
  2. <span style='color:red;'>ComfyUI</span>

    ComfyUI

    2024-04-25 21:14:02      24 阅读
  3. comfyui视频转绘学习笔记

    2024-04-25 21:14:02       60 阅读
  4. ComfyUI是什么?

    2024-04-25 21:14:02       40 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-04-25 21:14:02       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-04-25 21:14:02       100 阅读
  3. 在Django里面运行非项目文件

    2024-04-25 21:14:02       82 阅读
  4. Python语言-面向对象

    2024-04-25 21:14:02       91 阅读

热门阅读

  1. Android常用命名大全

    2024-04-25 21:14:02       32 阅读
  2. 打印菱形(*之间有空格作为间距)

    2024-04-25 21:14:02       35 阅读
  3. 光端机——光纤通信学习笔记(八)

    2024-04-25 21:14:02       39 阅读
  4. 学习笔记 - AI大模型部署-环境

    2024-04-25 21:14:02       30 阅读
  5. 微前端集成模式:独立部署与共享依赖

    2024-04-25 21:14:02       33 阅读
  6. leetcode216--组合总和III

    2024-04-25 21:14:02       34 阅读
  7. python中的进程间通信

    2024-04-25 21:14:02       28 阅读
  8. C++学习第九天(list及其模拟实现)

    2024-04-25 21:14:02       31 阅读
  9. MySQL--创建,删除,查找,案例

    2024-04-25 21:14:02       37 阅读