ddpm Denoising Diffusion Probabilistic Model 学习笔记

目录

Stable Diffusion

文章的贡献抽象出来就两个

潜空间上做扩散生成

ddpm(Denoising Diffusion Probabilistic Model)学习笔记

算法原理

unet预测噪声

unet推理过程

重参数化技巧

(1)利用前一时刻的 xt-1 得到任意时刻的噪声图片 xt(重参数化技巧)


Stable Diffusion

文章的贡献抽象出来就两个

:1)提出可以在潜空间上用diffusion学特征分布,而不是直接让diffusion 学图像,降低了diffusion模型的难度;2)可以用 cross-attention 方法给模型加条件搞条件生成,在 cross-attention 中,q来源于与上一步,k和v来源于条件编码。

潜空间上做扩散生成

之前的DM(diffusion model)大多是直接对图像做去噪扩散,生成出来的图像细节不太好,如果想生成高清大图又需要非常大的计算量。所以这里作者提出了一种在潜空间上做扩散生成的方式,另外还增加了文本条件生成。这些操作使得模型最终可以生成非常高清的图,而且跟像素级的DMs模型相比大大降低了计算量。

作者的贡献有:

1)与以往纯transformer的结构不同,作者的模型可以更优雅地扩展到更高纬度的数据,因此此工作可以(a)在压缩了的级别上提供更可靠更具体的重建细节,(b)可以更有效地生成百万像素高清图像。

ddpm(Denoising Diffusion Probabilistic Model)学习笔记

算法原理

一文弄懂 Diffusion Model(DDPM)+ 代码实现-CSDN博客

unet预测噪声

无论在前向过程还是反向过程,Unet的职责都是根据当前的样本和时间 t 预测噪声。

  • 训练阶段是一步预测出从0到t加的噪声noise
  • 推理阶段是根据模型算出该t时刻的噪声,然后用x_t减去该时刻的噪声noise得到x[t-1]

unet推理过程

训练时:给定原图和时间t,加上噪声,然后用unet预测噪声。

推理时,给定随机噪声和时间t,预测噪声,然后减去噪声,然后就是图像

重参数化技巧

(1)利用前一时刻的 xt-1 得到任意时刻的噪声图片 xt(重参数化技巧

相关推荐

  1. 学习笔记

    2024-05-14 14:14:02       29 阅读
  2. 学习笔记:机器学习

    2024-05-14 14:14:02       79 阅读
  3. 【OpenCV学习笔记】- 学习笔记目录

    2024-05-14 14:14:02       62 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-05-14 14:14:02       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-05-14 14:14:02       100 阅读
  3. 在Django里面运行非项目文件

    2024-05-14 14:14:02       82 阅读
  4. Python语言-面向对象

    2024-05-14 14:14:02       91 阅读

热门阅读

  1. react router v6总结

    2024-05-14 14:14:02       33 阅读
  2. 【Python快速上手(二十二)】

    2024-05-14 14:14:02       33 阅读
  3. C++ 使用nlohmann/json.hpp库读写json字符串

    2024-05-14 14:14:02       30 阅读
  4. Ubuntu下C++编程总结AllInOne

    2024-05-14 14:14:02       28 阅读
  5. Json格式备忘

    2024-05-14 14:14:02       31 阅读
  6. LinkedList源码解析

    2024-05-14 14:14:02       31 阅读
  7. git 常用命令

    2024-05-14 14:14:02       28 阅读
  8. Docker——目录迁移

    2024-05-14 14:14:02       31 阅读
  9. docker的使用

    2024-05-14 14:14:02       33 阅读