探秘扩散模型:训练算法与采样算法的双重解读

很早之前就新建了一个专栏从0开始弃坑扩散模型,但发了一篇文章就没有继续这一系列,在这个AIGC的时代,于是我准备重启这个专栏。
整个专栏的学习顺序可以见这篇汇总文章
很多时候我们看到一篇文章很长,难免会心生胆怯,所以我将这些知识进行分解到每一篇中。

这是本专栏的第4章

前面终于解释完了正向过程和反向过程,我们接下来理解训练神经网络的算法和采样图片(生成图片)的算法。

文章目录


在这里插入图片描述

训练算法

在这里插入图片描述

这个算法的流程是,首先从训练集里取一个 x 0 x_0 x0,然后随机从1,2,3…时刻里取一个时刻来训练。注意,在实际训练时候,我们不要求在反向过程里面一样拟合T个正态分布,只要随机预测T个时刻中的某一个时刻结果。然后随机生成一个用来正向过程的噪声得到 x t x_t xt,我们再把 x t x_t xt和t传给神经网络来预测噪声。训练的损失函数是预测噪声和实际噪声之间的均方误差。

采样算法

采样,就是反向过程的又一个讲法罢了,但因为目的是生成图片,所以用采样更加贴近。
[图片]

训练好后,我们可以对任意一个标准正态分布的纯噪声图像去噪。第2步开始就是反向过程了。
为什么这里t=1的时候,不用添加方差了呢?
因为方差和 a t ˉ \bar{a_t} atˉ a t − 1 ˉ \bar{a_{t-1}} at1ˉ有关,当t=1时,怎么可能会有 a 0 ˉ \bar{a_0} a0ˉ呢?

最近更新

  1. TCP协议是安全的吗?

    2024-06-14 03:22:02       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-06-14 03:22:02       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-06-14 03:22:02       18 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-06-14 03:22:02       20 阅读

热门阅读

  1. 2024.06.13

    2024-06-14 03:22:02       9 阅读
  2. 每日一练 - IGMP协议与查询器选举机制

    2024-06-14 03:22:02       9 阅读
  3. python虚拟环境下 .gitignore 要忽略什么

    2024-06-14 03:22:02       9 阅读
  4. 【AI应用探讨】— GPT-4o模型应用场景

    2024-06-14 03:22:02       7 阅读
  5. Hash路由、History路由原理及优缺点

    2024-06-14 03:22:02       9 阅读
  6. mysql和postgreSQL的区别

    2024-06-14 03:22:02       4 阅读
  7. RealAI-图像算法岗-面经

    2024-06-14 03:22:02       6 阅读