1. 论文基本信息
2. Pipeline
2.1. 前向过程 (如何得到 Xt t 时刻的分布)
要点:
- 随着 t 的增大,加噪的量应该越来越多。(由于初始原图只需要很少的噪声就产生较大的扩散,而后续噪声变多之后,需要较大的噪声才能引起扩散)
X t 的分布有如下公式得到( z1 是服从高斯分布的噪声):
- 随着 t 的增大前置分布对当前分布的影响减小,而噪声对当前分布的影响变大。
以上过程类似于 RNN 的递归化,但是递归的问题在于不能并行,导致梯度传播慢,以及串行训练慢。下面公式推导计算直接由 X0 -> Xt:
带入到 Xt 式中:
公式中的 Z1 和 Z2 乘完系数后服从如下两个分布:
最终得到核心公式:Xt =
。 在扩散模型中只需要知道初始分布以及要得到哪一步的分布即可计算出该步的分布。(扩散公式)
2.2. 逆向过程(去噪)
由于标准正态分布符合以下公式:
所以上述贝叶斯公式可展开:
建立 model 预测 Zt 即可解决。