【Diffusion学习】【生成式AI】Stable Diffusion、DALL-E、Imagen 背後共同的套路


from: https://www.youtube.com/watch?v=JbfcAaBT66U&list=PLJV_el3uVTsNi7PgekEUFsyVllAJXRsP-&index=5

简介:

84,841次观看 2023年3月25日 【機器學習 2023】(生成式 AI)
感謝黃敬峰先生提供字幕

Stable Diffusion
https://arxiv.org/abs/2112.10752

DALL-E series
https://arxiv.org/abs/2204.06125
https://arxiv.org/abs/2102.12092

Imagen
https://arxiv.org/abs/2205.11487


图片生成Framework 需要3个组件:

  1. Text Encoder
  2. Generation Model
  3. Decoder

在这里插入图片描述

相关论文【Stable Diffusion,DALL-E,Imagen】

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

具体介绍三个组件

在这里插入图片描述

1. Text encoder介绍【结论:文字的encoder重要,Diffusion的模型不是很重要!】

在这里插入图片描述

评估指标:FID计算

在这里插入图片描述

CLIP Score 计算

在这里插入图片描述

3. Decoder介绍【不需要成对的训练资料】

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

2. Diffusion Model介绍【训练一个noise predicter】

在这里插入图片描述

noise 加在 latent representation上

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-16 17:42:02       66 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-16 17:42:02       70 阅读
  3. 在Django里面运行非项目文件

    2024-07-16 17:42:02       57 阅读
  4. Python语言-面向对象

    2024-07-16 17:42:02       68 阅读

热门阅读

  1. 靖江美食元宇宙

    2024-07-16 17:42:02       18 阅读
  2. 1213:八皇后问题

    2024-07-16 17:42:02       18 阅读
  3. py每日spider案例之影视搜索篇

    2024-07-16 17:42:02       19 阅读
  4. Linux内核 -- 用户态coredump处理之do_coredump函数

    2024-07-16 17:42:02       24 阅读
  5. 什么是MATLAB许可证协议书

    2024-07-16 17:42:02       22 阅读
  6. InnoDB 存储结构与索引页结构

    2024-07-16 17:42:02       21 阅读
  7. C++ 入门13:异常处理

    2024-07-16 17:42:02       17 阅读
  8. Nim 游戏

    2024-07-16 17:42:02       24 阅读
  9. 用Racket做一个拼图游戏——31 创建主程序

    2024-07-16 17:42:02       23 阅读
  10. Python使用蓝牙抓包

    2024-07-16 17:42:02       18 阅读