Stable Diffusion 详解

整体目标

  • 文本生成图片;文本+图片生成图片
    在这里插入图片描述

网络结构

  • CLIP的文本编码器和图片生成器组成在这里插入图片描述
  • 图像生成器,输入是噪声经过UNet得到图像特征,最后解码得到图像
    在这里插入图片描述
    在这里插入图片描述

前向扩散

在这里插入图片描述
在这里插入图片描述

  • 模型直接预测图片难度比较大,所有让模型预测噪音然后输入-噪音可得到原图
    在这里插入图片描述

逆向扩散

在这里插入图片描述

预测模型UNet

在这里插入图片描述

  • 改进后的UNet
    在这里插入图片描述
    在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

代码讲解

参考链接

相关推荐

最近更新

  1. TCP协议是安全的吗?

    2024-03-11 20:40:03       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-03-11 20:40:03       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-03-11 20:40:03       18 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-03-11 20:40:03       20 阅读

热门阅读

  1. Python 模块

    2024-03-11 20:40:03       22 阅读
  2. pytorch中的dataset和dataloader

    2024-03-11 20:40:03       19 阅读
  3. vim 编辑器

    2024-03-11 20:40:03       21 阅读
  4. 人工智能迷惑行为大赏

    2024-03-11 20:40:03       19 阅读
  5. 20个常用的Python脚本

    2024-03-11 20:40:03       23 阅读
  6. 【C/C++ 学习笔记】流程结构

    2024-03-11 20:40:03       22 阅读
  7. Oracle Foreign key 无索引导致的死锁 deadlock 或者hang

    2024-03-11 20:40:03       19 阅读
  8. 【图解算法-C语言】-- 1.常见算法介绍

    2024-03-11 20:40:03       25 阅读
  9. vue2 elementui 封装一个动态表单复杂组件

    2024-03-11 20:40:03       19 阅读
  10. git的基本概念和用法

    2024-03-11 20:40:03       27 阅读
  11. 系统架构设计基础

    2024-03-11 20:40:03       23 阅读
  12. Hive分桶表

    2024-03-11 20:40:03       20 阅读
  13. 机器学习是什么?如何从入门到精通?

    2024-03-11 20:40:03       19 阅读
  14. golang数组和Slice地址

    2024-03-11 20:40:03       22 阅读