stable-diffusion | v1-5-pruned.ckpt和v1-5-pruned-emaonly.ckpt的区别

在这里插入图片描述

https://github.com/runwayml/stable-diffusion?tab=readme-ov-file#reference-sampling-script

在这里插入图片描述
对于 1.5 模型,其中可能包括四部分:标准模型、文本编码器、VAE模型、EMA模型。

标准模型:生成图片的核心模块,潜空间中的前向扩散和反向扩散就是通过它做的,对应到图中左侧的 U-Net。

文本编码器:将文本提示词转换为数学向量,然后用作生成图片的引导条件。全称是 Text Encoder,对应到图中的TE。

VAE模型:用于图像在像素空间和潜在空间的映射,生成图片时将图像从潜在空间转换为像素图片,目前大部分模型都自带VAE。

EMA模型:EMA是一种算法,用来稳定模型效果的。对于日常生成,我们只要了解这样一个事实就行了:如果只是生成,EMA模型和标准模型的效果是一样的。如果你要做二次训练,并且显卡够好,选择带EMA的模型可能更好,因为所有数据都在;当然选择去EMA的模型也能做二次训练。

https://mp.weixin.qq.com/s/Ka5lnzcyFv2zdifo-Q81HQ

相关推荐

  1. 【AIGC调研系列】Grok-1.5v与Gpt-4v效果对比

    2024-02-05 07:20:02       32 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-02-05 07:20:02       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-02-05 07:20:02       101 阅读
  3. 在Django里面运行非项目文件

    2024-02-05 07:20:02       82 阅读
  4. Python语言-面向对象

    2024-02-05 07:20:02       91 阅读

热门阅读

  1. 在建站和小程序方面,公司如何提升客户的体验

    2024-02-05 07:20:02       58 阅读
  2. 微信小程序封装wx.request以及小程序登录

    2024-02-05 07:20:02       58 阅读
  3. 【微信小程序】微信小程序开发:从入门到精通

    2024-02-05 07:20:02       54 阅读
  4. 26种设计模式之单例模式

    2024-02-05 07:20:02       45 阅读
  5. 一知半解,临时解决ajax跨域请求

    2024-02-05 07:20:02       51 阅读
  6. 后端返回给前端的数据格式有哪些?

    2024-02-05 07:20:02       53 阅读
  7. C 检查小端存储还是大端

    2024-02-05 07:20:02       45 阅读
  8. appium抓包总结

    2024-02-05 07:20:02       58 阅读
  9. ansible批量修改主机密码

    2024-02-05 07:20:02       52 阅读
  10. Leetcode 3027. Find the Number of Ways to Place People II

    2024-02-05 07:20:02       54 阅读