Prompt-Free Diffusion: Taking “Text” out of Text-to-Image Diffusion Models

2024-07-10 14:16:05
开发
27

CVPR2024 SHI Labs
https://arxiv.org/pdf/2305.16223
https://github.com/SHI-Labs/Prompt-Free-Diffusion

问题引入

在SD模型的基础之上，去掉text prompt，使用reference image作为生成图片语义的指导，optional structure image作为生成图片structure的指导来进行生成；
使用SeeCoder来提取参考图片的embedding作为生成条件，且SeeCoder是可以重复使用的，可以直接集成到另外的T2I模型中；

methods

使用SeeCoder代替CLIP text embedding；
SeeCoder包含三个部分，Backbone Encoder, Decoder, and Query Transformer，其中Backbone Encoder使用SWIN-L提取多尺度特征，该部分参数是冻结的；之后decoder使用卷积来使得多尺度特征通道数相同，然后进行flatten+concat，得到的结果通过self attn + ffn；之后Query Transformer输出视觉embedding；

原文地址:https://blog.csdn.net/weixin_44994838/article/details/140172470 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1810920908802625536.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

最近更新

题解 - 序列

2024-07-10 14:16:05 125 阅读
CST热仿真案例——电动车直流快充Cable热仿真

2024-07-10 14:16:05 115 阅读
docker php8.1+nginx base 镜像 dockerfile 配置

2024-07-10 14:16:05 99 阅读
Could not load dynamic library ‘cudart64_100.dll‘

2024-07-10 14:16:05 107 阅读
NoSQL之Redis非关系型数据库

2024-07-10 14:16:05 110 阅读
2024.7.22 作业

2024-07-10 14:16:05 108 阅读
GDB调试正在运行的程序

2024-07-10 14:16:05 90 阅读
昇思25天学习打卡营第18天| DCGAN生成漫画头像

2024-07-10 14:16:05 94 阅读
在Django里面运行非项目文件

2024-07-10 14:16:05 90 阅读
SSD基本架构与工作原理

2024-07-10 14:16:05 98 阅读
在誉天学习完HCIE就业吗？

2024-07-10 14:16:05 101 阅读
【合同专题】合同终止协议书、项目合作协议、交底纪要、管理台账

2024-07-10 14:16:05 93 阅读
驾驭云原生日志洪流：高效分析与管理的策略集

2024-07-10 14:16:05 96 阅读
go 协程池的实现

2024-07-10 14:16:05 96 阅读
Shell脚本循环语句与函数

2024-07-10 14:16:05 100 阅读
连锁店收银系统源码（收银称重pos+聚合支付+ERP进销存+营销+会员管理）

2024-07-10 14:16:05 101 阅读
TIA博途V19无法勾选来自远程对象的PUT/GET访问的解决办法

2024-07-10 14:16:05 92 阅读
四大引用——强软弱虚

2024-07-10 14:16:05 93 阅读
Python语言-面向对象

2024-07-10 14:16:05 98 阅读
如何分清楚常见的 Git 分支管理策略Git Flow、GitHub Flow 和 GitLab Flow

2024-07-10 14:16:05 96 阅读
网站安全-CDN篇

2024-07-10 14:16:05 96 阅读

热门阅读

【前端从入门到精通：第二课：HTML头部标签常用标签】

2024-07-10 14:16:05 28 阅读
在本地运行React集成TypeScript的项目

2024-07-10 14:16:05 26 阅读
HTML(29)——立体呈现

2024-07-10 14:16:05 28 阅读
Prompt Engineering 探险

2024-07-10 14:16:05 26 阅读
机器学习之神经网络

2024-07-10 14:16:05 33 阅读
汇川CodeSysPLC教程03-2-14 与HMI通信

2024-07-10 14:16:05 30 阅读
Lianwei 安全周报|2024.07.09

2024-07-10 14:16:05 22 阅读
es6之Proxy实现观察者模式

2024-07-10 14:16:05 30 阅读
变长输入神经网络设计

2024-07-10 14:16:05 26 阅读
每天一个数据分析题（四百一十八）- 相关分析

2024-07-10 14:16:05 24 阅读
【论文速读】| JADE：用于大语言模型的基于语言学的安全评估平台

2024-07-10 14:16:05 36 阅读
探索多模态预训练：MAnTiS、ActionCLIP、CPT与CoOp的Prompt技巧

2024-07-10 14:16:05 28 阅读
计算机网络面试常见题目（一）

2024-07-10 14:16:05 28 阅读
Prompt Engineering（提示工程）

2024-07-10 14:16:05 21 阅读
vue配置sql规则

2024-07-10 14:16:05 21 阅读
ios 企业签名证书购买_iOS苹果企业签名须知

2024-07-10 14:16:05 27 阅读
什么是数据同步服务RSYNC？

2024-07-10 14:16:05 32 阅读
android 使用系统工具bootchart统计开机时长

2024-07-10 14:16:05 29 阅读
【工具分享】FOFA——网络空间测绘搜索引擎

2024-07-10 14:16:05 26 阅读
android13 固定U盘链接 SD卡链接 TF卡链接硬盘链接

2024-07-10 14:16:05 26 阅读
C#运算符重载

2024-07-10 14:16:05 28 阅读
物联网应用，了解一点 WWAN全球网络标准

2024-07-10 14:16:05 27 阅读
数据结构 —— Dijkstra算法

2024-07-10 14:16:05 28 阅读
IP 地址：优化网络游戏

2024-07-10 14:16:05 24 阅读
【pytorch22】激活函数与GPU加速

2024-07-10 14:16:05 23 阅读
【pytorch23】MNIST测试实战

2024-07-10 14:16:05 30 阅读
pycharm如何使用jupyter

2024-07-10 14:16:05 23 阅读
【Jupyter Notebook与Git完美融合】在Notebook中驾驭版本控制的艺术

2024-07-10 14:16:05 27 阅读
Jupyter Notebook详尽安装教程

2024-07-10 14:16:05 23 阅读
Python: 分块读取文本文件

2024-07-10 14:16:05 29 阅读