阿里云大模型「让照片跳舞」刷屏朋友圈，有哪些信息值得关注？

2024-01-06 21:40:01
开发
61

介绍

大家好，我分享聊聊阿里通义千问APP中全民舞王功能。

网络热舞结合AI视频，这是以后不用学习跳舞？

可以尝试下效果，一张图片生成视频。

APP快速使用

搜索下载通义千问APP
在这里插入图片描述
打开APP，选中一张照片来跳舞。

这里上传照片原则：身体保持全身站立，挺胸抬头，图像中不要有其他人，背景简单些。

AI视频一张图片跳科目三

图解原理

虽然一些技术没有开源，我们可以根据阿里通义实验室自研视频生成模型 Animate Anyone，推演原理。

我们通过图讲解下演化，Animate Anyone用于人物动画的图像到视频合成方法，基于扩散模型重构创新所得。

图解扩散模型生成过程

在这里插入图片描述
VAE编码器（输出矩阵）-> UNet (完成当前时间步 t 的噪声预测) -> SD1.x 系列(64x64x4 的向量) -> 采样器 (重复 N 次) 去除噪声 -> VAE解码器 -> 生成图像。

具体可以看我原先的讲解扩散模型

图解Animate Anyone生成过程

参考图像和姿态序列输入，经过VAE编码器，创建一个矩阵（潜在的表示），用到CLIP （文本-图像映射）引导角色原始外观，姿态引导与U-Net结合，类似上述过程，在空间和时间中去噪，输出一个合成视频。

该架构强调保持角色的详细特征、运动的连续性和对动画的控制。

该模型解决了图像到视频合成的挑战，如保持详细信息和确保生成动画的时间稳定性。

论文在从静态图像生成角色视频方面呈现了最先进的结果。

总结

阿里云大模型 Animate Anyone就像一个超级导演。

与过去那些导演只会让演员在视频里面变来变去、动作不连贯不同，这个模型导演出来的视频，无论演员的样子还是动作都非常逼真流畅，就像真人一样。

朋友们可以一块讨论下还适合在什么领域？

我是李孟，独立开源软件开发者，SolidUI作者，对于新技术非常感兴趣，专注AI和数据领域，如果对我的文章内容感兴趣，请帮忙关注点赞收藏，谢谢！

原文地址:https://blog.csdn.net/qq_19968255/article/details/135416235 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1743628486939119616.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

最近更新

题解 - 序列

2024-01-06 21:40:01 122 阅读
CST热仿真案例——电动车直流快充Cable热仿真

2024-01-06 21:40:01 109 阅读
docker php8.1+nginx base 镜像 dockerfile 配置

2024-01-06 21:40:01 98 阅读
Could not load dynamic library ‘cudart64_100.dll‘

2024-01-06 21:40:01 106 阅读
NoSQL之Redis非关系型数据库

2024-01-06 21:40:01 108 阅读
2024.7.22 作业

2024-01-06 21:40:01 106 阅读
GDB调试正在运行的程序

2024-01-06 21:40:01 87 阅读
昇思25天学习打卡营第18天| DCGAN生成漫画头像

2024-01-06 21:40:01 90 阅读
在Django里面运行非项目文件

2024-01-06 21:40:01 87 阅读
SSD基本架构与工作原理

2024-01-06 21:40:01 94 阅读
在誉天学习完HCIE就业吗？

2024-01-06 21:40:01 98 阅读
【合同专题】合同终止协议书、项目合作协议、交底纪要、管理台账

2024-01-06 21:40:01 90 阅读
驾驭云原生日志洪流：高效分析与管理的策略集

2024-01-06 21:40:01 92 阅读
go 协程池的实现

2024-01-06 21:40:01 93 阅读
Shell脚本循环语句与函数

2024-01-06 21:40:01 96 阅读
连锁店收银系统源码（收银称重pos+聚合支付+ERP进销存+营销+会员管理）

2024-01-06 21:40:01 98 阅读
TIA博途V19无法勾选来自远程对象的PUT/GET访问的解决办法

2024-01-06 21:40:01 90 阅读
四大引用——强软弱虚

2024-01-06 21:40:01 92 阅读
Python语言-面向对象

2024-01-06 21:40:01 96 阅读
如何分清楚常见的 Git 分支管理策略Git Flow、GitHub Flow 和 GitLab Flow

2024-01-06 21:40:01 91 阅读
网站安全-CDN篇

2024-01-06 21:40:01 93 阅读

热门阅读

用户管理第2节课 -- idea 2023.2 创建表--鱼皮

2024-01-06 21:40:01 55 阅读
Python开源项目周排行 2024年第1周

2024-01-06 21:40:01 70 阅读
C++返回值、返回引用、返回地址

2024-01-06 21:40:01 59 阅读
六、书写命令

2024-01-06 21:40:01 55 阅读
一起玩儿物联网人工智能小车（ESP32）——27. 旋转编码器的使用方法

2024-01-06 21:40:01 61 阅读
Code::Blocks - The free C/C++ and Fortran IDE

2024-01-06 21:40:01 61 阅读
剑指offer

2024-01-06 21:40:01 96 阅读
滑动窗口最大值【子串】【滑动窗口】【双端队列】

2024-01-06 21:40:01 78 阅读
使用chatgpt完成代码写作（免费收藏级）

2024-01-06 21:40:01 70 阅读
macOS跨进程通信: FIFO(有名管道) 创建实例

2024-01-06 21:40:01 69 阅读
软件工程概论------文件管理

2024-01-06 21:40:01 54 阅读
【Spring】AOP原来如此

2024-01-06 21:40:01 75 阅读
聊一聊 C# 线程切换后上下文都去了哪里

2024-01-06 21:40:01 53 阅读
【Linux Shell】6. echo 命令

2024-01-06 21:40:01 59 阅读
ISP 基础知识积累

2024-01-06 21:40:01 69 阅读
python&pycharm安装教程

2024-01-06 21:40:01 63 阅读
奋楫扬帆，奔赴新程 | 2023 年图扑大事记回顾，与您携手共迎 2024

2024-01-06 21:40:01 59 阅读
LabVIEW在机器人视觉抓取系统中应用

2024-01-06 21:40:01 58 阅读
EAS WEB附件下载实现

2024-01-06 21:40:01 57 阅读
leetcode算法题之递归--综合练习(二)

2024-01-06 21:40:01 69 阅读
基于SpringBoot的物流管理系统

2024-01-06 21:40:01 67 阅读
高考组数。

2024-01-06 21:40:01 64 阅读
J2 - ResNet-50v2实战

2024-01-06 21:40:01 63 阅读
MySQL5.7无法连接到[本地] MySQL 服务器

2024-01-06 21:40:01 67 阅读
主浏览器优化之路2——Edge浏览器的卸载与旧版本的重新安装

2024-01-06 21:40:01 68 阅读
Mathtype7.4安装与嵌入WPS

2024-01-06 21:40:01 75 阅读
250：vue+openlayers 加载geotiff文件，并在地图上显示

2024-01-06 21:40:01 67 阅读
新版Edge如何卸载详细讲解

2024-01-06 21:40:01 76 阅读
新版EDGE卸载

2024-01-06 21:40:01 67 阅读
c++求一个数是否是质数

2024-01-06 21:40:01 68 阅读