sadtalker学习用于风格化音频驱动单图像说话人脸动画的真实 3D 运动系数的应用

论文出处

https://arxiv.org/abs/2211.12194

使用方法

1. 打开项目的colab链接

https://colab.research.google.com/github/Winfredy/SadTalker/blob/main/quick_demo.ipynb#scrollTo=fAjwGmKKYl_I

在examples/source_image文件夹中添加希望动起来说话的图片,这里添加的是航天之父戚发轫,respect。

2. 再用ttsmaker文字转语音工具,将戚先生在剧本中要说的话转为语音,链接如下

https://ttsmaker.com/zh-cn

3. 生成wav文件后,上传到colab中的/examples/driven_audio文件夹,并在代码部分进行名称替换

4. 接下来只需要按步骤运行demo,就能在result文件夹下生成想要的动起来的mp4文件了,我的视频大约1分半,用了约10分钟生成,生成效果如下(已经按第6步视频增强)。

4718_1711785136

5.生成的视频分辨率不够高,但相比之前自己使用的DID生成的数字人,真实度高了不少,DID生成的嘴巴明显是从另外找了一个,属于一眼假,DID链接如下D-ID | The #1 Choice for AI Generated Video Creation Platform

这次不用DID的另一个原因是生成的视频有水印了。

6.最后可以看到生成的视频较为模糊,用了一个手机上的app叫wink来视频增强

最近更新

  1. TCP协议是安全的吗?

    2024-04-01 02:46:03       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-04-01 02:46:03       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-04-01 02:46:03       18 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-04-01 02:46:03       20 阅读

热门阅读

  1. 八大排序(尚未完善)

    2024-04-01 02:46:03       14 阅读
  2. 吴恩达:AI 智能体工作流引领人工智能新趋势

    2024-04-01 02:46:03       17 阅读
  3. 全面对比API和SDK

    2024-04-01 02:46:03       15 阅读
  4. 【开发总结】Rust的命令行库clap

    2024-04-01 02:46:03       21 阅读
  5. 练气第四天

    2024-04-01 02:46:03       16 阅读
  6. Python提取文本文档符合条件的某列

    2024-04-01 02:46:03       13 阅读
  7. 分布式算法 - ZAB算法

    2024-04-01 02:46:03       11 阅读
  8. 深度优先搜索(DFS)算法深入探索与实践

    2024-04-01 02:46:03       15 阅读
  9. [内部类与常见API]String类

    2024-04-01 02:46:03       15 阅读
  10. 如何让div中滚动条一直保持在最下方

    2024-04-01 02:46:03       17 阅读
  11. 烂笔头,记录一年遗忘

    2024-04-01 02:46:03       16 阅读