【NeurIPS 2023】多模态联合视频生成大模型CoDi

Diffusion Models视频生成-博客汇总

前言:目前视频生成的大部分工作都是只能生成无声音的视频,距离真正可用的视频还有不小的差距。CoDi提出了一种并行多模态生成的大模型,可以同时生成带有音频的视频,距离真正的视频生成更近了一步。相信在不远的将来,可以AI生成的模型可以无缝平替抖音等平台的短视频。这篇博客详细解读一下这篇论文《Any-to-Any Generation via Composable Diffusion》。

目录

贡献概述

方法详解

相关推荐

  1. NeurIPS 2023联合视频生成模型CoDi

    2023-12-18 07:14:02       66 阅读
  2. VALSE 2024 Workshop报告总结┆模型

    2023-12-18 07:14:02       33 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2023-12-18 07:14:02       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2023-12-18 07:14:02       100 阅读
  3. 在Django里面运行非项目文件

    2023-12-18 07:14:02       82 阅读
  4. Python语言-面向对象

    2023-12-18 07:14:02       91 阅读

热门阅读

  1. React Hooks解决了什么问题?

    2023-12-18 07:14:02       60 阅读
  2. AutoJs学习-某点阅读自动签到任务脚本

    2023-12-18 07:14:02       49 阅读
  3. Node.js初学习

    2023-12-18 07:14:02       63 阅读
  4. Axure的交互样式和情形

    2023-12-18 07:14:02       59 阅读
  5. tp如何开启监听SQL

    2023-12-18 07:14:02       57 阅读
  6. C语言初学4:运算符

    2023-12-18 07:14:02       64 阅读
  7. 力扣面试150题 |1. 两数之和

    2023-12-18 07:14:02       55 阅读