Talk|香港中文大学(深圳)张雪遥:音频生成开源工具包Amphion的歌声转换指南

本期为TechBeat人工智能社区570线上Talk。

北京时间2月7日(周三)20:00,香港中文大学(深圳)博士生张雪遥的Talk已准时在TechBeat人工智能社区开播!

他与大家分享的主题是: 音频生成开源工具包Amphion的歌声转换指南,系统地介绍他的团队提出的针对歌声转换的音频生成开源工具包Amphion,包括该任务的定义、研究发展脉络、最前沿的技术框架范式,以及Amphion对该任务的集成思路与架构设计等相关工作所做的研究。

Talk·信息

主题: 音频生成开源工具包Amphion的歌声转换指南

嘉宾:港中文大学(深圳)博士生 张雪遥

时间:北京时间 2月7日(周三)20:00

地点:TechBeat人工智能社区

点击下方链接,即可观看视频!

TechBeatTechBeat是荟聚全球华人AI精英的成长社区,每周上新来自顶尖大厂、明星创业公司、国际顶级高校相关专业在读博士的最新研究工作。我们希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。icon-default.png?t=N7T8https://www.techbeat.net/talk-info?id=848

Talk·介绍

Amphion是一个集成了语音合成转换、歌声合成转换、音效音乐生成等多功能为一体的音频AIGC开源平台(https://github.com/open-mmlab/Amphion)。在本次报告中,我们将针对于歌声转换(Singing Voice Conversion),介绍该任务的定义、研究发展脉络、最前沿的技术框架范式,以及Amphion对该任务的集成思路与架构设计。除此之外,我们还将介绍Amphion的整体系统架构、代码开发逻辑,以及各类文档的设计思路。最后,我们将通过实例说明,如何基于Amphion来进行各项音频生成任务的研究与开发。

Talk大纲

1、背景:(1)Amphion的初心与愿景;(2)歌声转换任务的任务介绍、相关应用、发展历程

2、当前业内歌声转换技术的Pipeline

3、Amphion中对歌声转换技术的集成与设计

4、Amphion在歌声转换的前沿探索:融合多种语义特征的歌声转换框架

5、Amphion的系统架构、代码与文档设计

Talk·预习资料

Image

论文链接:

https://arxiv.org/pdf/2312.09911.pdf

Github链接:

https://github.com/open-mmlab/Amphion

项目链接:

https://huggingface.co/spaces/amphion/singing_voice_conversion

Talk·提问交流

在Talk界面下的【交流区】参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!

Talk·嘉宾介绍

Image

张雪遥

香港中文大学(深圳)博士生在读

张雪遥,音频生成开源工具包Amphion的联合发起人,香港中文大学(深圳)2022级博士生,导师为武执政教授。研究兴趣为人工智能音乐、歌声生成等。曾入选2023年腾讯犀牛鸟精英人才计划,曾在MM、WWW、ACL、ICASSP等顶级学术会议上发表论文7篇,谷歌学术引用数百次,参与维护多项学术开源项目。本硕毕业于武汉大学、中国科学院大学,曾获国家奖学金、校园十佳歌手等荣誉

个人主页: 

TechBeat


关于TechBeat人工智能社区

TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。

我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。

期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-02-08 12:54:02       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-02-08 12:54:02       100 阅读
  3. 在Django里面运行非项目文件

    2024-02-08 12:54:02       82 阅读
  4. Python语言-面向对象

    2024-02-08 12:54:02       91 阅读

热门阅读

  1. 自然语言NLP

    2024-02-08 12:54:02       49 阅读
  2. LiveData 迁移到 Kotlin Flow详解

    2024-02-08 12:54:02       59 阅读
  3. 【Kotlin】Kotlin基本数据类型

    2024-02-08 12:54:02       39 阅读
  4. Rust 初体验2

    2024-02-08 12:54:02       46 阅读
  5. linux 密码管理

    2024-02-08 12:54:02       54 阅读
  6. nginx stream proxy 模块的ssl连接源码分析

    2024-02-08 12:54:02       44 阅读
  7. c++学习:climits头文件使用

    2024-02-08 12:54:02       50 阅读
  8. 【服务器部署】Docker环境的安装

    2024-02-08 12:54:02       54 阅读
  9. Redis面试题45

    2024-02-08 12:54:02       52 阅读
  10. C#实现 Windows 11 快捷键切换声音输出设备

    2024-02-08 12:54:02       49 阅读
  11. 锐捷设备常用命令

    2024-02-08 12:54:02       137 阅读
  12. 等差数列_1878_C. Vasilije in Cacak

    2024-02-08 12:54:02       59 阅读
  13. LeetCode--代码详解 1.两数之和

    2024-02-08 12:54:02       53 阅读