Amphion-香港中文大学开源的音频、音乐和语音生成工具包

工具
23年12月21日
编辑

魔果智讯魔果智讯官方账号，魔果智能创始人。

12月18日，香港中文大学（深圳）武执政副教授带领的团队联合上海AI实验室等开源了音频、音乐和语音生成工具包Amphion v0.1版本。

除了文字转语音功能，Amphion还可以将一首歌的声音换成另一个歌手的声音，支持声音转换、歌声合成、文本到音频、文本到音乐等功能，歌声转换目前支持迈克尔·杰克逊、泰勒·斯威夫特、王菲、那英、李健等歌手的声音。该工具包支持多种模型和架构，如FastSpeech2、VITS、Vall-E、NaturalSpeech2等，用于不同的音频生成任务。

论文地址：arxiv.org/abs/2312.09911

小编试玩了一下，非常有意思，大家可以去体验一下。

声音转换Demo地址：

huggingface.co/spaces/amphion/singing_voice_conversion

声明：魔果智讯倡导尊重与保护知识产权。如发现本站文章存在版权等问题，烦请30天内提供版权疑问、身份证明、版权证明、联系方式等发邮件至moguoai@yeah.net！我们将及时沟通与处理。

{{userData.name}}已认证

Amphion-香港中文大学开源的音频、音乐和语音生成工具包

QQ

微信

邮箱

{{userData.name}}已认证

关于我们

Content

About

Contact

QQ

微信

邮箱

人工智能领域全媒体矩阵