Amphion-香港中文大学开源的音频、音乐和语音生成工具包

Amphion-香港中文大学开源的音频、音乐和语音生成工具包

12月18日,香港中文大学(深圳)武执政副教授带领的团队联合上海AI实验室等开源了音频、音乐和语音生成工具包Amphion v0.1版本。

除了文字转语音功能,Amphion还可以将一首歌的声音换成另一个歌手的声音,支持声音转换、歌声合成、文本到音频、文本到音乐等功能,歌声转换目前支持迈克尔·杰克逊、泰勒·斯威夫特、王菲、那英、李健等歌手的声音。该工具包支持多种模型和架构,如FastSpeech2、VITS、Vall-E、NaturalSpeech2等,用于不同的音频生成任务。

论文地址:arxiv.org/abs/2312.09911

小编试玩了一下,非常有意思,大家可以去体验一下。

声音转换Demo地址:

huggingface.co/spaces/amphion/singing_voice_conversion

声明:魔果智讯倡导尊重与保护知识产权。如发现本站文章存在版权等问题,烦请30天内提供版权疑问、身份证明、版权证明、联系方式等发邮件至moguoai@yeah.net!我们将及时沟通与处理。
0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索