4月4日讯 著名开源大模型平台 Stability.ai 在官网正式发布了音频模型 Stable Audio2.0。这一版本支持用户通过文本或音频生成多种类型的高质量音乐,时长可达3分钟44.1kHz。
相较于之前的版本,Stable Audio2.0采用了 Diffusion transformer(DiT)替换了 U-Net 架构,使得生成音乐的效率大幅提升。此外,该模型使用了超过80万个音频文件组成的数据集,总计超过1.95万小时的音频,与知名音乐服务商 AudioSparx 合作,生成的音乐可用于商业化。
用户在体验 Stable Audio2.0时,可以通过输入提示词来生成不同类型的音乐,例如冥想背景音乐或体育赛事激情音乐等。生成的音乐可以在网站上在线试听,也可选择下载使用。
对于视频自媒体用户来说,Stable Audio2.0免费赠送20积分,并支持商业化使用,为他们的创作提供了更多可能性。随着 Stability.ai 不断推出新功能和技术,用户可以期待更多高质量、多样化的音乐生成体验。
体验地址:https://stableaudio.com/generate