据美国东部时间8月2日消息,meta公司在8月2日开源了一款名为audiocraft的生成式ai工具,该工具可以帮助用户通过文本提示创作音乐和音频
根据 meta 官方介绍,audiocraft 包含了三个核心组件:
musicgen:使用 meta 拥有 / 特别授权的音乐进行训练,根据文本提示生成音乐。 audiogen:使用公共音效进行训练生成音频或扩展现有音频,后续还可生成环境音效(如狗叫、汽车鸣笛、木地板上的脚步声)。 encodec(改进版):基于神经网络的音频压缩解码器,可生成更高质量的音乐并减少人工痕迹,或对音频文件进行无损压缩。
该工具经过开源之后,相关研究人员和从业人员可以使用自己的数据集训练模型。官方宣称 audiocraft 系列模型能够长期稳定地生成高质量音频,而且易于使用,能够为音乐家和声音设计师“提供灵感”,帮助他们快速集思广益,并“以新的方式迭代他们的作品”。
另据it之家此前报道,今年 6 月份 meta 开源了 ai 语言模型 musicgen,该模型基于谷歌 2017 年推出的 transformer 模型。如同模型名称所示,musicgen 主要用于音乐生成,它可以将文本和已有的旋律转化为完整乐曲。
视频演示:
audiocraft 项目地址:点此前往
以上就是创作音乐/音频的meta开源ai工具audiocraft,让用户通过文本提示实现的详细内容。