你有没有试着向别人描述声音?好吧,使用NVIDIA的新Fugatto,您可以生成或转换“使用文本和音频文件的任何组合,用提示描述的任何音乐、声音和声音的组合”。这意味着它可以根据文本提示创建音乐片段,从现有歌曲中删除或添加乐器,改变声音中的口音或情感,甚至让你产生以前从未听过的声音。例如,英伟达表示,Fugatto可以发出喇叭声或萨克斯管喵喵声。该公司在一篇博客文章中表示:
“无论用户能描述什么,模型都能创造。”。NVIDIA应用音频研究经理、管弦乐指挥和作曲家Rafael Valle说:我们想创建一个像人类一样理解和生成声音的模型。Fugatto是我们迈向未来的第一步,在未来,音频合成和转换中的无监督多任务学习将从数据和模型规模中出现。NVIDIA提供的Fugatto使用示例包括使用Fugatto快速原型化或编辑歌曲创意,尝试不同的风格、声音和乐器。
作曲家还可以添加效果并提高现有曲目的整体音频质量。学习一门新语言?想象一下,被一个听起来像你妈妈的声音教!