谷歌发布音乐AI工具MusicFX:一句话就能生成一首音乐
创始人
2024-01-08 11:47:21
0

原标题:谷歌发布音乐AI工具MusicFX:一句话就能生成一首音乐

谷歌继续向音乐领域发起挑战,人人都能作曲的时代似乎又近了一步。

12月14日,谷歌推出AI音乐创作工具“MusicFX”,仅需几句话,用户即可生成原创的音乐作品。

谷歌在介绍中指出,这一名为“MusicFX”的创作工具结合了谷歌此前发布的MusicLM模型DeepMind的水印技术SynthID,以便在事后识别出它们是否由AI制作而成,一定程度上可以解决创作人对于版权问题的担忧。

分析认为,MusicFX的出现也将成为AI领域的一个重要里程碑,为音乐家、制作人和音乐爱好者开辟了尝试和创作多种音乐的新可能性:

MusicFX为音乐创作者提供了丰富的音效和声音素材,用户可以创作各种类型的音乐,同时支持调整音调、节奏和音量,还可以添加混响、回声等效果。无论是想要营造舒缓的氛围还是冒险紧张的氛围,MusicFX都可以满足。

MusicFX当前仍需要通过谷歌一个AI实验性产品网站(AI Test Kitchen)进入,这一平台的建立是为了让用户在尽早体验其最新的AI技术的同时,也能提供早期反馈,这种合作方法能帮助谷歌完善技术,并遵守道德标准。

媒体分析认为,MusicFX的发布不仅仅将为音乐生成提供全新的工具,也代表了AI发展过程中的趋势,用户在帮助企业完善和塑造人工智能方面的作用变得越来越重要,通过在早期阶段让用户参与进来,谷歌不仅增强了技术,还主动解决了潜在的道德问题。

此外,MusicFX的出现可能会降低音乐创作的门槛,让更多没有经过专业音乐培训的爱好者们参与进来。

但MusicFX的出现并非没有争议,有观点认为,如何解决人工智能生成的内容对版权、所有权和音乐原创性的影响还没有答案,谷歌决定在AI生成音乐中使用水印,表明了他们对这些问题的关注,但这一问题并没有解决,AI生成的内容是否属于原创?

对于接下来的计划,谷歌表示,他们会继续根据用户意见继续完善MusicFX,MusicFX有可能重新定义音乐创作及与音乐互动的方式,AI Test Kitchen可能会成为未来AI发展的典范,这种方法可以推动人工智能发展进入负责任的新时代,在这个时代,技术与社会价值观和规范齐头并进。

MusicLM有多强大?

在今年年初,谷歌MusicLM横空出世,可以直接将文字、图像自动生成音乐,并且曲风多样,凡是想听的音乐,基本都能自动生成。

MusicLM是一个以文本为条件的音频生成模型,可以从文本描述中生成高保真的音乐。该模型采用层次化的序列到序列的方法,这使它能够生成几分钟内一致的音乐。

MusicLM使用三种模型来提取作为条件自回归音乐生成输入的音频表示。SoundStream,w2v-BERT和MuLan。

其中,AudioLM模型可视作MusicLM的前身,MusicLM就是利用了AudioLM的多阶段自回归建模作为生成条件,可以通过文本描述,以24kHz的频率生成音乐,并在几分钟内保持这个频率。

相较而言,MusicLM的训练数据更多。研究团队引入了首个专门为文本-音乐生成任务评估数据MusicCaps来解决任务缺乏评估数据的问题。MusicCaps由专业人士共建,涵盖5500个音乐-文本对。基于此,谷歌用280000小时的音乐数据集训练出了MusicLM。

但媒体此前分析称,MusicLM肯定不是完美无缺的,或者说离完美仍有相当的距离。一些样本还有质量问题,而且虽然 MusicLM 在技术上可以生成人声,包括完成和声,但还有很多地方需要改进。大多数“歌词”也是蹩脚的英语或纯粹的胡言乱语,然后由合成的声音演唱,听起来像是奇怪的“混合物”。

AI生成音乐的版权风险:到底算不算原创?

AI跟人一样,偶尔会偷懒直接抄袭这些素材,版权该如何保护?

谷歌的研究员在一次实验中发现,该系统生成的音乐中约有1%是直接复制自其训练的歌曲。这个问题足以让研究人员不愿意过早发布MusicLM。另外,用搜集来的素材供AI学习,这本身是否就已经涉及到侵犯版权?

实际上目前已经有了相关案例。2020年,美国说唱歌手Jay-Z的唱片公司对YouTube频道Vocal Synthesis提出版权警告,理由是它使用AI创作了Jay-Z翻唱比利·乔尔(Billy Joel)的“We Didn't Start the Fire”等歌曲。

美国音乐出版商协会的埃里克·桑雷 (Eric Sunray) 撰写的一份白皮书认为,像MusicLM这样的AI音乐生成器通过“从训练数据库中吸收作品中连贯的音频,侵犯了美国版权法的复制权”。

进一步说,AI生成的音乐虽然是“原创”,但往往像不同音乐人作品的杂糅,也就是说有洗稿甚至是山寨的嫌疑。

因而此次谷歌运用DeepMind的水印技术SynthID生成的ID便是对版权问题的重视,谷歌表示,生成的所有歌曲都带有数字水印,人的耳朵听不见也不会影响音乐的效果。主要通过音频波转换为二维可视化来实现。即便数字水印遭受了添加噪声、音质压缩、音频调速等破坏性操作,仍然可以检测到歌曲中的水印。

但有分析师指出,尽管谷歌加了水印证明该音乐作品是AI创作而成却依旧没能解决根本问题,由AI系统生成的音乐到底算不算原创作品?可以和“人造音乐”同台竞技吗?

伴随着关注与争议,或许在不远的未来,这些问题都将有清晰的答案。

相关内容

热门资讯

“梦舟”为何要改变之前的“逃逸... 今天,我国成功组织实施梦舟载人飞船零高度逃逸飞行试验。与神舟飞船相比,梦舟飞船改变了“火箭负责逃逸、...
聚焦北大荒|延军农场:飞防出击... 近日,在延军农场跃进河管理区大豆示范地号上空,无人机正按照预设航线低空飞行开展飞防作业。每架无人机均...
指尖上的星河:吉尼斯纪录之夜背... 指尖上的星河:吉尼斯纪录之夜背后的故事 2025年6月17日21:00,重庆将动用11618架无人机...
浙江博高机电取得便携式空压机专... 金融界2025年6月17日消息,国家知识产权局信息显示,浙江博高机电科技有限公司取得一项名为“一种便...
“大模型”和“数据”汇聚,经开... 在北京经济技术开发区,位于国家信创园的“模数世界”成为最新一处明星产业空间。“大模型”和“数据”在此...
开放式耳机哪个牌子好?十款百元... 随着运动场景和通勤需求的增长,越来越多人开始关注开放式蓝牙耳机,相比传统入耳式,它们佩戴更轻盈、不闷...
长兴岛“LNG船产业链”捷报频... 上海长兴岛是我国规模最大、设施最先进、最具国际竞争力的造船基地,今年以来,岛上的“LNG船产业链”捷...
塔吊远程操控、施工机器人,住建... 21世纪经济报道记者李莎 呼和浩特报道 今年6月是第24个全国“安全生产月”,主题为“人人讲安全、个...
全球AI大会东京站落幕,千人齐... 潮新闻客户端 记者 张云山 近日,为期两天的“全球AI大会东京站”(Global AI Confer...
国芯科技抗量子密码卡新产品内部... 国芯科技(688262)6月17日晚间公告,公司研发的抗量子密码卡新产品CCUPHPQ01于近日在公...
阿毛实业取得通用型磁性植锡台专... 金融界2025年6月17日消息,国家知识产权局信息显示,深圳市阿毛实业有限公司取得一项名为“一种通用...
我国新一代载人飞船零高度逃逸飞... 央视网消息(新闻联播):6月17日,我国在酒泉卫星发射中心成功组织实施梦舟载人飞船零高度逃逸飞行试验...
物流“大动脉”含“智”量更足 ... 物流“大动脉”含“智”量更足 服务便捷性不断提升 央视网消息: 记者6月16日从国家邮政局了解到,...
慧博云通携金融科技解决方案亮相... 引言:数字经济时代,伴随科技应用水平的不断提高,传统行业纷纷开启数字化转型升级,各类新场景、新业态、...
国产割草机器人走俏海外 6月9日,山东港口青岛港,一艘满载外贸集装箱的货轮驶出港口。 俞方平摄(人民视觉) 浙江三锋实业股...
原创 百... 互联网大厂,开启新一轮AI人才储备竞赛! 从百度AIDU计划岗位招聘扩增超60%、薪资上不封顶,...
原创 从... 当我们聊到性价比手机时,曾几何时,红米总是占据了“性价比之王”的宝座。雷军的那句“生死看淡,不服就干...
PNAS发表长春科技学院李春义... 近日,《美国国家科学院院刊》(PNAS)发表了长春科技学院鹿茸科学与产品技术研究所李春义教授团队与苏...
湖北海跃重机取得新型立式对辊制... 金融界2025年6月17日消息,国家知识产权局信息显示,湖北海跃重机有限公司取得一项名为“一种新型立...
饿了么AI算法大赛决赛闭幕 将... 由中国互联网协会指导、饿了么主办的2025AI算法大赛,历时3个多月的激烈比拼后,6月17日在杭州终...