以假乱真,昆仑万维天工音乐大模型带来颠覆式AI体验
创始人
2024-04-03 12:59:48
0

原标题:以假乱真,昆仑万维天工音乐大模型带来颠覆式AI体验

昨日,昆仑万维AI音乐生成大模型「天工SkyMusic」开启了免费邀测活动,诚邀媒体、行业专家以及感兴趣的音乐从业者们共同体验人声情感表达 SOTA 的音乐大模型产品。

邀测开始后,广大用户对「天工SkyMusic」AI音乐生成大模型的热情远超我们的预期,工作人员在极短时间内收到了几十万份测试申请,其中包括众多专业的音乐创作人、媒体及行业专家,还有大量测试申请被源源不断地发至后台。

同时,我们也收到了大量来自用户的真实反馈与高度评价:

“人声很清晰 抒情旋律也好”

“好听!”

“这是天工做的??太厉害了!”

“《悟空》这首歌是演唱气息感的,感情很到位,基本上代表了生成情感以假乱真的能力巅峰之作”

“天工SkyMusic在高音演唱技巧上超出我的想象,非常优秀。”“太强了,1、AI音乐用户群体非常大;2、生成的音乐可以反复使用;3、很容易做社交裂变”“

副歌部分真丝滑,Beat真好”

“没想到中国团队做的东西比国外的好”

广大用户的热情反馈既然让我们看到了行业对于「天工SkyMusic」AI音乐生成大模型的高度期待,也让我们看到了在以“智力”为主的AGI大模型探索方向中,“情感AGI”的重要意义。

相比文本和图片,音频内容是理解人类情感最好的方式,而音乐又是人类情感表达最充沛、最不受地域和文化限制的内容载体,不论时代变幻,不论是战争还是灾祸,人们总是能通过音乐传递自己的感受并获得情感的慰藉。这是「天工SkyMusic」的创作初衷,也是昆仑万维情感AGI持续探索的重要方向。

我们感谢所有积极参与并热情反馈的用户们,感谢你们的支持、鼓励与陪伴,我们将持续迭代、优化、拓宽「天工SkyMusic」的能力边界,让模型具备更强的多模态情感理解与表达能力,为用户带来更优质的AI音乐体验。

最后,我们将很快给出「天工SkyMusic」音乐创作Prompt指南,并提供更多的AI音乐Demo与使用技巧,与用户一同探索AI音乐的强大魅力!

关于「天工SkyMusic」与「天工3.0」

「天工SkyMusic」AI音乐生成大模型基于昆仑万维「天工3.0」超级大模型打造。4月17日,「天工SkyMusic」将随「天工3.0」同步开启公测。

「天工3.0」采用4千亿级参数MoE混合专家模型,并将同步选择开源,是全球模型参数最大、性能最强的MoE模型之一。相较于上一代「天工2.0」MoE大模型,「天工3.0」在模型语义理解、逻辑推理、以及通用性、泛化性、不确定性知识、学习能力等领域拥有惊人的性能提升,其模型技术知识能力提升超过20%,数学/推理/代码/文创能力提升超过30%。同时,「天工3.0」新增了搜索增强、研究模式、调用代码及绘制图表、多次调用联网搜索等能力,并针对性地训练了模型的Agent能力,使得「天工3.0」能够独立完成规划、调用、组合外部工具及信息,以精准高效地完成产业分析、产品对比等各类复杂需求,带来全新的颠覆式人工智能体验。

「天工SkyMusic」是目前国内首款且唯一公开可用的AI音乐生成大模型,其采用音乐音频领域类Sora模型架构,Large-scale Transformer 负责谱曲,来学习 Music Patches 的上下文依赖关系,同时完成音乐可控性;Diffusion Transformer 负责演唱,通过LDM让Music Patches被还原成高质量音频,使得「天工SkyMusic」能够支持生成80秒44100Hz 采样率双声道立体声歌曲。这套模型架构在处理视频、音频和音乐领域效果极佳。昆仑万维团队也将在后续逐步迭代和添加新的能力,让模型具备多模态的情感理解与表达能力。

「天工SkyMusic」具有以下五大特点:

1. 高质量AI音乐

「天工SkyMusic」能够生成80秒44100Hz采样率双声道立体声AI歌曲,并可根据用户输入的歌词风格生成对应歌曲风格。

2. 人声“以假乱真”

人声合成是AI音乐生成中最重要、最能体现生成效果和品质的维度。「天工SkyMusic」的AI人声合成能够达到业内顶尖的SOTA水平,中文水平极为优秀,发音清晰、无异响。其中文演唱效果更是显著好于国外产品,领先世界水平。

3. 歌词段落控制

「天工SkyMusic」能够通过歌词来控制歌曲,让生成的歌曲可以明确分辨出不同歌词段落的情绪变化,体现出主歌和副歌、前奏和主歌的段落差异。

4. 多种音乐风格

「天工SkyMusic」支持说唱、民谣、放克、古风、电子等多种音乐风格,用户在创作音乐时,可以通过参考音频制定想要的音乐风格。

5. 音乐智能表达 - 歌唱技巧学习

「天工SkyMusic」同时能够学习如颤音、歌剧、吟唱、男女对唱,自动和声等多种歌唱技巧,让用户创作的歌曲得到更恰当的情感表达。

2023 年,昆仑万维在 “All in AGI 和 AIGC” 的战略推动下,在人工智能领域取得了许多进展,逐步形成了AI大模型、AI搜索、AI音乐、AI动漫、AI 社交、AI游戏等AI业务矩阵。

当前,昆仑万维已打造了集AI搜索、AI写作、AI长文本阅读、AI对话、AI语音合成、AI图片生成、AI漫画创作、AI图片识别、AI音乐生成、AI代码写作、AI表格生成等多项能力于一体的「天工3.0」多模态“超级模型”(Super Model),成为AI行业全新里程碑。

相关内容

热门资讯

百年古树倾倒前,可有精准 “把... 百年古树是自然与历史的珍贵遗产,其倾倒前的微小倾斜变化难以被肉眼察觉,而 HYS07 倾角传感器正是...
打造湾区智能养老高地!“广东造... 以智能机器帮助腿脚不便的老人家“恢复”上下楼能力、24小时陪护独居老人,监护安全指标……伴随老龄人口...
2025年“湾区杯”网络安全大... 在数字浪潮席卷全球、科技产业变革加速的当下,网络安全已从单一技术议题,跃升为关乎国家战略、企业发展与...
京津冀首批无人机机巢投入轨道巡... 近日,国铁北京局石家庄工务段新安装的无人机机巢正式上岗,开始对石太铁路进行巡检。据悉,2025年4月...
温州新可兰电气取得适配器插销结... 金融界2025年7月8日消息,国家知识产权局信息显示,温州新可兰电气科技有限公司取得一项名为“一种适...
小红书App品牌升级,启用新品... 新浪科技讯 7月8日上午消息,小红书App宣布新一轮品牌升级,正式启用品牌口号“你的生活兴趣社区”。...
原创 传... 昨晚,博主@i冰宇宙在微博晒出了传音一款还没发布的三折叠概念机——TECNO PHANTOM Ult...
梧州石垌5G基站点亮山村 在电信普遍服务十年建设新起点上,7月4日,中国电信梧州分公司在岑溪市波塘镇新廉村石垌成功开通2025...
西山科技获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示西山科技(688576)新获得一项实用新型专利授权,专利名为“...
(活力中国调研行)从“书架”到... 中新网西安7月8日电 题:从“书架”到“货架” 解码陕西科技成果落地转化“密码” 作者 杨英琦 “我...
福建和盛崇业电瓷取得耐锈蚀线轴... 金融界2025年7月8日消息,国家知识产权局信息显示,福建和盛崇业电瓷有限公司取得一项名为“一种耐锈...
长电科技申请封装结构及其形成方... 金融界2025年7月8日消息,国家知识产权局信息显示,长电科技管理有限公司申请一项名为“封装结构及其...
智能化测试成行业刚需:Test... 在 IT 行业加速数字化转型的今天,软件作为核心基础设施的地位愈发凸显。从金融系统的高频交易到智能汽...
自研多模态触觉传感技术,「模量... 文 | 张卓倩 编辑 | 袁斯来 36氪获悉,深圳市模量科技有限公司(以下简称「模量科技」)宣布完成...
晨光动态(834639)组织召... 7月6日上午,由中国电力企业联合会组织的浙江晨光电缆股份有限公司“1kV矿物绝缘电缆”及“26/35...
传苹果公司AI模型负责人庞若鸣... DoNews7月8日消息,据彭博社报道,苹果公司负责 AI 模型的最高主管庞若鸣将跳槽 Meta,这...
新能源装配新利器:高精度机器人... 随着新能源产业的快速发展,对电池与电机的装配精度提出了前所未有的挑战,这一需求正引领着机器人夹爪技术...
218个项目!全国智能机器人锦... 深圳新闻网2025年7月8日讯(深圳商报记者 陈发清)近日,2025全国颠覆性技术创新大赛智能机器人...
阿里云智能副总裁安筱鹏 | 工... AI大模型的融入能显著提升制造业的竞争力,其中包含两个风向标:第一个风向标是今年1月美国拉斯维加斯的...
南科大“空海潜”无人集群挺进深... 深圳商报·读创客户端首席记者 吴吉 通讯员 洪妍 7月7日,南方科技大学海洋高等研究院牵头,联合科研...