科大讯飞声音复刻与超拟人能力迎突破 语音合成技术再升级
创始人
2025-06-28 10:00:40
0

6月26日,科大讯飞语音合成技术迎来全新升级,一句话声音复刻与超拟人合成两大核心能力实现突破。专业测评数据显示,公司一句话声音复刻技术在相似度、准确度等维度处于行业领先水平。

科大讯飞研究院院长刘聪表示:“我们希望声音不止于工具,更成为承载情感与个性的新维度,赋能更多场景行业、催生更多可能。”

2024年4月,讯飞星火APP上线“一句话声音复刻”功能,广受用户好评。本次技术突破,除星火语音大模型底座的基础和持续迭代外,还构建了一套三阶段层次化语音建模框架:首先通过星火底座大模型精确捕捉发音规律和韵律特征;其次,在音色恢复阶段解耦并重构声学特征;最后,通过高精度声码器恢复高保真波形。

据悉,在智能语音领域,声音复刻效果的核心指标围绕相似度与准确度两大维度展开。相似度决定“第一耳印象”,包含音色特质及风格韵味;准确度则关乎声音复刻是否好用,确保发音标准、停顿自然、语气连贯。

本次科大讯飞在声音复刻场景针对性进行两项关键技术的尝试与突破,一是音色编码增强,即在声学模型中创新性地融合全局声纹嵌入与局部帧级音色编码,提取细粒度音色特征,并构建声纹空间语义一致性损失函数,显著提升音色恢复的相似度;二是强化学习,通过语音鲁棒性评价模型和人工标注构建偏好数据集,采用基于DPO的强化学习策略,大幅提升合成语音的稳定性和自然流畅度。

从曾经要录上数十个小时的语音素材,到录入几段话,再到现在仅用一句话就能复刻声音,语音合成技术一直在向更快、更好、更易用的方向进阶。业内人士表示,一句话复刻技术的突破,显著降低了应用门槛,在AI赋能千行百业的大背景下,让更多的场景和行业衍生出更多的个性化需求。

值得一提的是,在需要深入交流的场景里,仅有相似音色并不足够。科大讯飞本次突破的超拟人合成技术,重点是赋予AI声音以“上下文情商”。通过研发上下文感知的语音生成系统,融合历史文本及对应音频特征,实现跨模态编码器分析上下文,让AI声音能像真人一般敏锐响应情绪转变和话题转换,整体自然度接近真人水平。

当前,科大讯飞AI语音技术已在各行各业落地生根,其中智能座舱领域应用成果最为显著。今年初,蔚来在“Banyan 榕 3.1.0版本”中为NOMI助手引入的超拟人情感音色,正源于科大讯飞的深度赋能,搭载该技术的蔚来新车型(如ET9、新ES6/EC6/ET5系列等),成为行业首款应用AI生成式语音合成框架的车型。除蔚来外,奇瑞、广汽、长城、日产、本田等主流车企均选择了讯飞超拟人技术。

其他行业方面,星火语音大模型技术底座已服务全国5万余所学校、600家医院及众多金融机构。

在教育领域,星火大模型赋能的AI学习机已能像真人教师般开展多轮对话诊断学情,为学生定制个性化学习路径;在数字内容创作领域,讯飞智作平台的超拟人数字人技术实现“一张照片+一句话录音”定制专属虚拟人,该技术已帮助天津大学教师打造慕课个人IP,简化教学视频制作流程;在医疗领域,搭载情感合成技术的导诊机器人使用方言与老年患者交流时,对话自然度提升200%。

相关内容

热门资讯

300余名中外嘉宾在昆明探讨科... 来源:中国新闻网 中新网昆明8月20日电 (记者 缪超)“2025智创未来国际论坛暨第一届面向南亚东...
身家10亿起的阿里码农,转投杭... 来源:市场资讯 (来源:21财闻汇) 作者:蔡婷 鄢子为 编辑:鄢子为 图源:视觉中国 阿里码农元...
AI芯片互联演进机会梳理 来源:市场资讯 (来源:君实财经) 我们认为Scale Up网络存在Scaling Law,Scal...
突围进行时 | 三重优势破局!... 编者按: 在自治区党委、政府高位推动下,内蒙古以“起跑就领先”的魄力,按下科技“突围”快进键,锚定稀...
湖北秭归:无人机“飞防”护航高... 8月19日,湖北省宜昌市秭归县沙镇溪镇长春村的高山梯田上空,两架无人机穿梭于翠绿稻浪间,精准向冷水稻...
vivo执行副总裁胡柏山:vi... 在“vivo会客厅”活动上,vivo执行副总裁、首席运营官、vivo中央研究院院长胡柏山表示,对于v...
国瓷材料数字技术工程师培训班开... 8月20日上午,在东营市人力资源和社会保障局指导下,由东营经济技术开发区和山东国瓷功能材料股份有限公...
原创 独... 哈喽大家好,今天来和大家聊聊我最近升级电脑的故事。 最近两年机械硬盘价格疯涨,反而固态硬盘价格猛跌,...
山西环宇高科取得钢结构生产加工... 金融界2025年8月20日消息,国家知识产权局信息显示,山西环宇高科新型建筑材料有限公司取得一项名为...
磁悬浮抛光机推动抛光工艺迈向新... 在制造业的广袤版图中,抛光工艺作为提升产品表面质量的关键环节,始终处于技术革新的前沿。从传统的手工打...
卫星时钟同步服务器 在气象监测... 在气象监测领域,时间的精准同步对于获取准确、可靠的气象数据至关重要。卫星时钟同步服务器作为一种高精度...
VR技术在国际中文教育资源建设... 随着数字技术的快速发展,虚拟现实(VR)技术为非物质文化遗产的保护与传承提供了新的机遇。在国际中文教...
缓解区域交通压力,未来科学城又... 记者8月20日从未来科学城集团获悉,位于未来科学城西区的七燕路(七辛北街-小沙河村北街)道路及管线工...
63次出手,超百亿资金,大厂们... 来源:界面新闻 文 | 壹览商业 李彦 编辑 | 木鱼 “你最近在看哪个机器人项目” 这是近...
湖北恩施:“AI医生”精准诊断... 近日,在湖北省恩施土家族苗族自治州的220千伏来凤变电站,“AI医生”的前端设备正在抓紧搜集“临床症...
“人工智能+制造”行动走深走实...   推动“人工智能+制造”行动走深走实,培育一批工业智能体,以工业智能体为抓手深化人工智能工业应用,...
小米旗下瀚星创投等入股纬钛机器... 天眼查工商信息显示,近日,纬钛机器人关联公司上海纬钛科技有限公司发生工商变更,原股东李俊彦、杭州泛钛...
盐城盐都新能源“链”就新质生产... 在盐都区远航锦锂的自动化生产车间里,一批批磷酸铁锂新型储能电芯产品正沿着生产线有序流转。这些电池不仅...
力箭一号“一箭七星”成功发射 ... 力箭一号“一箭七星”成功发射 再次承揽国际发射服务 央视网消息:8月19日15时33分,力箭一号运...
力箭一号“一箭七星”发射成功 从中科宇航技术股份有限公司(以下简称中科宇航)获悉,2025年8月19日15时33分,中科宇航力箭一...