荣耀阿尔法战略深化,端侧AI技术获国际语音顶会认可
创始人
2025-08-24 14:22:21
0

8月17-21日,国际音频领域顶级会议INTERSPEECH在荷兰鹿特丹举办。荣耀联合上海交通大学完成的两篇聚焦端侧多语种任务的研究成果成功入选INTERSPEECH2025录用论文,并受邀在会议上作技术发表。作为全球语音科学与技术领域最具权威性的学术会议之一,INTERSPEECH的认可体现了荣耀在端侧AI语音技术领域的持续努力与技术积累,这表明荣耀在全球化的AI技术交流中,取得了一定进展。

双论文入选国际顶会

INTERSPEECH作为国际音频领域顶级会议,其收录论文代表着全球语音技术研究的最前沿方向。荣耀的两篇论文成功入选,聚焦的正是当前端侧AI语音技术的核心难题——如何在移动设备有限的算力与存储资源下,实现媲美云端的多语种实时语音识别与通话翻译体验。

荣耀两位AI专家在荷兰鹿特丹INTERSPEECH学术交流现场作技术发表

据了解,荣耀研发团队与上海交通大学的联合攻关,针对“端侧实现高准确率、高响应速度翻译体验”的技术痛点提出独创性解决方案,相关技术已成功转化为可落地的端侧多语种通话翻译功能,实现了从学术研究到产业应用的无缝衔接。

构建全球首个端侧语音大模型

在移动互联网时代,语音已成为人机交互的核心入口,而端侧语音技术的突破直接关系到用户体验。长期以来,行业面临着两难困境:依赖云端处理的语音翻译方案存在隐私泄露风险,而传统端侧方案又受限于设备算力,难以实现实时性与准确性的兼顾。

荣耀的研究项目启动之初就确立了“纯端侧实现媲美云端的通话翻译体验”的目标,这意味着研发团队必须在算力、存储、功耗多重约束下,解决两大核心挑战:一是如何让AI在极短时间内精准识词,实现低延迟与高准确率的平衡;二是如何在有限资源下保证翻译响应的流畅性与实时性。

经过多次技术迭代,荣耀团队创造性地提出两大技术方案:其一,通过创新的注意力机制与决策策略结合,让端侧AI实现流式语音识别能力,无需等待用户说完整句话即可启动识别与翻译,彻底打破传统方案的延迟瓶颈,真正做到“边说边识别”;其二,提出全新的投机采样推理模块,通过直接与主模型的“大脑”协同工作,即时读取并利用主模型已经形成的“记忆”和“思路”来高效预测接下来可能出现的词,在不降低准确性的前提下实现推理速度的显著提升。

这两项技术方案不仅通过了权威学术评审,同时在实测中展现出强大性能:将传统方案3-4GB的内存占用压缩至800MB,节省75%存储空间;翻译准确率提升16%,推理速度提升38%,真正实现了“小而美”的突破。

依托这些技术创新,荣耀成功构建起全球首个端侧语音大模型,将中、英、德、法、西、意等6个语种包嵌入仅0.8B参数量的模型中,用户无需额外下载语音包即可实现多语种互译,且支持离线使用——这意味着即便在无网络环境下,语音数据也能在本地完成处理,从源头保障隐私安全。

荣耀AI技术矩阵构建全生态体系

荣耀在端侧AI语音技术领域的突破,并非偶然,而是品牌长期深耕AI战略的必然结果。自阿尔法战略公布以来,荣耀在AI技术领域的投入始终保持“持续性”与“前瞻性”,从AI体验落地到技术开源,再到端侧语音大模型突破,形成了清晰的战略演进路径。

此前,在世界人工智能大会(WAIC)期间,荣耀正式发布自研多模态感知大模型——MagicGUI大模型。作为荣耀推出的首个GUI开源大模型,MagicGUI以7B(70亿)参数规模,支撑底层AI智能体的多模态感知与自动执行规划能力,比肩SOTA模型达到行业领先水平。

相关内容

热门资讯

炒菜机器人大赛在京平谷开赛 绘... 8月22日,由中国食品工业协会与北京市平谷区人民政府联合主办,农业中关村现代食品营养谷、首都共享中央...
西安企业承担设计 中科宇航液体... 近日,由西安企业——中国启源工程设计研究院有限公司所属新时代设计承担设计的中科宇航液体动力系统试验中...
兵马俑弹吉他、商代凤鸟翩翩欲飞... 央视网消息:如今,我们在刷短视频的时候,经常会看到文物“活起来”、照片“动起来”,甚至吹拉弹唱、载歌...
我国算力规模年增速达30%,专... IT之家 8 月 24 日消息,以“算网筑基智引未来”为主题的 2025 中国算力大会昨日开幕。据央...
研学游 目标瞄准品质优 暑期,寓教于乐的研学游成为文旅消费热点。感知人工智能、参观航天发射、探秘热带雨林……一批研学游产品研...
吉林大学白求恩第二临床医学院顺... 8月22-23日,白求恩第二临床医学院在吉林大学中心校区顺利开展2025级本科生迎新工作。吉林大学党...
应对遗传瓶颈 北京首次开展境外... 麋鹿作为我国特有物种,经历了从繁盛到本土灭绝的沧桑历程。40年前的8月24日,22只麋鹿从英国重回北...
联想集团陈振宽:算力、模型和应... 来源:新浪财经 新浪科技讯 8月23日下午消息,2025中国算力大会在山西大同举办。联想集团副总裁、...
人工智能的滥用,到底怎么治? 人工智能的滥用,到底怎么治? 声音和形象被AI合成滥用的事儿正变得越来越多。比如本周,奥运冠军全红...
原创 宇... 今天咱来聊聊宇宙里那些让人捉摸不透的 “狠角色”—— 超大质量黑洞。最近的研究可太让人惊讶了,宇宙中...
百度AI转型路:旧引擎减速,新... 在人工智能(AI)技术风起云涌的时代背景下,互联网巨头百度的最新财务报告揭示了其在转型征途上的坎坷与...
原创 难... 难以置信!六架C919已经退役,为什么? 大家好啊 我是大米。最近看到一个消息 让大米我真是五味杂陈...
中国工程院院士张宏科:智算融合... 来源:滚动播报 据人民邮电报消息,8月22日至24日,2025中国算力大会在山西省大同市举行。中国工...
金观平:着力建设便捷高效的智慧... 政务咨询AI机器人提供全天候智能咨询,一体化业务系统优化医疗服务体验,智慧城管系统提升城市环境品质…...
刚刚,苹果AI华人总监跳槽Me... 新智元报道 编辑:元宇 好困 【新智元导读】苹果AI再遭重创,核心工程师Frank Chu被曝加入...
魅族22新机再延期:官方致歉并... 魅族科技近期在其官方微博上发布了一则重要通知,关于备受期待的魅族22新机的发布时间再次调整。公司在公...
从清北退学的年轻人,当月入五千... 与其浪费时间,不如直接退学 还有一年就要从北大医学院毕业的大三学生阿布,决定从北大退学了。 阿布提交...
太钢不锈公布“一种生产保护渣过... 天眼查APP显示,近日,山西太钢不锈钢股份有限公司申请的“一种生产保护渣过程中浆料的制备方法”专利公...
石家庄鹿泉区——电子信息产业聚... 新一代电子信息产业是河北省石家庄市的主导产业,产业集中承载地在该市鹿泉区,已形成半导体芯片、现代通信...
即时零售,吹响了产业互联网来临... 未来的某一天,当我们回看今年的互联网行业,即时零售绝对是一个不可被忽视的存在。事实上,即时零售之所以...