赛道Hyper|字节推出实时双语真人互译模型
创始人
2025-08-04 05:40:55
0

作者:周源/华尔街见闻

技术的进步不在于发明更复杂的工具,而在于让工具更贴合人的需求。

——科技哲学家刘易斯・芒福德

全球化的推进让跨语言交流需求日增,在经济、文化、科技等活动中,顺畅沟通至关重要。

7月24日,字节跳动Seed团队推出端到端同声传译模型Seed LiveInterpret 2.0,在中英语音同传的效率与效能上表现不俗。

据称Seed LiveInterpret 2.0是首个延迟&准确率接近人类水平的产品级中英语音同传系统,在中英同传翻译质量达到业界SOTA的同时,实现了极低的语音延迟水平——这为跨语言交流提供了新选项。

这个模型引入了强化学习机制,在延迟、译文准确率和节奏控制上进行联合建模优化,从技术原理上为低延迟提供了支持。

目前,该模型已全量上线火山方舟平台。

Seed LiveInterpret 2.0主要在同声传译常见的延迟和准确率问题上实现了改进。就公开消息来看,其改进幅度较大,但在真实场景中的实际体验,仍需要时间做出回答。

但Seed LiveInterpret 2.0采用全双工语音理解与生成框架,接收源语言语音时即可开始生成目标语言语音,一定程度上能实现“边听边处理”。

据官方信息,该系统能实现语音延迟低至2s-3s,较传统机器同传平均等待时间减少超60%;在语音到文本场景中,其输出首字平均延迟仅2.21s,而在语音到语音场景中,输出延时也只有2.53s。

翻译准确率方面,专业同传译员按中英双向RealSI标准数据集打分,语音到文本的中英互译平均得分74.8分(满分100分);语音到语音翻译译音质量得分66.3分。

中英双向RealSI标准是字节跳动Seed团队用于评估中英同声传译系统性能的标准数据集。RealSI很可能是Remote Simultaneous Interpretation(远程同声传译)的缩写。

这些表现得益于团队技术调整。

引入双通路语音理解与生成架构,减少中间环节,有助提高效率和准确度;同时运用强化学习机制,在延迟、译文准确率和节奏控制上综合优化,设计结合单步与全局反馈的奖励机制,保障片段语义一致和整体逻辑连贯。

Seed LiveInterpret 2.0具备“0样本声音复刻”功能:无需提前录说话人声音,能实时采集对话语音即可模仿用户音色,用“原声”输出目标语言译文。

在会议、演讲等跨语种交流场景,这能降低听众理解难度,更好传递说话人语义和情绪,故而交流无滞涩,很自然。

在多次语音评测中,这套系统支持“中英双向语音到语音同传+声音克隆”,SVIP(语音译文有效信息比例)在zh-en方向67.8,en-zh方向64.7,音质、节奏和语调接近真人。

如国际会议中,发言人能听到自身音色的外语译文,利于把握节奏,也让听众更易接受信息。

语言学家诺姆・乔姆斯基认为,语言不仅是交流工具,更是思维和情感载体。该功能在传递信息时也传递情感,让交流更有温度。

Seed LiveInterpret 2.0的功能使其在多领域有用武之地。

比如在国际商务场景中,跨境谈判、跨国会议对实时准确翻译需求极强。以往语言障碍导致翻译环节耗时且质量不稳,该模型或能提升商务沟通效率与准确性,对国际贸易和投资有促进作用。

在教育领域,跨国学术交流和国际在线课程增多。该模型能为师生提供实时翻译,打破语言壁垒,方便获取国外教育资源,促进学术合作。

旅游场景也是双语交流需求的强维度,目前出境人数增多,语言问题常困扰游客。

若有人开发出基于Seed LiveInterpret 2.0模型的终端,比如整合进智能手机,那么终端就能成为更智能、体验更好的“随身翻译”,解决异国沟通麻烦。

字节跳动Seed团队发布Seed LiveInterpret 2.0,可能会给同声传译行业带来变化。

市场层面,以往同声传译多依赖人工,成本高且资源有限。随着机器同传技术发展,这类系统可能占据一定市场份额。这会促使传统服务提供者改进,如结合人工智能提升服务质量和效率,适应市场变化。

硬件设备制造商也迎来机会。Ola Friend耳机计划8月底接入该系统,成为首个支持其语音同传功能的硬件。未来或有更多智能硬件与之结合,提供更方便的跨语言交流工具。

目前Seed LiveInterpret 2.0仅支持中英互译,但端到端同传框架可扩展,未来有望支持更多语言,方便不同语言交流。

除现有场景,这个系统在其他领域也有潜力。

所谓“技术的真正力量不在于它本身有多强大,而在于它能连接多少可能性”(凯文・凯利),该模型未来拓展正连接更多跨语言交流可能。

相关内容

热门资讯

和讯投顾陈杰臻:8月重大事件较... 8月3日,和讯投顾陈杰臻称,8月重大事件较多:8月5号,2025集成电路物理和故障分析国际研讨会将在...
沣东新城机器人产业规模突破12... 本报讯(记者 牟荣荣)8月3日,记者从沣东新城了解到,获批秦创原机器人聚集区半年以来,区内机器人产业...
智博电子取得焊锡丝挤压机上料结... 金融界2025年8月2日消息,国家知识产权局信息显示,天津市智博电子科技有限公司取得一项名为“一种焊...
理想撞出了车圈最荒诞一幕 一辆看起来人畜无害的家用SUV,在马路上碰见一辆比你家客厅还大的重型卡车,你不仅没躲,还一脚油门怼了...
这周聊点啥:昨天梦里的VS今天... 这周的地球村上演了“赛博未来片”和“消费现实片”联播。 这边人形机器人刚组团出道,那边脑机接口又“治...
“电子鼻”闻味定量捉甲醛 “电子鼻”闻味定量捉甲醛 华科大团队研发 可应用于多种场景 湖北日报讯 (记者张歆、通讯员王潇潇)...
大幅提升建筑行业设计效率 【深圳商报讯】(记者 张郗郡)7月30日,深圳市毕鲁斯人工智能科技有限公司举行发布会,重磅推出Bil...
上海申欣川取得简易直线运输倒包... 金融界2025年8月2日消息,国家知识产权局信息显示,上海申欣川环保工程技术有限公司取得一项名为“一...
埃纳检测取得高密封性气控门专利... 金融界2025年8月2日消息,国家知识产权局信息显示,浙江埃纳检测技术有限公司取得一项名为“一种高密...
久吾高科钛石膏装备入选江苏“三... 本报讯 (吴晓倩 李丽) 近日,省工信厅公示了2025年度“三首两新”(首台套重大技术装备、首批次新...
研究人员构建临床试验数据库,为... 来源:市场资讯 (来源:DeepTech深科技) 多年来,美国伊利诺伊大学香槟分校博士毕业生、Kei...
浙江蓝圣智能装备取得一种调节阀... 金融界2025年8月2日消息,国家知识产权局信息显示,浙江蓝圣智能装备有限公司取得一项名为“一种调节...
赛道Hyper|字节推出实时双... 作者:周源/华尔街见闻 技术的进步不在于发明更复杂的工具,而在于让工具更贴合人的需求。 ——科技哲学...
为抖音视频创作焦头烂额?张伟的... 你是否还在为抖音视频的创作和发布焦头烂额?每天花费大量时间寻找素材、剪辑视频,晚上还要定闹钟起来发布...
江苏网仁智能取得污水检测探头专... 金融界2025年8月2日消息,国家知识产权局信息显示,江苏网仁智能科技有限公司取得一项名为“一种污水...
共享充电宝暗藏泄密风险 小心数... 共享充电宝,是当代都市人外出时给手机“续命”的“安心宝”。但是大家可能没有想到,共享充电宝也存在泄露...
奥莱克电子取得一种组合式音响专... 金融界2025年8月2日消息,国家知识产权局信息显示,东莞市奥莱克电子有限公司取得一项名为“一种组合...
原创 小... 一直以来,华为都是国产手机厂商中自研能力第一的扛把子,无论是芯片,相机还是其它元器件,华为都能自研,...
微软报告:受AI影响最小的20... 据美国《财富》杂志网站7月31日报道,尽管有很多关于人工智能(AI)对就业市场影响的悲观预测,但至少...
NASA的欧洲澄清器成功测试火... NASA的最大行星际探测器在火星飞掠期间测试了其雷达,结果包括详细图像,并为其在木星卫星欧罗巴的任务...