钉钉会议DR-SwWPE算法登上国际顶会ICASSP2024
创始人
2024-04-19 19:08:26
0

原标题:钉钉会议DR-SwWPE算法登上国际顶会ICASSP2024

4月14日-19日,国际声学、语音与信号处理会议ICASSP 2024在韩国首尔举办。在本次会议上,钉钉蜂鸣鸟音频实验室负责人冯津伟携全球首个集自适应滤波器和神经网络的混合架构的DR-SwWPE算法亮相,该算法实现了利用AI技术解决视频会议中关键的音频难题“去混响”,并已落地于钉钉F1、F2等视频会议一体机,相关论文被ICASSP 2024收录。

ICASSP是全世界规模最大、最全面的声学、语音和信号处理方面的国际会议,也是语音技术领域最具影响力的顶级学术会议之一,来自全球各地的学者、应用厂商代表共聚一堂,分享声学领域的最新研究成果,交流技术创新和落地场景应用,探讨全球语音技术的发展趋势。

在实际环境中,声音在会议室等密闭空间中传输会不可避免地与房间的墙面、天花板等发生反射和衍射,从而产生混响。去混响是语音领域最基础的、也是最难解的问题之一,在过去的一段时间里,全球的研究者们一直在努力尝试解决,但进展不明显。

在这一最前沿技术的国际舞台上,冯津伟介绍了钉钉蜂鸣鸟实验室提出的DR-SwWPE算法的研究背景、研究过程及最新应用成果,吸引了众多与会者参与讨论。其中,声学领域泰斗级专家 IEEE Fellow Tomohiro Nakatani 对这一算法突破给予了高度评价,他表示,这一算法在他的经典WPE算法理论上又做了进一步扩展,不仅有理论意义,也具有实用意义。 

(冯津伟和 Tomohiro Nakatani 在论文前合影)

冯津伟介绍道,一个优秀的去混响算法需要满足对远场语音直达声失真尽可能小,保持比较高的目标语音PESQ指标,同时尽量将混响感降低,提升SRMR指标。面对现实中高动态范围的房间声学环境,去混响算法能够有较强的泛化能力和声学环境自适应能力,让远程会议声如其境。钉钉蜂鸣鸟实验室提出的最新DR-SwWPE算法则做到了这一点。

DR-SwWPE以data-resuse technique为出发点,通过严谨的数学推导和分析,首次从学术角度提出并且验证了麦克风阵列可以用自适应滤波器(adaptive filter)和神经网络(neural network,见下图)混合架构完成去混响任务。

这一架构提供了一个技术拓展平台,任何最新的自适应滤波器算法或者神经网络的算法都可以集成进这个混合架构之中,为行业去混响技术的发展也提供了更多想象空间。基于DR-SwWPE的线性自适应学习能力,其自适应滤波器部分可以有效处理混响中的线性部分,而神经网络的非线性建模能力能够有效处理混响中的非线性部分,二者结合形成互补,补足了当前各种纯自适应滤波器算法或者纯神经网络算法的不足。

此次,钉钉音视频DR-SwWPE登上ICASSP 2024这一顶级学术会议,代表着其背后的音频技术在学术领域进一步得到广泛认可。与此同时,另一篇关于个性化语音活动检测器VAD的研究论文也亮相此次会议,该算法的计算复杂度低和时延短,适合应用在实时会议系统中实现目标说话人的智能辨识,并有效抑制在开空间会议时周围人声的干扰音,提升语音质量。

钉钉蜂鸣鸟音频实验室旨在用传统信号处理结合深度学习算法,来解决实时语音通信碰到的复杂问题,提升钉钉会议的产品体验,并探索下一代音视频形态。其重点研究方向包括音频3A算法、多通道降噪去混响、声源定位、音视频多模态算法等。

相关内容

热门资讯

新疆建科院多种“节能降耗”材料... 这两天,在乌鲁木齐、乌苏等地工程项目建设现场,由新疆建筑科学研究院自主研发的高韧性混凝土、通用低碳土...
天津港集团董事长褚斌,会见36... 双方就港口数字化转型、网络安全、人工智能应用等领域合作,进行了深入交流。 日前,天津港集团党委书记、...
陕西国企依托设备技改勇拓市场 7月1日,在陕西化建工程有限责任公司(以下简称“陕西化建”)延安原油储备库及配套设施项目施工现场,一...
马斯克宣布特斯拉对xAI投资将... 7月14日消息,据财联社报道,特斯拉首席执行官埃隆·马斯克公开表示,特斯拉对人工智能初创公司xAI的...
2025千元机推荐:性价比高的... 对于预算有限但追求品质的用户来说,选择一款“性价比高的千元机”是一件既实用又讲究门道的事。千元级别的...
上海,努力让内容创作者“有归属... 距离B站公司200米、与抖音总部相距1000米,这是科技MCN公司“前进四”引以为傲的地理便利。这段...
月球背面月壳磁场弱土壤磁性强之... 记者13日从中国科学院地质与地球物理研究所获悉,基于嫦娥六号月壤样品,该所李金华研究员领衔的研究团队...
固态电池催化BMS技术升级,芯... 不论是日前的充电宝召回风波,还是此前的新能源车自燃,随着身边的锂电池数量不断增长,容量不断提升,安全...
文化杂谈 | 算法造的烟花“神... 近期,不少电影路演、综艺节目都在跳最新神曲《大展鸿图》,明星们笨拙地模仿着“别墅里面唱K,水池里面银...
腾讯陈冬:中国数字游戏技术助力... 封面新闻记者 欧阳宏宇 用数字化复刻喜峰口长城,通过3D建模还原北京“中轴线”,借助数字孪生技术重现...
深惠电子印章实现互信互认 深圳新闻网2025年7月14日讯 (深圳晚报记者 李超 通讯员 马玮珣) 近日,深圳与惠州正式实现电...
全国科技活动周深圳系列活动精彩... 深圳商报·读创客户端记者 刘娥 为响应2025年全国科技活动周活动号召,深圳市科学技术协会近期在科技...
埃斯特智能科技申请基于视觉检测... 金融界2025年7月14日消息,国家知识产权局信息显示,埃斯特(深圳)智能科技有限公司申请一项名为“...
苹果或于9月第2周举办秋季新品... 近日,彭博社记者Mark Gurman爆料称,苹果极有可能于9月第2周举办发布会,推出iPhone ...
舞阳县北舞渡镇卫生院:智慧赋能... 为将疾病防控与基层医院医防融合管理能力进行全面融合,舞阳县北舞渡镇卫生院依据本院服务人员的疾病谱类别...
月壤变身建材,中国科技助力月球... 在月球那极端温差、宇宙辐射与微陨石撞击的严酷环境中,人类长久定居的梦想面临着前所未有的挑战。传统的地...
千架无人机来助“嗨” 如东燕京... 举杯共饮于九霄之上,海星闪烁于银河天际。7月13日,“ZUI美如东 干杯燕京”2025江苏如东燕京啤...
青少年的“发明盛宴”!一场科创... 近两千名怀揣奇思妙想的青少年“发明家”在广州集结! 7月12日,2025年全球发明大会中国区广东赛区...
风力发电沙盘仿真设备模型,火力... 风力发电沙盘仿真设备 1、参考规格尺寸:长2.8米×宽1.2米×高1.2米。 2、电源:220V.5...
逐日工程2.0即将完成测试,空... 中国工程院院士、西安电子科技大学教授段宝岩在第27届中国科协年会专题论坛上透露,其率领的科研团队正紧...