金融界2024年2月5日消息,据国家知识产权局公告,腾讯科技(深圳)有限公司取得一项名为“音频场景识别方法、装置、设备及计算机可读存储介质“,授权公告号CN112750459B,申请日期为2020年8月。
专利摘要显示,本申请提供了一种音频场景识别方法、装置、设备及计算机可读存储介质;方法包括:对待识别的音频信号进行音频片段提取,得到第一音频片段和第二音频片段;其中,第一音频片段包含第二音频片段、且第一音频片段的时长大于第二音频片段的时长;获取第一音频片段的动态音频特征,及第二音频片段的动态音频特征;将第一音频片段的动态音频特征输入第一识别模型中,对所述音频信号进行音频场景识别,得到第一识别结果,并将第二音频片段的动态音频特征输入所述第一识别模型中,对所述音频信号进行音频场景识别,得到第二识别结果;结合所述第一识别结果和所述第二识别结果,确定所述音频信号对应的音频场景。通过本申请,能够提高音频场景识别精度。
来源:金融界
上一篇:华为目前比较好的机型都有哪些呢
下一篇:深圳加快打造超强算力集群