金融界2024年1月17日消息,据国家知识产权局公告,腾讯科技(深圳)有限公司取得一项名为“声音场景的识别方法、装置、设备及存储介质“,授权公告号CN112750448B,申请日期为2020年8月。
专利摘要显示,本申请公开了一种声音场景的识别方法、装置、设备及存储介质,涉及音频技术领域。该方法包括:获取音频信号;对音频信号进行特征提取,得到音频特征;根据音频特征对音频信号进行至少两级场景识别,得到至少两级场景识别结果,场景识别结果中包含不同场景类别对应的场景概率;基于至少两级场景识别结果,确定音频信号对应的目标场景类别;其中,不同级别场景识别结果中包含的场景类别不同,且对于第i级场景识别结果中的任意场景类别,第i+1级场景识别结果中存在与场景类别对应的父类场景类别。采用本申请实施例提供的方案有助于提高声音场景的识别准确率。
来源:金融界