金融界2024年1月19日消息,据国家知识产权局公告,中国电信股份有限公司申请一项名为“声纹识别方法、声纹模型训练方法、装置、设备及介质“,公开号CN117423341A,申请日期为2023年10月。
专利摘要显示,本发明提供一种声纹识别方法、声纹模型训练方法、装置、设备及介质,所述方法包括:获取目标说话对象语音,及其对应的对抗样本语音;对目标说话对象语音和对抗样本语音进行特征提取,得到第一FBank声学特征和第二FBank声学特征;将第一FBank声学特征和第二FBank声学特征输入到训练好的声纹模型中进行识别,输出第一声纹特征向量和第二声纹特征向量,训练好的声纹模型是基于多尺度特征聚合和多损失融合的对抗学习训练的声纹模型;基于第一声纹特征向量和第二声纹特征向量的相似度,确定对抗样本语音的声纹识别结果。通过本发明提供的方法,可以准确的确定语音和对抗样本是否属于同一个说话对象,从而提高了声纹识别的准确率。
来源:金融界