金融界2024年3月15日消息,据国家知识产权局公告,中国电信股份有限公司申请一项名为“语音识别方法、装置、电子设备和可读介质“,公开号CN117711377A,申请日期为2022年8月。
专利摘要显示,本申请提供一种语音识别方法、装置、电子设备和可读介质。该方法包括:获取语音数据;将语音数据与声纹特征库中的声纹特征进行特征匹配,得到目标声纹特征,声纹特征库中包括至少一个声纹特征,每个声纹特征对应于一个声学模型;通过目标声纹特征对应的目标声学模型和目标声学模型的M个相似声学模型,对语音数据进行语音识别,得到语音识别结果,其中,M为大于或者等于1的整数,M个相似声学模型的声纹特征与目标声纹特征相似。该方法能够避免对于口音或者特征接近的语音由于适配的识别引擎不准而导致的识别结果不准,提高了语音识别结果的准确性。
来源:金融界