金融界2024年3月16日消息,据国家知识产权局公告,科大讯飞股份有限公司申请一项名为“语音识别模型的训练方法、语音识别方法和相关装置“,公开号CN117711384A,申请日期为2023年12月。
专利摘要显示,本申请公开了一种语音识别模型的训练方法、语音识别方法和相关装置,该方法包括:获取若干样本音频段;利用语音识别模型分别对各样本音频段进行特征提取,得到各样本音频段的音频特征和至少一个场景特征,场景特征用于表征样本音频段的说话人、采集通道和所属音频源中的至少一者的信息;利用语音识别模型至少基于各样本音频段的音频特征,得到各样本音频段的样本识别文本;基于样本识别文本和样本音频段的标注文本之间的文本差异、以及各样本音频段的场景特征之间的特征相似度,调整语音识别模型。通过上述方式,本申请能够提高语音识别的准确性。
来源:金融界