金融界2024年4月23日消息,据国家知识产权局公告,华为技术有限公司申请一项名为“一种数据处理方法及相关设备“的专利,公开号CN117917702A,申请日期为2022年10月。
专利摘要显示,本申请实施例公开了一种数据处理方法,该方法应用于文本识别/字符识别场景,该方法包括:获取输入数据,该输入图像为图像数据或音频数据,并根据输入数据的第一模态特征获取第二模态特征,第一模态特征为图像数据的视觉特征或者音频数据的音频特征,第二模态特征为字符特征;再融合第一模态特征与第二模态特征以得到目标特征,可以高效融合不同模态数据的信息,使得获取的目标特征具有多模态数据的特性,提高目标特征的表达能力。从而根据该目标特征获取的第一识别结果的精度更高。且相较于只根据纠正后的第二模态特征确定识别结果的方法,通过再次引入纠正前的第一模态特征,可以减少第二模态特征的过度纠正问题。
来源:金融界