金融界2024年3月12日消息,据国家知识产权局公告,科大讯飞股份有限公司申请一项名为“文本问答方法、视觉语言模型的训练方法及其相关装置“,公开号CN117690144A,申请日期为2023年11月。
专利摘要显示,本申请公开了一种文本问答方法、视觉语言模型的训练方法及其相关装置,该方法包括:获取目标文本图像以及关于目标文本图像的目标问题;利用视觉语言模型中的视觉编码器对目标文本图像进行视觉编码,得到第一目标特征;以及,利用视觉语言模型中的文本编码网络对目标文本图像进行文本编码,得到第二目标特征;利用视觉语言模型基于第一目标特征、第二目标特征和目标问题,得到目标问题的目标答案。通过上述方式,本申请能够提高问答准确率。
来源:金融界