金融界2025年5月1日消息,国家知识产权局信息显示,华院计算技术(上海)股份有限公司申请一项名为“一种字幕生成模型设计方法、装置、存储介质和程序产品”的专利,公开号CN119893015A,申请日期为2025年1月。
专利摘要显示,本发明提供一种字幕生成模型设计方法、装置、存储介质和程序产品,涉及自然语言处理技术领域。其中,字幕生成模型设计方法包括:输入一段语音和对应的正确内容,以及字幕单行最大限制字数;使用基于深度学习的人声检测模型进行人声检测;使用预训练的深度模型进行语音识别;使用所述正确内容与识别文字进行匹配、校正,得到字幕文字;根据字幕单行最大限制字数,对字幕文字进行分行、整合,得到最终字幕成果。本发明生成的字幕综合考虑实际的语音停顿及文本语言习惯,字幕与音频呈现更高的匹配度,且字幕文字更加易读;本发明同时考虑了设备限制或人为规定的字幕单行最大限制字数,进一步提高了生成字幕的可读性。
天眼查资料显示,华院计算技术(上海)股份有限公司,成立于2002年,位于上海市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本10426.4893万人民币。通过天眼查大数据分析,华院计算技术(上海)股份有限公司共对外投资了20家企业,参与招投标项目147次,财产线索方面有商标信息89条,专利信息209条,此外企业还拥有行政许可2个。
来源:金融界