金融界2024年2月6日消息,据国家知识产权局公告,腾讯科技(深圳)有限公司申请一项名为“视频处理方法、装置、设备以及介质“,公开号CN117524229A,申请日期为2022年7月。
专利摘要显示,本申请实施例提供了一种视频处理方法、装置、设备以及介质,方法包括:获取待处理视频所包含的M个视频帧,获取M个视频帧中每一个视频帧分别对应的字幕文本;根据字幕文本对M个视频帧进行组合,得到N个视频帧集合;根据N个视频帧集合中的相邻视频帧之间的时间间隔,获取每个视频帧集合所对应的字幕文本在待处理视频中的持续时间段;根据持续时间段对待处理视频对应的音频数据进行裁剪,得到每个视频帧集合对应的字幕子音频;根据每个视频帧集合对应的字幕子音频,以及每个视频帧集合对应的字幕文本,生成用于训练语音识别模型的样本数据。采用本申请实施例,可以提高语音识别模型的样本数据获取效率。
来源:金融界