(原标题:信立方取得基于视频的图文网页生成方法及装置专利,保证网页内容的准确性,便于用户阅读)
金融界2024年1月17日消息,据国家知识产权局公告,北京信立方科技发展股份有限公司取得一项名为“基于视频的图文网页生成方法及装置“,授权公告号CN117194818B,申请日期为2023年11月。
专利摘要显示,本发明提供一种基于视频的图文网页生成方法及装置,涉及互联网技术领域,方法包括:获取包括至少一组视频帧组的视频帧序列,以及获取各视频帧组对应的语音数据;对各语音数据进行语音识别;对各视频帧组进行OCR文字识别;针对每组视频帧组,基于对应语音识别得到的预测文本和对应文字识别得到的识别文本,结合结巴分词和拼音相似度,确定预测文本中存在待纠正词,并结合三元语言模型,利用对应识别文本对待纠正词进行替换;针对每组视频帧组,将替换后的文本或预测文本存放至区隔标记DIV标签中,以及将对应视频帧存放至与DIV标签关联的图片标签中,得到超文本标记语言HTML网页。本发明既保证了网页内容的准确性,又便于用户阅读。
本文源自:金融界
作者:情报员