(原标题:科大讯飞申请语音识别相关专利,提升语音识别效果)
金融界2023年12月4日消息,据国家知识产权局公告,科大讯飞股份有限公司申请一项名为“语音识别方法、装置、设备及存储介质“,公开号CN117153152A,申请日期为2023年10月。
专利摘要显示,本申请公开了一种语音识别方法、装置、设备及存储介质,在对输入语音进行识别时,通过编码器对输入语音进行编码,得到音频编码向量,利用融合有大语言模型的解码器处理输入数据并解码得到识别文本。本申请在语音识别模型的解码器中融合大语言模型的网络结构,从而实现将大语言模型与语音识别模型的深度结合,借助大语言模型的建模能力提升语音识别模型中解码器的解码能力,进而提升语音识别效果。输入数据可以包括音频编码向量,或者可以包括音频编码向量和提示指令信息,该提示指令信息包括用于辅助对输入语音进行识别的辅助信息,从而为解码器提供更加丰富的参考信息,辅助进一步提升语音识别效果。
本文源自:金融界
作者:情报员