(原标题:高凌信息申请环境声音识别专利,能够降低分类识别的过拟合风险)
金融界2024年1月5日消息,据国家知识产权局公告,珠海高凌信息科技股份有限公司申请一项名为“基于深度学习复合模型的环境声音识别方法及装置“,公开号CN117351995A,申请日期为2023年9月。
专利摘要显示,本发明提出了一种基于深度学习复合模型的环境声音识别方法及装置,该方法包括:获取环境音频,对环境音频进行特征提取得到环境音频特征,将环境音频特征输入预先训练好的复合模型,复合模型包括多个网络结构不同的通用模型;通过通用模型识别出各个类别标签对应的通用识别置信度;基于通用模型的模型权值和通用识别置信度,确定各个类别标签的目标加权置信度作为通用模型的分类输出结果;根据目标加权置信度的均值得到复合模型的输出结果。根据本发明实施例的技术方案,能够通过多个不同网络结构的通用模型对环境音频识别的置信度进行加权融合,能够降低分类识别的过拟合风险,增强泛化能力,能够在长期使用场景下维持对环境音频识别的准确性。
本文源自:金融界
作者:情报员