(原标题:君立华域申请基于深度学习和SimHash的数据分类方法及系统专利,实现大规模数据的快速、精确分类)
金融界2024年1月13日消息,据国家知识产权局公告,江苏君立华域信息安全技术股份有限公司申请一项名为“基于深度学习和SimHash的数据分类方法及系统“,公开号CN117390515A,申请日期为2023年11月。
专利摘要显示,本发明公开了基于深度学习和SimHash的数据分类方法及系统,包括:准备数据集并划分为训练集、验证集和测试集;对原始数据进行数据预处理;使用深度学习模型对预处理后的数据进行特征提取,得到特征向量;将特征向量输入基于SimHash创新的算法得到哈希编码;将哈希编码作为深度学习模型的输入,使用优化算法训练深度学习模型;重复以上两步,直至达到预设的迭代次数或准确率要求,则停止训练;使用测试集对训练好的深度学习模型进行测试,评估分类的准确率和性能。本发明通过结合深度学习和SimHash算法的快速哈希特性并加以改进,进一步提高了哈希值精度和数据分类的性能,实现了大规模数据的快速、精确分类。
本文源自:金融界
作者:情报员