(原标题:东软集团申请基于区块链的语料标注方法专利,该专利技术能提高标注一致性、防止标注过程信息泄露以及提高标注效率)
金融界2024年1月12日消息,据国家知识产权局公告,东软集团股份有限公司申请一项名为“基于区块链的语料标注方法、装置、存储介质及电子设备“,公开号CN117390669A,申请日期为2023年9月。
专利摘要显示,本公开涉及一种基于区块链的语料标注方法、装置、存储介质及电子设备,方法包括,获取第一加密数据集合和第二加密数据集合,基于第一加密数据集合和第二加密数据集合,确定各个第二加密数据分别对应的聚类密度,获取与目标第二加密数据之间的距离小于预设参数距离的目标第一加密数据,将目标第二加密数据对应的语料的标签确定为目标第一加密数据对应的语料的标签,在满足预设循环条件的情况下,从第一加密数据集合中去除目标第一加密数据,得到更新后的第一加密数据集合,返回步骤:基于第一加密数据集合以及第二加密数据集合,确定各个第二加密数据分别对应的聚类密度,该方法可以提高标注一致性、防止标注过程信息泄露以及提高标注效率。
本文源自:金融界
作者:情报员