(原标题:腾讯公司申请大语言模型专利,为训练得到具有更优性能的大语言模型提供了更加丰富、训练效果更好的数据基础)
金融界2023年12月4日消息,据国家知识产权局公告,腾讯科技(深圳)有限公司申请一项名为“大语言模型训练方法、文本处理方法及装置”,公开号CN117149989A,申请日期为2023年11月。
专利摘要显示,本申请实施例提供了一种大语言模型训练方法、文本处理方法及装置,涉及人工智能、云技术、自然语言处理及机器学习等领域。该方法包括:获取训练样本集;训练样本集包括多个训练样本;多个训练样本包括多个第一训练样本和多个第二训练样本;第一训练样本为预测准确度大于预设阈值的训练样本;第二训练样本为预测准确度小于预设阈值的训练样本;基于训练样本集对初始奖励模型进行训练,得到训练好的奖励模型;基于奖励模型对预训练大语言模型进行训练,得到训练好的大语言模型。本申请实施例为训练得到具有更优性能的大语言模型提供了更加丰富、训练效果更好的数据基础,更好的满足了实际应用需求。
本文源自:金融界
作者:情报员