首页 - 财经 - 滚动新闻 - 正文

蚂蚁开源万亿参数强化学习高性能权重交换框架Awex

来源:财闻 2025-11-20 10:15:43
关注证券之星官方微博:

(原标题:蚂蚁开源万亿参数强化学习高性能权重交换框架Awex)

11月20日,蚂蚁开源官微发文,蚂蚁集团宣布开源万亿参数强化学习高性能权重交换框架Awex。

据介绍,Awex 是为极致性能打造的训练推理引擎权重同步框架,解决强化学习(Reinforcement Learning,简称 RL)流程中训练权重参数同步到推理模型的核心难题,可在秒级完成 TB 级大规模参数交换,显著降低 RL 模型训练延迟。

Awex 是蚂蚁 ASystem 强化学习系统的核心组件之一,而 ASystem 是百灵万亿模型训练的坚实基础。蚂蚁表示,将在未来陆续开源 ASystem 的其他核心 RL 组件,进一步完善开源强化学习训练生态。

强化学习(Reinforcement Learning,简称 RL)已经成为大模型后训练的核心技术。从 ChatGPT 的 RLHF,到 DeepSeek/Claude/Llama 的后训练体系,都依赖强化学习让模型更符合人类偏好、具备更强的推理能力,进一步扩大模型智能边界。

今年10月,蚂蚁集团开源了两款业界领先的万亿参数旗舰模型,包括非思考的 Ling-1T 和思考模型 Ring-1T。其中 Ring-1T 基于我们自研的高性能权重交换框架 Awex(Asystem Weight Exchange Framework),实现了在数千卡 GPU 集群上5~10秒内完成万亿参数级别的权重同步。

微信
扫描二维码
关注
证券之星微信
APP下载
下载证券之星
郑重声明:以上内容与证券之星立场无关。证券之星发布此内容的目的在于传播更多信息,证券之星对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至jubao@stockstar.com,我们将安排核实处理。如该文标记为算法生成,算法公示请见 网信算备310104345710301240019号。
网站导航 | 公司简介 | 法律声明 | 诚聘英才 | 征稿启事 | 联系我们 | 广告服务 | 举报专区
欢迎访问证券之星!请点此与我们联系 版权所有: Copyright © 1996-