首页 - 财经 - 行业新闻 - 正文

九章云极发布新AI慢思考模型,开放性技术路径赋能复杂推理

来源:财经报道网 2025-03-13 15:54:18
关注证券之星官方微博:

(原标题:九章云极发布新AI慢思考模型,开放性技术路径赋能复杂推理)

近日,中国人民大学STILL项目团队、北京智源研究院团队、九章云极DataCanvas联合发布了大模型慢思考推理系列研究成果:在DataCanvas Alaya NeW智算操作系统上完成初步复现类R1推理模型,并向外界完整开源了强化学习与监督微调的训练代码与训练数据。进一步,创新性提出使用代码工具来增强模型推理性能,在AIME 2024数学推理测试中超越DeepSeek-R1的模型性能。

该研究成果发布在知名技术社区GitHub后,引发了广泛关注。

自DeepSeek-R1技术报告公布后,慢思考推理模型的复现仍然面临训练细节缺失、超参数调试复杂等共性难题,九章云极DataCanvas联合团队通过AI基础设施深度融合?实现突破。研究开源了该模型在DataCanvas Alaya NeW智算操作系统上完成的强化学习与监督微调全过程完整训练日志、训练数据及容器化部署方案,为当前大多数的复杂推理大模型复现提供了从理论到实践的完整闭环支持。

值得关注的是,DeepSeek以及蒸馏模型在推理过程中无法调用外部代码工具。针对这一问题,该研究结果介绍了九章云极新的工具增强推理模型STILL-3-Tool-32B在AIME 2024基准测试上的领先表现。研究结果显示,该模型在AIME 2024基准测试中取得了81.70%准确率(采样),超越了DeepSeek-R1满血版,以15.56%的显著优势超越其基座训练模型,与OpenAI o3-mini持平,并超越OpenAI o1。



研究结果显示,DataCanvas Alaya NeW智算操作系统在开源工具链与基座模型适配、算法与算力协同、逻辑推理与多步决策等复杂任务框架方面表现出明显优势。业界人员表示,这一成果不仅验证了九章云极在大模型慢思考推理、强化学习训练框架方面的深厚积累,也为开源模型复现提供了新的思路和方法。

在业界看来,完整复现DeepSeek-R1模型存在较高技术门槛,但也为此带来较大研究契机。此前包括HuggingFace、伯克利大学、上海交大等机构均有相关复现研究,九章云极凭借强大的技术储备和人才储备,通过长期深耕,系统掌握大模型慢思考推理技术。同时,九章云极注重技术的开源与产品化,致力于让普通开发者像拼乐高积木一样快速搭建出类R1性能的推理模型,实现了 "低成本高回报" 的技术跃迁。

据悉,该相关研究成果已形成论文《An Empirical Study on Eliciting and Improving R1-like Reasoning Models》,已在全球科研人员前沿成果预印版论文网站arXiv发表。



本文来源:财经报道网

微信
扫描二维码
关注
证券之星微信
APP下载
下载证券之星
郑重声明:以上内容与证券之星立场无关。证券之星发布此内容的目的在于传播更多信息,证券之星对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至jubao@stockstar.com,我们将安排核实处理。如该文标记为算法生成,算法公示请见 网信算备310104345710301240019号。
网站导航 | 公司简介 | 法律声明 | 诚聘英才 | 征稿启事 | 联系我们 | 广告服务 | 举报专区
欢迎访问证券之星!请点此与我们联系 版权所有: Copyright © 1996-