阿里开源通义DeepResearch,登顶开源Agent模型榜首

(原标题:阿里开源通义DeepResearch,登顶开源Agent模型榜首)

9月17日凌晨,阿里开源旗下首个深度研究Agent模型——通义DeepResearch。该模型在HLE、BrowseComp-zh、GAIA等多个权威评测集上取得SOTA成绩(State-of-the-art),超越OpenAI
Deep
Research、DeepSeek-V3.1等Agent模型。目前,通义DeepResearch的模型、框架和方案均已全面开源,用户可在Github、Hugging
Face和魔搭社区下载模型和代码。

通义DeepResearch登顶开源第一

深度研究是近一年来的研究热点,谷歌、OpenAI、Anthropic等主流AI企业均在投入相关技术和产品。然而,现有方法普遍采用“单窗口、线性累加”的信息处理模式,所有中间思路和检索到的信息堆积在单一上下文中。这种模式在处理长周期任务时,Agent会面临“认知空间窒息”和“不可逆的噪声污染”的挑战,导致推理能力下降,最终难以完成真正长程、复杂的研究任务。

为此,通义团队构建了一套以合成数据驱动、贯穿预训练与后训练的完整训练链路。该链路以Qwen3-30B-A3B
模型为基座进行优化,为了确保训练的高效性与模型的鲁棒性,团队创新性地设计了覆盖真实环境与虚拟环境的RL算法验证与真实训练模块,并结合高效异步强化学习算法及自动化数据策展(Data
Curation)流程,显著提升了模型的迭代速度和泛化能力。

在推理阶段,团队设计了 ReAct 和基于自研的IterResearch的Heavy 两种模式,前者用于精准考察模型的基础内在能力,后者则通过
test-time scaling 策略,充分挖掘并展现了模型所能达到的性能上限,即使在长任务中,也能实现高质量的推理。

在Humanitys Last
Exam(HLE)、BrowseComp、BrowseComp-ZH、GAIA、xbench-deepsearch、WebWalkerQA以及Frames等权威Agent评测集上,通义DeepResearch模型以3B激活参数,性能超越基于OpenAI
o3、DeepSeek V3.1和Claude-4-Sonnet等旗舰模型的ReAct Agent。

今年以来,阿里已连续开源WebWalker、WebDancer和WebSailor等多款检索和推理智能体,并全部斩获开源SOTA成绩。

APP下载
广告
下载证券之星
郑重声明:以上内容与证券之星立场无关。证券之星发布此内容的目的在于传播更多信息,证券之星对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至jubao@stockstar.com,我们将安排核实处理。如该文标记为算法生成,算法公示请见 网信算备310104345710301240019号。
网站导航 | 公司简介 | 法律声明 | 诚聘英才 | 征稿启事 | 联系我们 | 广告服务 | 举报专区
欢迎访问证券之星!请点此与我们联系 版权所有: Copyright © 1996-