专栏名称: 机器之心
专业的人工智能媒体和产业服务平台
目录
今天看啥  ›  专栏  ›  机器之心

通义实验室大火的 WebAgent 续作:全开源模型方案超过GPT4.1 , 收获开源SOTA

机器之心  · 公众号  · AI  · 2025-07-29 18:31
    

主要观点总结

WebAgent续作《WebShaper: Agentically Data Synthesizing via Information-Seeking Formalization》中,作者提出了对information-seeking(IS)任务的形式化建模,并基于该建模设计了IS任务训练数据合成方法。WebShaper补足了GAIA、Browsecomp上缺少高质量训练数据的问题,体现了通义实验室对IS任务的深化理解。其主要创新点包括:从信息驱动到形式化驱动的数据合成范式转变、基于集合论的形式化建模、智能体式扩展合成方法以及使用开源模型方案在GAIA基准任务中获得的高分表现。

关键观点总结

关键观点1: 信息检索(IS)任务的形式化建模

作者首次提出了对IS任务的形式化建模,通过数学建模来检索信息并合成训练数据,解决了主流方法依赖信息驱动合成范式的两大缺陷。

关键观点2: WebShaper系统的特点

WebShaper系统开创了形式化驱动新范式,通过数学建模IS任务,实现全域任务覆盖、精准结构控制以及结构语义对齐。

关键观点3: 智能体式扩展合成方法

为了让Agent自己进行任务合成,WebShaper使用专用的代理扩展器(Expander)模块,通过形式化建模来表示和使用任务需求,实现逐层扩展机制以最小化冗余并防止推理捷径。

关键观点4: WebShaper的训练方法和效果

作者使用监督微调(SFT)+ GRPO强化学习策略来训练Agent。WebShaper在GAIA基准任务中获得60.1分的高分表现,超越所有开源方案,大幅领先第二名的开源方案。

关键观点5: 论文的进一步分析

作者对数据和训练模型进行了进一步分析,验证了WebShaper数据领域覆盖的充分性、形式化建模和逐层扩展策略的有效性等。


免责声明

免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址:访问原文地址
总结与预览地址:访问总结与预览
推荐产品:   推荐产品
文章地址: 访问文章快照