专栏名称: 量子位

վ'ᴗ' ի 追踪AI行业和技术动态，这里更快一步！关注我们，回复“今天”，更多大新闻等你来发现

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

即刻RSS订阅方法

WAIC抢先爆料：金融“黑马”大模型超DeepSeek刷新SOTA，论文已上线

量子位 · 公众号 · AI · 2025-07-25 13:38

主要观点总结

文章介绍了蚂蚁数科推出的金融推理大模型Agentar-Fin-R1，该模型在WAIC上有出色表现。模型拥有两个不同参数版本：8B和32B。蚂蚁数科通过构建精细化的金融任务分类体系、构建迄今已知最专业全面的金融领域训练数据集、高效训练优化等措施，实现了金融大模型的专业化。此外，蚂蚁数科还提出了全新的金融评测基准Finova，以更准确地评估模型在真实场景中的表现。Agentar-Fin-R1在Finova上的表现优于其他同尺寸金融推理大模型和通用推理模型。

关键观点总结

关键观点1: 蚂蚁数科推出金融推理大模型Agentar-Fin-R1

作为蚂蚁集团在金融领域AI实践的经验输出窗口，Agentar-Fin-R1在实际金融业务场景中有出色表现。

关键观点2: Agentar-Fin-R1的专业化实现

蚂蚁数科通过构建精细化的金融任务分类体系、构建专业的金融数据标签体系、高效训练优化等措施，实现了金融大模型的专业化，使模型具备出色的金融推理能力。

关键观点3: 全新的金融评测基准Finova的提出

蚂蚁数科提出的Finova评估基准，更准确地评估模型在真实场景中的表现，通过智能体执行任务能力、复杂推理能力、安全合规能力等多个维度的考察，对模型进行全面评估。

关键观点4: Agentar-Fin-R1在Finova上的优秀表现

Agentar-Fin-R1在Finova上的表现优于其他同尺寸金融推理大模型和通用推理模型，显示出垂直领域模型在特定任务中的显著优势。

关键观点5: 蚂蚁数科的行业洞察、数据积累和AI能力

蚂蚁数科的行业洞察、数据积累和AI能力是Agentar-Fin-R1实现SOTA的关键，长期浸润一线，具备对金融场景更深度的行业理解和数据积累。

免责声明

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
推荐产品: 推荐产品
文章地址：访问文章快照

分享到微博

推荐文章

爱可可-爱生活 · 本文通过严谨的跨模型实验，颠覆性地揭示了将语言模型训练得“温暖共-20250803061403

20 小时前

量子位 · 6小时复刻AI IMO金牌成果，蚂蚁多智能体新进展已开源

昨天

黄建同学 · 教程：Tiny LLM - LLM Serving in a W-20250802141348

昨天

宝玉xp · //@明风:4.5不是失败的模型，只是作为非推理的基座模型，它的-20250802114530

昨天

量子位 · 抖音全新推荐大模型RankMixer，参数翻70倍，推理成本不涨

2 天前

FDA食安云 · 关于CNAS、CMA相关咨询的官方解答汇总

1 年前

炉石东少 · 紧急禁用！炉石史上最短命的天梯霸主！

6 月前

PAGEONE书店 · PAGEONE近期活动合集

2 月前

科学未来人 · //@老王谈改革:大国对涉及国家安全的争端区域主要是算战略账，而-20250512103005

2 月前

中规知识产权认证 · 关于发布《知名商标品牌评价规范》修订版并进一步做好知名商标品牌评价工作的通知

1 月前