专栏名称: 量子位
վ'ᴗ' ի 追踪AI行业和技术动态,这里更快一步!关注我们,回复“今天”,更多大新闻等你来发现
目录
今天看啥  ›  专栏  ›  量子位

WAIC抢先爆料:金融“黑马”大模型超DeepSeek刷新SOTA,论文已上线

量子位  · 公众号  · AI  · 2025-07-25 13:38
    

主要观点总结

文章介绍了蚂蚁数科推出的金融推理大模型Agentar-Fin-R1,该模型在WAIC上有出色表现。模型拥有两个不同参数版本:8B和32B。蚂蚁数科通过构建精细化的金融任务分类体系、构建迄今已知最专业全面的金融领域训练数据集、高效训练优化等措施,实现了金融大模型的专业化。此外,蚂蚁数科还提出了全新的金融评测基准Finova,以更准确地评估模型在真实场景中的表现。Agentar-Fin-R1在Finova上的表现优于其他同尺寸金融推理大模型和通用推理模型。

关键观点总结

关键观点1: 蚂蚁数科推出金融推理大模型Agentar-Fin-R1

作为蚂蚁集团在金融领域AI实践的经验输出窗口,Agentar-Fin-R1在实际金融业务场景中有出色表现。

关键观点2: Agentar-Fin-R1的专业化实现

蚂蚁数科通过构建精细化的金融任务分类体系、构建专业的金融数据标签体系、高效训练优化等措施,实现了金融大模型的专业化,使模型具备出色的金融推理能力。

关键观点3: 全新的金融评测基准Finova的提出

蚂蚁数科提出的Finova评估基准,更准确地评估模型在真实场景中的表现,通过智能体执行任务能力、复杂推理能力、安全合规能力等多个维度的考察,对模型进行全面评估。

关键观点4: Agentar-Fin-R1在Finova上的优秀表现

Agentar-Fin-R1在Finova上的表现优于其他同尺寸金融推理大模型和通用推理模型,显示出垂直领域模型在特定任务中的显著优势。

关键观点5: 蚂蚁数科的行业洞察、数据积累和AI能力

蚂蚁数科的行业洞察、数据积累和AI能力是Agentar-Fin-R1实现SOTA的关键,长期浸润一线,具备对金融场景更深度的行业理解和数据积累。


免责声明

免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址:访问原文地址
总结与预览地址:访问总结与预览
推荐产品:   推荐产品
文章地址: 访问文章快照