专栏名称: 量子位
վ'ᴗ' ի 追踪AI行业和技术动态,这里更快一步!关注我们,回复“今天”,更多大新闻等你来发现
目录
今天看啥  ›  专栏  ›  量子位

又一SOTA级开源模型!阶跃Step-3多模态推理登顶,百万token解码成本不到4毛钱

量子位  · 公众号  · AI  · 2025-08-01 08:45
    

主要观点总结

文章介绍了阶跃星辰开源的最新多模态推理模型Step-3,该模型在MMMU等多个榜单上取得开源多模态推理模型新SOTA的成绩。Step-3采用模型-Infra一体化设计,具有高效能和极高性价比。其采用模型-系统协同设计思路,把注意力、前馈网络和集群调度当作同一个优化对象。核心中的核心是阶跃自研的MFA注意力机制。系统层面,阶跃团队提出了AFD机制。Step-3包含多个亮点技术,包括MFA注意力机制、AFD机制以及StepMesh通信库等。此外,文章还介绍了国产模型在开源世界中的主导地位,并提供了相关链接。

关键观点总结

关键观点1: 模型介绍

阶跃星辰开源了最新多模态推理模型Step-3,它在多个多模态榜单上取得了SOTA成绩。

关键观点2: 模型性能

Step-3具有高效能和极高性价比,速度飞快,在Hopper GPU上的解码速度超过了DeepSeek-V3。

关键观点3: 模型设计

Step-3采用模型-Infra一体化设计,通过模型-系统协同设计思路优化性能。

关键观点4: 核心技术

Step-3的核心技术包括MFA注意力机制、AFD机制和StepMesh通信库等。

关键观点5: 国产模型在开源世界中的地位

国产模型在开源世界中已成为领军者,多个中国团队研发的模型在Hugging Face模型榜单上占据主导地位。


免责声明

免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址:访问原文地址
总结与预览地址:访问总结与预览
推荐产品:   推荐产品
文章地址: 访问文章快照