专栏名称: 量子位

վ'ᴗ' ի 追踪AI行业和技术动态，这里更快一步！关注我们，回复“今天”，更多大新闻等你来发现

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

即刻RSS订阅方法

又一SOTA级开源模型！阶跃Step-3多模态推理登顶，百万token解码成本不到4毛钱

量子位 · 公众号 · AI · 2025-08-01 08:45

主要观点总结

文章介绍了阶跃星辰开源的最新多模态推理模型Step-3，该模型在MMMU等多个榜单上取得开源多模态推理模型新SOTA的成绩。Step-3采用模型-Infra一体化设计，具有高效能和极高性价比。其采用模型-系统协同设计思路，把注意力、前馈网络和集群调度当作同一个优化对象。核心中的核心是阶跃自研的MFA注意力机制。系统层面，阶跃团队提出了AFD机制。Step-3包含多个亮点技术，包括MFA注意力机制、AFD机制以及StepMesh通信库等。此外，文章还介绍了国产模型在开源世界中的主导地位，并提供了相关链接。

关键观点总结

关键观点1: 模型介绍

阶跃星辰开源了最新多模态推理模型Step-3，它在多个多模态榜单上取得了SOTA成绩。

关键观点2: 模型性能

Step-3具有高效能和极高性价比，速度飞快，在Hopper GPU上的解码速度超过了DeepSeek-V3。

关键观点3: 模型设计

Step-3采用模型-Infra一体化设计，通过模型-系统协同设计思路优化性能。

关键观点4: 核心技术

Step-3的核心技术包括MFA注意力机制、AFD机制和StepMesh通信库等。

关键观点5: 国产模型在开源世界中的地位

国产模型在开源世界中已成为领军者，多个中国团队研发的模型在Hugging Face模型榜单上占据主导地位。

免责声明

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
推荐产品: 推荐产品
文章地址：访问文章快照

分享到微博

推荐文章

新智元 · Hinton预言成真，美国大学生掀起本科辍学潮！月入万刀修马桶，不怕AI裁员

12 小时前

新智元 · GPT-5难产内幕曝光！核心团队遭挖空，推理魔咒难破，靠英伟达续命

16 小时前

宝玉xp · 现在很多 Context Engineering 谈的是如何构建-20250802010903

昨天

宝玉xp · Claude Code 最佳实践 | Code w/ Claud-20250801151818

昨天

爱可可-爱生活 · [LG]《The Incomplete Bridge: How -20250801061734

昨天

brainnews · Cell Rep：罗振革组揭示人类神经元复杂化及突触发育幼态持续的新机制

11 月前

剑胆琴心123 · 回复@宽大的致富小火箭: 这要求可以去财神庙烧香，我这没有。//-20241002115241

10 月前

中国能源报 · 2024年中国电影总票房出炉

7 月前

中国畜牧业协会猪业分会 · 预计本周生猪价格或跌后小涨

5 月前

都市现场 · 湖南沅陵洞庭溪垃圾污染最新进展：均为附近生活垃圾，系节省转运成本所致，官方回应：已全部清理

2 周前