专栏名称: 海外独角兽

研究科技大航海时代的伟大公司。

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

即刻RSS订阅方法

专访张祥雨：多模态推理和自主学习是未来的 2 个「GPT-4」时刻

海外独角兽 · 公众号 · 科技公司 · 2025-06-09 12:23

主要观点总结

本期内容是拾象 CEO 李广密对大模型公司阶跃星辰首席科学家张祥雨的访谈，主要探讨了多模态大模型框架的发展、学术影响力、多模态领域的关键问题以及未来展望。张祥雨提出了 DreamLLM 多模态大模型框架，并分享了其对多模态领域技术难题的思考。他强调，尽管语言模型领域进步迅速，但多模态生成和理解的难度被低估了。未来多模态领域将有两个 GPT-4 时刻：多模态推理和自主学习。张祥雨还讨论了模型 scale 到万亿参数后的推理能力下降现象，并探讨了如何强化模型推理能力。此外，他探讨了 o1 范式的技术本质，并指出了多模态数据对模型智能的影响。他认为，多模态推理的 GPT-4 时刻最多还有 1 年到来，并展望了模型自主学习与 ASI 的研究主线。

关键观点总结

关键观点1: 多模态大模型框架的发展

张祥雨提出了 DreamLLM 多模态大模型框架，这是业内最早的图文生成理解一体化的多模态大模型架构之一，基于这个框架，阶跃星辰发布了中国首个千亿参数原生多模态大模型 Step-1V。

关键观点2: 学术影响力

张祥雨的论文总引用量已经超过了 37 万次，他的工作对多模态领域的发展具有重要影响。

关键观点3: 多模态领域的关键问题

张祥雨认为多模态生成和理解的难度被低估了，并探讨了未来多模态领域将有两个 GPT-4 时刻：多模态推理和自主学习。

关键观点4: 模型 scale 到万亿参数后的推理能力下降

张祥雨讨论了模型 scale 到万亿参数后的推理能力下降现象，并探讨了如何强化模型推理能力。

关键观点5: o1 范式的技术本质

张祥雨探讨了 o1 范式的技术本质，并指出了多模态数据对模型智能的影响。

关键观点6: 多模态推理的 GPT-4 时刻

张祥雨认为多模态推理的 GPT-4 时刻最多还有 1 年到来，并展望了模型自主学习与 ASI 的研究主线。

免责声明

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
推荐产品: 推荐产品
文章地址：访问文章快照

分享到微博

推荐文章

白鲸出海 · 2025全球手游买量战局：9万广告主厮杀，周更素材成生死线

昨天

海外独角兽 · 对谈 Pokee CEO 朱哲清：RL-native 的 Agent 系统应该长什么样？｜Best Minds

昨天

百度智能云 · 携AI游戏方案亮相ChinaJoy，TA们选择百度智能云

昨天

滴滴招聘 · 滴滴26届校招提前批网申倒计时10天！这些岗位还能投~

2 天前

阿里云开发者 · AI 基础知识从 0.4 到 0.5—— 计算机视觉之光 CNN

2 天前

连云港人大发布 · 省人大来连开展固体废物污染防治立法调研

1 年前

熠熠全球能源观察 · 【能源观察家】光伏巨头首次整合，通威拟50亿收购润阳！

11 月前

扑克投资家 · 中国电动汽车到拐点了？高盛说，NO！

11 月前

清华就业 · 招聘 | 中建丝路2025年“丝路新星”校园招聘

10 月前

沉默王二 · 含泪拒绝淘天，曾经的白月光。

7 月前

专访张祥雨：多模态推理和自主学习是未来的 2 个 「GPT-4」 时刻