专栏名称: 人工智能学家

致力成为权威的人工智能科技媒体和前沿科技研究机构

购买VIP

购买成为VIP，可查看文章或者RSS订阅

提交新专栏

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

小宇宙RSS订阅方法

X平台RSS订阅方法

Telegram频道RSS订阅方法

油管文字版RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

TodayRss-海外RSS稳定源

GPT-4.5证明 Scaling Law 持续有效｜Sam Altman最新直播实录

人工智能学家 · 公众号 · AI · 2025-04-11 18:53

主要观点总结

OpenAI CEO Sam Altman与GPT-4.5核心团队成员直播分享GPT-4.5的研发历程。GPT-4.5项目启动于约两年前，目标是实现比GPT-4聪明10倍的模型，最终从有效算力投入上看是达到了。整个项目在某种意义上是验证Scaling Law有效性的大型实验，结果证明Scaling Law持续有效，并可能在未来很长时间内依然有效。预训练规模要实现下一个10倍或100倍增长，需要数据效率。GPT模型利用计算吸收信息效率极高，但从数据中获取洞察的深度似乎有上限。当算力增长远超数据增长时，数据成为瓶颈。更好的预训练倾向于提升模型广泛的基础智能和泛化能力，这与推理能力的提升形成良好互补。打造如此巨大的模型需要很多人、很多时间，还有很多算力，并需要团队密切合作，确保机器学习和系统能在规模化部署时良好协同工作。

关键观点总结

关键观点1: GPT-4.5项目启动于约两年前，目标是实现比GPT-4聪明10倍的模型

GPT-4.5项目启动于约两年前，目标是实现比GPT-4聪明10倍的模型，从有效算力投入上看，这一目标已经达到。

关键观点2: 整个项目在某种意义上是验证Scaling Law有效性的大型实验

整个GPT-4.5项目在某种意义上是验证Scaling Law有效性的大型实验，结果证明Scaling Law持续有效，并可能在未来很长时间内依然有效。

关键观点3: 预训练规模要实现下一个10倍或100倍增长，需要数据效率

GPT模型利用计算吸收信息效率极高，但从数据中获取洞察的深度似乎有上限。当算力增长远超数据增长时，数据成为瓶颈。因此，预训练规模要实现下一个10倍或100倍增长，需要数据效率。

关键观点4: 更好的预训练倾向于提升模型广泛的基础智能和泛化能力

更好的预训练和无监督学习往往能够提升模型广泛的基础智能，并且对提升泛化能力非常有帮助。我们发现这与推理能力的提升形成了很好的互补。

关键观点5: 打造如此巨大的模型需要很多人、很多时间，还有很多算力

打造如此巨大的模型需要很多人、很多时间，还有很多算力，并需要团队密切合作，确保机器学习和系统能在规模化部署时良好协同工作。

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
文章地址：访问文章快照

分享到微博

推荐文章

青稞AI · 深度！DeepSeek-V4 中的 MegaMoE，细致的 Overlap 通信和计算延迟方案

12 小时前

数字生命卡兹克 · Codex更新远程控制，你也终于可以在手机上随时随地Vibe Coding了。

15 小时前

人工智能产业链union · 【报告】算力专题二：双极进化与算力重构，2026AI行业深度展望(附PDF下载)

昨天

人工智能产业链union · 【报告】清新研究团队：2026年Suno研究报告（附PDF下载）

昨天

黄建同学 · Claude Code 12条浏览器skills，用得上！1）b-20260514072000

昨天

超级数学建模 · 如果在一个椭圆形池塘的正中央掀起一圈圆形的涟漪,会形成怎样的图案呢？

1 年前

小胖看房二手房 · 粉丝房源无中介！松江松江大学城保利西子湾59.4平1房278万

1 年前

CEM华盛昌 · 警惕有害气体威胁，华盛昌气体检测仪守护生命安全

1 年前

财经 · 协定生效，“免签朋友圈”再扩容！爆发式增长来了

10 月前

英国足球那点事 · 季前赛#珀斯光荣vsAC米兰#，上半场AC米兰5-0澳超球队柏斯-20250731191933

9 月前