让奥特曼直呼“天才”的o3 和 o4-mini，被曝捏造事实问题严重！拓展强化学习、图像思维链等亮点...

AI前线 · 公众号 · AI · 2025-04-17 10:46

主要观点总结

本文介绍了OpenAI发布的最新模型o3和o4-mini，它们具备自主调用并整合ChatGPT内全量工具的能力，包括网页搜索、使用Python分析上传文件及数据、深度视觉推理，甚至图像生成等。文章还提到了新模型在编程、数学、科学、视觉感知等多个领域的表现，以及它们相较于前身模型的改进。同时，也讨论了模型在实际使用中的一些问题，如虚构事实的情况。最后，活动推荐AICon 2025大会，聚焦AI技术前沿和行业落地。

关键观点总结

关键观点1: OpenAI发布新模型o3和o4-mini，具备自主调用并整合ChatGPT内全量工具的能力。

这两个新模型能够自主判断何时及如何运用工具，解决复杂问题，并以恰当的格式输出缜密详尽的解答。它们适用于从好奇的用户到高级研究人员的所有人群。

关键观点2: 新模型在编程、数学、科学、视觉感知等领域表现优异。

o3在多个基准测试中刷新了最新的SOTA，包括Codeforces、SWE-bench以及MMMU。它特别适用于需要多方面分析、答案并非一目了然的复杂问题，在图像、图表和图形等视觉任务中的表现尤其出色。

关键观点3: 新模型在实际使用中存在虚构事实的问题。

有用户反馈称，模型在执行一些技术性较强的问题时，会出现捏造细节或完全虚构的行为。这个问题在一定程度上影响了模型的准确性和可靠性。

关键观点4: OpenAI启动了支持计划，资助使用Codex CLI和OpenAI模型的项目。

官方将以每项API使用额度25,000美元的形式评估并接受资助申请。此外，OpenAI还发布了Codex CLI，这是一个可以在终端运行的轻量级编码智能体，专为发挥o3和o4-mini等模型的推理能力而设计。

免责声明

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
推荐产品: 推荐产品
文章地址：访问文章快照

分享到微博

推荐文章

新智元 · 弹尽粮绝！陶哲轩自曝遭资金断供，美顶尖数学圣殿IPAM命悬一线

20 小时前

爱可可-爱生活 · [CL] On The Role of Pretrained L-20250803062258

昨天

机器之心 · GPT-5难产，外媒爆料：性能提升不大，OpenAI高管Slack上当众破防

昨天

黄建同学 · 视频中，ChatGPT Agent 正在控制一台实时安防摄像头，-20250801214520

2 天前

宝玉xp · 来自网友对神秘模型 Horizon Alpha (据传是 Ope-20250801101916

2 天前

JitLogistics · 300+品牌方，100+服务方，6月21日齐聚上海，食品冷链论坛火热进行中……

1 年前

安徽建工集团 · 1.45亿立方米库容！看安徽建工如何建大型水库→

9 月前

上海市消保委 · 马斯克，正式发布！

5 月前

IT之家 · 抖音首次公开推荐算法原理

4 月前

财宝宝 · //@财旺-旺土豆:不看，全是诈骗-20250406192711

3 月前