苹果近日发表了一篇研究论文，质疑现有 AI 推理模型的思考能力，称 DeepSeek、o3-mini...

哎咆科技 · 公众号 · 硬件 · 2025-06-09 11:34

主要观点总结

苹果发表了一篇研究论文，质疑现有AI推理模型的思考能力，并提出目前评估模型的方式过于关注答案的正确性而忽略了思考过程的质量。为此，苹果设计了四类可控难度的谜题进行测试，发现随着问题复杂性的增加，模型的思考深度下降，甚至在高难度下完全崩溃。这篇论文引发了网友的争议，有人批评苹果否定他人成果，也有人认为论文有助于推动更科学的推理评估机制。

关键观点总结

关键观点1: 现有AI推理模型被质疑缺乏真正的思考能力。

苹果认为目前主流的AI推理模型如DeepSeek、o3-mini、Claude 3.7等仅仅是“模式匹配”，无法展现真正的推理能力。

关键观点2: 苹果提出评估AI推理模型的新视角。

论文指出目前评估AI的方式过于关注答案的正确性，忽略了思考过程的质量。苹果设计了四类可控难度的谜题来测试模型的思考能力。

关键观点3: 模型在解决复杂问题时的思考深度下降。

随着问题复杂性的增加，AI模型的思考深度下降，甚至在高难度问题面前完全崩溃。

关键观点4: 论文引发网友争议。

对于这篇论文，网友们的看法褒贬不一。有人批评苹果因为自身AI进展缓慢而否定他人成果，也有人认为论文有助于推动更科学的推理评估机制的发展。

免责声明

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
推荐产品: 推荐产品
文章地址：访问文章快照

分享到微博