专栏名称: 新智元

智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

即刻RSS订阅方法

Claude Opus 4.1代码实测惊人！OpenAI开源模型却只会写屎山?

新智元 · 公众号 · AI · 2025-08-06 11:54

主要观点总结

新智元报道，AI界出现竞争态势，OpenAI开源遭遇谷歌和Anthropic新模型的挑战。谷歌推出Genie 3模型，Anthropic发布Claude Opus 4.1。OpenAI也兑现开源承诺，发布OpenAI-OSS系列模型。关于Claude Opus 4.1的性能提升，虽然部分基准测试提升不足1%，但仍面向用户开放并登陆三大云平台。同时，也有员工对这次发布提出质疑，认为发布改进较小的模型版本可能存在其他原因。另外，不同AI模型在代码编写能力上的测试结果也有所报道。

关键观点总结

关键观点1: 谷歌和Anthropic发布新模型，对OpenAI的开源模型形成挑战。

谷歌推出Genie 3模型，号称“宇宙模拟器”；Anthropic发布Claude Opus 4.1，在智能体任务、现实世界编程和逻辑推理等领域进行了升级。

关键观点2: OpenAI履行开源承诺，发布OpenAI-OSS系列模型。

OpenAI再次开源，发布了OpenAI-OSS系列模型，手机、电脑本地可使用。

关键观点3: Claude Opus 4.1的性能提升及市场反响。

虽然部分性能提升不足1%，但Claude Opus 4.1已经面向用户开放并登陆三大云平台。然而，有员工对其改进幅度提出质疑，认为发布时机可能存在其他原因。

关键观点4: 不同AI模型在代码编写能力上的测试。

不同AI模型的代码编写能力得到测试，包括OpenAI-OSS-120B、OpenAI-OSS-20B、Claude-Opus-4.1等。测试结果显示Claude-Opus-4.1在代码编写能力上表现出色。

免责声明

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
推荐产品: 推荐产品
文章地址：访问文章快照

分享到微博

推荐文章

量子位 · Qwen新开源，把AI生图里的文字SOTA拉爆了

昨天

量子位 · 奥特曼首晒GPT-5实测！被曝使用超级对齐团队“遗产”

2 天前

爱可可-爱生活 · Agentic Web：互联网新纪元，AI Agent 驱动的自-20250804064949

2 天前

爱可可-爱生活 · [LG]《Retrieve-Augmented Generati-20250804055606

2 天前

爱可可-爱生活 · 本文创新性地将检索增强生成（RAG）范式应用于机器人扩散策略，通-20250804055620

2 天前

药通社 · 官宣丨8月15日，都正生物【加速创新-药物研发与转化论坛】报名开启，免费参会

12 月前

中国财经报 · 微信又上线新功能！网友：过年正需要

6 月前

CAICT数据基础设施 · 数据领域常用名词解释（第二批）

4 月前

广西交通台 · 摩托车巡逻+无人机巡航+AI巡考 2025高考各项准备工作已就绪

2 月前

黑龙江交通广播 · 罗马仕京东、淘宝等官方旗舰店已关闭

4 周前