专栏名称: 智东西

智东西－聚焦智能变革，服务产业升级！作为智能行业新锐媒体，智东西专注五大领域：VR/AR；AI/机器人/无人机；智能汽车/智能出行；智能家居/物联网；智能穿戴/智能医疗，通过内容、活动、报告以及社群等方式助力“智能＋”时代的创业和产业升级。

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

即刻RSS订阅方法

杀疯了！阿里开源最强推理模型，一周三模型干翻全球开闭源天花板

智东西 · 公众号 · 科技媒体 · 2025-07-26 18:54

主要观点总结

阿里开源了最新模型Qwen3-235B-A22B-Thinking-2507，该模型在编程、知识、推理等多项能力测评中表现优异，超越DeepSeek、比肩o3。通义千问团队一周内连续开源三款模型，均获得全球开源模型权威测评的高评价。该团队还推出了GSPO算法，用于支持三款最新模型的大规模RL训练。同时，阿里开源的Qwen3-Coder编程模型也引起热议，获得科技领袖的盛赞。

关键观点总结

关键观点1: Qwen3-235B-A22B-Thinking-2507模型的开源及表现

该模型是阿里通义千问团队推出的最新升级版本，拥有多项测评的高分数，包括编程能力、知识能力、推理能力等。其在LiveCodBenchV6的编程能力测评中的成绩从5月发布的55.7分提升到了现在的74.1分。该模型已经开源，并可以在魔搭社区、Hugging Face等平台上免费下载商用。

关键观点2: 通义千问团队一周内连续开源三款模型

通义千问团队在短短一周时间内，连续开源了三款模型，包括Qwen3-235B-A22B-Instruct-2507、Qwen3-Coder-480B-A35B-Instruct等，这些模型在全球权威测评中表现出色，成绩直追顶级闭源模型。

关键观点3: GSPO算法的推出

阿里还推出了为三款最新Qwen3模型大规模RL训练提供支持的算法——组序列策略优化（GSPO），该算法在稳定性、效率、性能和底层友好度方面都具有显著优势，从根本上解决了强化学习中大型MoE模型训练的稳定性问题。

关键观点4: Qwen3-Coder编程模型的开源及影响

Qwen3-Coder是阿里通义千问团队最新一代旗舰编程模型，拥有强大的编程能力，在基准测试中表现优秀。该模型的开源引发了硅谷和全球AI圈的热烈讨论，获得科技领袖的盛赞。同时，该模型的开源也促进了阿里云的业务发展，吸引了大量用户免费使用。

免责声明

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
推荐产品: 推荐产品
文章地址：访问文章快照

分享到微博

推荐文章

新浪科技 · 【#特斯拉批准授予马斯克9600万股股票奖励# 】#特斯拉涨超2-20250804214319

20 小时前

新浪科技 · 【#博主侵权华为被判公开道歉赔偿25万#】今日下午，有着10万粉-20250804214747

20 小时前

新浪科技 · 【#多家金融央企增设专职党委副书记#，分管组织人事工作】据不完全-20250803213300

昨天

长江光电产业投 · 湖北国资“并购凶猛”：旗下一半上市公司来自并购长江产投提前实现“3年6控”

昨天

网信浙江 · 我国2025年IPv6呈现良好发展势头

2 天前

TechWeb · TechWeb微晚报：中国网民规模近11亿，网易起诉暴雪一审获胜

11 月前

传媒圈招聘 · 《快乐再出发》制作团队招聘公告！

7 月前

奶粉智库 · 宝宝不长肉？90%的妈妈忽略了这个原因！

7 月前

Sky的安全观 · 【前14篇免费】ISO/IEC 27701: 2019 标准详解与实施（18）5.4.2 信息安全目标及其实现策划

7 月前

CityDiscount都市折扣 · 好机会！【David jones】大牌美妆/护肤品今天特卖

1 周前