专栏名称: 智东西
智东西-聚焦智能变革,服务产业升级!作为智能行业新锐媒体,智东西专注五大领域:VR/AR;AI/机器人/无人机;智能汽车/智能出行;智能家居/物联网;智能穿戴/智能医疗,通过内容、活动、报告以及社群等方式助力“智能+”时代的创业和产业升级。
目录
今天看啥  ›  专栏  ›  智东西

杀疯了!阿里开源最强推理模型,一周三模型干翻全球开闭源天花板

智东西  · 公众号  · 科技媒体  · 2025-07-26 18:54
    

主要观点总结

阿里开源了最新模型Qwen3-235B-A22B-Thinking-2507,该模型在编程、知识、推理等多项能力测评中表现优异,超越DeepSeek、比肩o3。通义千问团队一周内连续开源三款模型,均获得全球开源模型权威测评的高评价。该团队还推出了GSPO算法,用于支持三款最新模型的大规模RL训练。同时,阿里开源的Qwen3-Coder编程模型也引起热议,获得科技领袖的盛赞。

关键观点总结

关键观点1: Qwen3-235B-A22B-Thinking-2507模型的开源及表现

该模型是阿里通义千问团队推出的最新升级版本,拥有多项测评的高分数,包括编程能力、知识能力、推理能力等。其在LiveCodBenchV6的编程能力测评中的成绩从5月发布的55.7分提升到了现在的74.1分。该模型已经开源,并可以在魔搭社区、Hugging Face等平台上免费下载商用。

关键观点2: 通义千问团队一周内连续开源三款模型

通义千问团队在短短一周时间内,连续开源了三款模型,包括Qwen3-235B-A22B-Instruct-2507、Qwen3-Coder-480B-A35B-Instruct等,这些模型在全球权威测评中表现出色,成绩直追顶级闭源模型。

关键观点3: GSPO算法的推出

阿里还推出了为三款最新Qwen3模型大规模RL训练提供支持的算法——组序列策略优化(GSPO),该算法在稳定性、效率、性能和底层友好度方面都具有显著优势,从根本上解决了强化学习中大型MoE模型训练的稳定性问题。

关键观点4: Qwen3-Coder编程模型的开源及影响

Qwen3-Coder是阿里通义千问团队最新一代旗舰编程模型,拥有强大的编程能力,在基准测试中表现优秀。该模型的开源引发了硅谷和全球AI圈的热烈讨论,获得科技领袖的盛赞。同时,该模型的开源也促进了阿里云的业务发展,吸引了大量用户免费使用。


免责声明

免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址:访问原文地址
总结与预览地址:访问总结与预览
推荐产品:   推荐产品
文章地址: 访问文章快照