专栏名称: Datawhale

一个专注于AI领域的开源组织，汇聚了众多顶尖院校和知名企业的优秀学习者，聚集了一群有开源精神和探索精神的团队成员。愿景-for the learner，和学习者一起成长。

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

XRSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

即刻RSS订阅方法

从推理轨迹反推：gpt-oss背后的训练策略

Datawhale · 公众号 · AI媒体 · 2025-08-09 22:12

主要观点总结

OpenAI在8月6日凌晨开源了两个MoE模型：gpt-oss-120b和gpt-oss-20b。这些模型原生支持MXFP4训练和推理。文章分析了OpenAI这次开源模型可能使用的技术细节，包括审议对齐这一新训练范式在安全对齐方面的应用，并讨论了模型在AIME、AIME24、AIME25和人类最后测试（HLE）中的表现。此外，文章还提到GPT-OSS在数学推理方面的优秀表现，并猜测OpenAI此次开源模型的目的以及模型预训练数据的处理方式。

关键观点总结

关键观点1: OpenAI开源了两个MoE模型：gpt-oss-120b和gpt-oss-20b。

这两个模型原生支持MXFP4训练和推理，并且gpt-oss-20b模型可直接在普通显卡上运行，速度可观。

关键观点2: 技术细节分析

文章分析了OpenAI可能使用的技术细节，包括使用审议对齐这一新训练范式来提高推理轨迹的信息密度，减少冗余信息。同时提到模型在AIME等各项测试中的表现。

关键观点3: GPT-OSS在数学推理上的表现

GPT-OSS在数学推理上表现出色，特别是在AIME测试中获得了高分。这可能与模型预训练数据经过严格的安全过滤有关。

关键观点4: OpenAI的开源目的猜测

文章猜测OpenAI此次开源模型的目的是展示其安全审议技术，并可能在Kaggle上创建比赛寻找模型的安全漏洞和有害行为。同时，模型预训练数据的处理方式也可能侧重于特定的领域，如数学和科学推理。

免责声明

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
推荐产品: 推荐产品
文章地址：访问文章快照

分享到微博