今天看啥  ›  专栏  ›  AI范儿

离谱!大学生用50美元零花钱训练出媲美OpenAI的AI模型,巨头的噩梦?

AI范儿  · 公众号  · AI媒体  · 2025-02-06 08:39
    

主要观点总结

新研究论文显示,斯坦福和华盛顿大学的AI研究人员用不到50美元云计算费用训练出一个名为s1的AI推理模型,该模型在数学和编程能力测试中表现卓越,与顶尖推理模型如OpenAI的o1和DeepSeek的R1相当。s1模型及其数据和代码已在GitHub上开源,是从Google的推理模型Gemini 2.0 Flash Thinking Experimental中通过蒸馏技术微调而来。这项研究展示了AI模型商品化的思考,也引发关于技术壁垒的讨论。s1论文指出,推理模型可以通过监督微调(SFT)和较小的数据集进行蒸馏,与DeepSeek使用的大规模强化学习方法相比,成本更低。项目参与者称,现在租用所需算力只需约20美元。

关键观点总结

关键观点1: AI推理模型s1的训练成本不到50美元。

s1模型在数学和编程能力测试中表现卓越,与顶尖推理模型相当。

关键观点2: s1模型通过蒸馏技术微调而来,其数据和代码已在GitHub上开源。

研究人员从Google的推理模型Gemini 2.0 Flash Thinking Experimental中进行蒸馏,采用监督微调(SFT)和较小的数据集。

关键观点3: s1模型引发对AI模型商品化的思考。

大型AI实验室对s1的出现有所反应,OpenAI指控DeepSeek不当收集API数据用于模型蒸馏。

关键观点4: s1模型的训练方法和数据集准备受到关注。

研究人员使用阿里巴巴旗下Qwen实验室的小型开源AI模型作为基础,精心准备一个包含1,000个问题的数据集用于训练s1。

关键观点5: s1模型的自查和延长思考时间的方法受到关注。

研究人员使用巧妙的方法让s1自查并延长思考时间,如在推理过程中加入“wait”这个词,有助于模型得出更准确的答案。


免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址:访问原文地址
总结与预览地址:访问总结与预览
文章地址: 访问文章快照