专栏名称: 新智元

智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。

购买VIP

购买成为VIP，可查看文章或者RSS订阅

提交新专栏

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

小宇宙RSS订阅方法

X平台RSS订阅方法

油管文字版RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

TodayRss-海外RSS稳定源

Kimi硬刚多模态满血版o1，首曝训练细节！强化学习scaling新范式诞生

新智元 · 公众号 · AI · 2025-01-20 23:06

主要观点总结

新智元报道，Kimi发布了k1.5多模态思考模型，这是继去年发布数学和视觉思考模型后的强化学习模型重磅升级。Kimi k1.5的性能已全面追上全球最强模型OpenAI o1满血版，并在数学、代码、多模态推理能力上达到长思考SOTA模型水平。该模型的技术创新包括长上下文扩展、简化框架、多模态等。同时，Kimi团队还公开了训练技术细节，并详细解释了long2short思维链等关键技术。Kimi k1.5的设计遵循了从长到短的思考逻辑，通过合并长CoT模型和短CoT模型、应用最短筛选采样等方法，实现了高效的模型合并和响应。此外，该模型还具备强大的泛化能力和Token使用效率，通过部分回滚技术解决了长CoT特性资源分配和效率挑战。该模型的发布标志着多模态AI能力的显著进步，并且Kimi将继续迭代出更多模态、更多领域、具备更强通用能力的Kn系列模型。

关键观点总结

关键观点1: Kimi发布k1.5多模态思考模型

Kimi发布了新的强化学习模型k1.5，这是继去年发布数学和视觉思考模型后的升级，全面追上了全球最强模型OpenAI o1满血版的性能。

关键观点2: 模型技术创新

Kimi k1.5的技术创新包括长上下文扩展、简化框架、多模态等，展示了其在人工智能领域的领先技术。

关键观点3: 公开训练技术细节

Kimi团队公开了训练技术细节，包括long2short思维链等关键技术的详细解释，为研究人员提供了有价值的参考。

关键观点4: 从长到短的思考逻辑

Kimi k1.5的设计遵循了从长到短的思考逻辑，通过合并长CoT模型和短CoT模型、应用最短筛选采样等方法，实现了高效的模型合并和响应。

关键观点5: 强大的泛化能力和Token使用效率

Kimi k1.5具备强大的泛化能力和Token使用效率，通过部分回滚技术解决了长CoT特性资源分配和效率挑战，为实际应用的广泛性提供了保障。

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
文章地址：访问文章快照

分享到微博

推荐文章

机器之心 · ICSE 2026杰出论文 | 突破代码模型真实工程落地瓶颈，北大团队提出SEAlign对齐框架：显著提升软件工程智能体决策质量

19 小时前

AI产品阿颖 · Claude Code 创始人在红杉大会上的 7 个重要判断。

昨天

宝玉xp · OpenAI 把 ChatGPT 的默认模型升级成了 GPT-5-20260506014744

2 天前

赛博禅心 · Anthropic 和 OpenAI，同一天成立合资公司

2 天前

赛博禅心 · OpenAI 「实时语音」架构首次公开

2 天前

中国铁建大桥工程局集团 · 献礼华诞丨入围国际隧协“超越工程奖”

1 年前

二手车有料 · 当年档次不输奥迪如今买辆二手车只要几万块

1 年前

杭州网 · 杭州到上海只要4.5元？春运出现“地板价”火车票！还有人买到1.9折车票

1 年前

名城网事 · 明天，22℃！降温+降水在路上……

1 年前

人形机器人产业通 · 中国一汽人形机器人“旗小智”亮相上海车展

1 年前