专栏名称: 新智元
智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。
TodayRss-海外RSS稳定源
目录
今天看啥  ›  专栏  ›  新智元

首次,AI下棋不再是「黑盒」!

新智元  · 公众号  · AI  · 2025-05-24 12:32
    

主要观点总结

上海AI Lab发布升级版大模型「书生·思客InternThinker」,首度打破围棋AI推理黑盒,具备职业3-5段棋力。该模型通过「通专融合」技术路径和创新训练平台InternBootcamp,构建三层架构体系,推动AI向自我进化、自主科学发现迈进。模型具备自然语言交互性,能解释围棋策略,应对复杂逻辑推理任务。除围棋外,在其他任务中也有不俗表现。研究人员还观察到强化学习的「涌现时刻」。这些进展得益于底层技术的突破,包括记忆体+解码器大模型架构、强化学习算法等。

关键观点总结

关键观点1: 「书生·思客InternThinker」大模型发布

上海AI Lab发布了新一代的大模型,该模型在围棋专业领域具有强大的推理能力,并具备自然语言交互性。

关键观点2: 首次打破围棋AI推理黑盒

大模型首度实现了用自然语言解释围棋策略,打破了长期存在的“黑盒”问题。

关键观点3: 具备职业3-5段棋力

模型能够展示出色的围棋策略分析,被评价为具有职业3-5段的棋力。

关键观点4: 「通专融合」技术路径和Innovation训练平台

大模型通过「通专融合」技术路径和创新训练平台InternBootcamp,构建了一个高效的三层架构体系。

关键观点5: 强化学习的「涌现时刻」

研究人员观察到强化学习中的「涌现时刻」,即多个任务混合训练后,模型能够成功获取任务的正向反馈,实现领域外专业任务的有效强化学习训练。

关键观点6: 底层技术突破

团队在底层技术方面取得了一系列突破,包括记忆体+解码器大模型架构、强化学习算法等。


免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址:访问原文地址
总结与预览地址:访问总结与预览
文章地址: 访问文章快照