专栏名称: 36氪Pro
「36氪Pro」是36氪推出的全新品牌,旨在为优秀的创新者,提供优质内容及深度服务。
TodayRss-海外RSS稳定源
目录
今天看啥  ›  专栏  ›  36氪Pro

罗福莉的两个反共识

36氪Pro  · 公众号  ·  · 2025-12-18 15:57
    

主要观点总结

本文介绍了小米MiMo大模型的负责人罗福莉在小米“人车家全生态合作伙伴大会”上的公开发表演讲。罗福莉介绍了小米发布的大语言模型MiMo-V2-Flash的特点和优势,包括更强的代码和工具调用能力、更高推理效率和更低成本、更强的强化学习训练等。她还谈到了AI的发展路径和小米在大模型方面的创新,包括模型架构的创新和扩展强化学习训练的思考。同时,她也提出了对当前AI行业的反共识看法,认为大模型需要从感知磨砺和与世界产生交互的环节入手,需要有一个和物理世界产生交互的物理模型,真正的智能是在交互里产生的。此外,她还强调了研究文化和研究方法的重要性,认为算力和数据不是真正的AI护城河。

关键观点总结

关键观点1: 罗福莉介绍了小米发布的大语言模型MiMo-V2-Flash的特点和优势。

MiMo-V2-Flash具有更强的代码和工具调用能力、更高的推理效率和更低的成本。采用了Hybrid Attention架构,包括混合滑动窗口注意力和全局注意力的混合使用。也挖掘了MTP(多令牌预测)的潜力,提升了基座模型的潜能。

关键观点2: 罗福莉对当前AI行业的反共识看法。

罗福莉认为大模型的发展像是空中楼阁,缺乏与现实世界的交互。她强调AI的下一个起点是需要一个和物理世界产生交互的物理模型,真正的智能是在交互里产生的。

关键观点3: 小米在大模型方面的创新和思考。

小米在大模型方面进行了模型架构的创新和强化学习训练的思考。除了预训练方面的创新,小米也在思考如何扩展强化学习训练。罗福莉提出了MOPD(多教师在线策略蒸馏)范式,这是一种学习效率更高的模式。


免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址:访问原文地址
总结与预览地址:访问总结与预览
文章地址: 访问文章快照
推荐文章