专栏名称: 甲子光年
甲子光年是一家科技智库,包含智库、媒体、社群、企业服务版块,立足于中国科技创新前沿阵地,动态跟踪头部科技企业发展和传统产业技术升级案例,致力于推动人工智能、大数据、物联网、云计算、信息安全、金融科技、大健康等科技创新在产业之中的应用与落地。
目录
今天看啥  ›  专栏  ›  甲子光年

Meta重金收购,谁会成为“具身的 Scale AI”?|甲子光年

甲子光年  · 公众号  · 科技自媒体 科技创业  · 2025-06-11 19:17
    

主要观点总结

文章介绍了Scale AI在具身智能领域的作用,重点阐述了仿真合成数据在解决具身智能数据获取难题中的重要性,以及对比了真实数据和仿真合成数据在训练机器人模型中的优缺点。同时,文章通过具体案例展示了如何利用仿真合成数据训练机器人模型,并强调了具有仿真能力和算法Sim2Real能力的数据公司在具身智能领域的发展潜力。

关键观点总结

关键观点1: Meta斥资收购Scale AI,凸显全球科技巨头对“训练数据”的重视

随着AI的发展,训练数据成为关键资源。全球科技巨头如Meta、微软和谷歌都在争夺数据资源,用于提升AI模型的性能。Scale AI作为一个提供大规模训练数据的平台,成为各大科技巨头的争夺对象。

关键观点2: 真实数据与仿真合成数据在具身智能领域的对比

真实数据虽然贴近部署环境,但获取成本高昂且数据量难以支撑大规模训练;仿真合成数据具有可无限扩展、带齐“全标注”和零边际成本等优势,但存在Sim2Real Gap。行业主流做法是将真实数据、互联网数据和仿真合成数据混合训练(Co-Training)。

关键观点3: 仿真合成数据在具身智能领域的重要性日益凸显

仿真合成数据可以解决真实数据获取成本高、隐私风险大、数据质量参差不齐等问题。Gartner预测到2030年,AI模型中的合成数据将完全超过真实数据。顶尖团队已经成功应用仿真合成数据训练机器人模型,并实现了良好效果。

关键观点4: 对具身智能训练中仿真合成数据的两个误解

第一个误解是认为只有真实数据才靠谱,忽略了实景工厂与机器人真实工作环境之间的Gap以及数据采集的效率和成本问题;第二个误解是仿真数据缺乏物理感,难以训练出好模型。然而,随着技术的发展,Sim2Real Gap并非难以跨越,物理真实性的重建对于机器人操作任务更为关键。

关键观点5: 做“有技术门槛的”Scale AI:以光轮智能为例

光轮智能通过仿真合成数据赋能具身智能领域,不仅提供数据服务,还拥有VLA算法能力。通过搭建数字孪生环境、遥操作虚拟机器人完成工厂任务等方式,光轮智能加速了VLA+RL算法训练的体系化能力。这种兼具仿真能力与算法Sim2Real能力的数据公司或许是具身智能领域Scale AI发展的终极方向。


免责声明

免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址:访问原文地址
总结与预览地址:访问总结与预览
推荐产品:   推荐产品
文章地址: 访问文章快照