专栏名称: 甲子光年

甲子光年是一家科技智库，包含智库、媒体、社群、企业服务版块，立足于中国科技创新前沿阵地，动态跟踪头部科技企业发展和传统产业技术升级案例，致力于推动人工智能、大数据、物联网、云计算、信息安全、金融科技、大健康等科技创新在产业之中的应用与落地。

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

即刻RSS订阅方法

Meta重金收购，谁会成为“具身的 Scale AI”？｜甲子光年

甲子光年 · 公众号 · 科技自媒体科技创业 · 2025-06-11 19:17

主要观点总结

文章介绍了Scale AI在具身智能领域的作用，重点阐述了仿真合成数据在解决具身智能数据获取难题中的重要性，以及对比了真实数据和仿真合成数据在训练机器人模型中的优缺点。同时，文章通过具体案例展示了如何利用仿真合成数据训练机器人模型，并强调了具有仿真能力和算法Sim2Real能力的数据公司在具身智能领域的发展潜力。

关键观点总结

关键观点1: Meta斥资收购Scale AI，凸显全球科技巨头对“训练数据”的重视

随着AI的发展，训练数据成为关键资源。全球科技巨头如Meta、微软和谷歌都在争夺数据资源，用于提升AI模型的性能。Scale AI作为一个提供大规模训练数据的平台，成为各大科技巨头的争夺对象。

关键观点2: 真实数据与仿真合成数据在具身智能领域的对比

真实数据虽然贴近部署环境，但获取成本高昂且数据量难以支撑大规模训练；仿真合成数据具有可无限扩展、带齐“全标注”和零边际成本等优势，但存在Sim2Real Gap。行业主流做法是将真实数据、互联网数据和仿真合成数据混合训练（Co-Training）。

关键观点3: 仿真合成数据在具身智能领域的重要性日益凸显

仿真合成数据可以解决真实数据获取成本高、隐私风险大、数据质量参差不齐等问题。Gartner预测到2030年，AI模型中的合成数据将完全超过真实数据。顶尖团队已经成功应用仿真合成数据训练机器人模型，并实现了良好效果。

关键观点4: 对具身智能训练中仿真合成数据的两个误解

第一个误解是认为只有真实数据才靠谱，忽略了实景工厂与机器人真实工作环境之间的Gap以及数据采集的效率和成本问题；第二个误解是仿真数据缺乏物理感，难以训练出好模型。然而，随着技术的发展，Sim2Real Gap并非难以跨越，物理真实性的重建对于机器人操作任务更为关键。

关键观点5: 做“有技术门槛的”Scale AI：以光轮智能为例

光轮智能通过仿真合成数据赋能具身智能领域，不仅提供数据服务，还拥有VLA算法能力。通过搭建数字孪生环境、遥操作虚拟机器人完成工厂任务等方式，光轮智能加速了VLA+RL算法训练的体系化能力。这种兼具仿真能力与算法Sim2Real能力的数据公司或许是具身智能领域Scale AI发展的终极方向。

免责声明

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
推荐产品: 推荐产品
文章地址：访问文章快照

分享到微博