专栏名称: 智能视听研究院

建设具有国际影响力、华南地区最重要的视听技术创新基地，以及国家自主视听 AVS标准的运营总部和音视频处理和分析芯片设计、生产基地。

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

即刻RSS订阅方法

清华、星动纪元开源首个AIGC机器人大模型，入选ICML2025 Spotlight

智能视听研究院 · 公众号 · 科技创业科技自媒体 · 2025-05-09 18:03

主要观点总结

本文主要介绍了AIGC生成式技术在具身智能机器人领域的应用，以及清华大学叉院ISRLab和星动纪元团队开发的AIGC生成式机器人大模型VPP。该模型利用预训练视频生成大模型，实现了从数字世界到具身智能物理世界的转变。文章还介绍了VPP在机器人策略泛化、预测视觉表征、高频预测和执行、跨本体学习等方面的优势，以及在Calvin ABC-D基准测试中的领先表现。最后，文章讨论了未来机器人技术的发展趋势和前景。

关键观点总结

关键观点1: AIGC生成式技术在具身智能机器人领域的应用

AIGC技术使得机器人能够执行复杂的任务，例如盛汤等，这背后的技术来自于清华大学叉院的ISRLab和星动纪元团队开发的AIGC生成式机器人大模型VPP。

关键观点2: VPP模型的优势

VPP模型利用预训练视频生成大模型，实现了机器人策略的泛化，解决了diffusion推理速度的问题，让机器人实时进行未来预测和动作执行。此外，VPP还具有预测视觉表征、高频预测和执行、跨本体学习等优势。

关键观点3: VPP在基准测试中的表现

在Calvin ABC-D基准测试中，VPP实现了4.33的任务完成平均长度，已经接近任务的满分5.0，相较于先前技术有显著提升。

关键观点4: 未来机器人技术的发展趋势和前景

随着AIGC生成式技术和机器人技术的不断发展，未来机器人将实现更加智能化的操作，具备更强的多任务学习能力和泛化能力。同时，随着开源优质模型与技术的推动，机器人技术将迈向一个崭新的阶段。

免责声明

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
推荐产品: 推荐产品
文章地址：访问文章快照

分享到微博

推荐文章

安徽工信 · 安徽产业群像丨一路向“新” 畅“显”未来

14 小时前

化工365 · 3人受伤1人失踪！一工厂疑似过氧化氢原料爆炸

21 小时前

文娱价值官 · 在抖音电商，“小兴趣”如何撬动“大生意”

昨天

Z Finance · 速递｜通义语音大牛鄢志杰转投京东，阿里高P技术骨干正遭大厂集体“围猎”

昨天

小鹿学Java · 工资4k，但私活收入过5w，离谱...

2 天前

酒店人 · 深圳罗湖木棉花酒店——招贤纳新·职等你来

1 年前

最设计 · 这些设计，太“横”了！（续三）

1 年前

深交所 · 证监会有关部门负责人就程序化交易监管进展情况答记者问

1 年前

GameLook · 与3A大佬合作生变，网易海外工作室Worlds Untold宣布暂停运营

8 月前

广东应急管理 · “孤岛”48小时：断电、断网、断路，怀集白良村如何绝境求生？

1 月前