专栏名称: 自动驾驶之心

自动驾驶开发者社区，关注计算机视觉、多维感知融合、部署落地、定位规控、领域方案等，坚持为领域输出最前沿的技术方向！

购买VIP

购买成为VIP，可查看文章或者RSS订阅

提交新专栏

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

小宇宙RSS订阅方法

X平台RSS订阅方法

油管文字版RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

TodayRss-海外RSS稳定源

超越DriveVLA-W0！DriveLaW：世界模型表征一统生成与规划（华科&小米）

自动驾驶之心 · 公众号 · · 2026-01-04 08:51

主要观点总结

本文介绍了DriveLaW，一种统一的潜在世界模型，旨在解决自动驾驶中视频生成与运动规划之间的脱节问题。该模型包括时空生成模块DriveLaW-Video和基于扩散的规划器DriveLaW-Act。通过采用噪声重注入机制、三阶段渐进式训练策略等技术，DriveLaW在nuScenes和NAVSIM基准测试中达到了最先进的性能。论文还介绍了相关工作的背景、方法、实验结论等。

关键观点总结

关键观点1: 研究背景

自动驾驶中的世界模型旨在将物理世界的结构与动力学内化为预测性的潜在表征。近期，世界模型在自动驾驶中的应用已经取得了显著进展，但仍然面临规划层面的贡献往往是间接的或与规划器并行的问题，缺乏与决策过程的紧密耦合。

关键观点2: 研究方法

本文提出了DriveLaW，一个统一的世界模型框架，旨在通过共享潜在空间表征将视频生成与轨迹规划深度耦合。其核心由两部分组成：时空视频生成器DriveLaW-Video和基于扩散的规划器DriveLaW-Act。通过采用噪声重注入机制、时空VAE、视频Transformer结构等技术，实现了高保真视频生成和稳定轨迹规划。

关键观点3: 实验结果

在nuScenes数据集上的生成评估中，DriveLaW超越了以往的所有单视图方法，达到了最先进的性能。在NAVSIM基准测试中，DriveLaW获得了89.1的PDMS，超越了传统的端到端规划器和其它世界模型方法。此外，增加视频生成器的预训练样本量持续提升了DriveLaW的闭环性能。

关键观点4: 结论

本文提出的DriveLaW统一了驾驶视频生成和规划决策过程，通过共享潜在空间表征，实现了端到端的自动驾驶。实验结果证明了该方法的有效性。

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
文章地址：访问文章快照

分享到微博

推荐文章

云南网 · 云南景洪市市场监管局发布情况通报

昨天

云南网 · 云南四地发布干部任前公示公告

昨天

昆明信息港 · 向婴儿食品投鼠药，39岁男子被抓！

2 天前

掌上春城 · 孙建军等6名同志拟任职务公示

3 天前

编辑校对 · 【52学时北京】期刊创新发展与版权保护培训班

1 年前

石墨烯联盟 · 征稿|石墨烯创新大会联手国际石墨烯专业期刊《GIT》面向全球征集优秀石墨烯技术创新成果

1 年前

深圳本地宝 · 2024深圳中小学期末考试时间是什么时候？

1 年前

科学未来人 · 女方彩礼/嫁妆给的少，嫁过去可能被虐打甚至烧死。印度每年至少80-20241216142633

1 年前

雪球 · 【2月17日涨停分析】今日共103股涨停，连板股总数22只，51-20250217154951

1 年前