奔驰&图宾根联合新作！SpaceDrive：为自动驾驶VLA注入空间智能

自动驾驶之心 · 公众号 · 自动驾驶 · 2025-12-19 13:46

主要观点总结

SpaceDrive：为自动驾驶注入空间感知能力的新方法

SpaceDrive通过引入3D位置编码（Positional Encoding, PE）作为通用的空间表征，解决了VLM在处理精细的3D空间关系时的缺陷。这种方法能够显著提升系统的空间推理和轨迹规划能力。

SpaceDrive的核心在于摒弃了传统VLM将坐标数值视为文本token的处理方式，转而采用显式的、统一的3D位置编码作为空间表征。这种编码方式显著提高了系统的空间感知能力。

SpaceDrive通过将视觉token与3D PE在特征空间进行显式融合，实现了视觉与文本的融合。这种融合方式有助于提高系统对场景的描述能力和空间推理能力。

论文在nuScenes数据集和Bench2Drive基准测试上对SpaceDrive进行了开环和闭环规划验证。实验结果表明，SpaceDrive在各项指标上均超越了现有的VLM-based方法，验证了其有效性。

SpaceDrive框架具备通用性，可以应用于不同的VLM架构，并证明适用于推理时增强功能，如思维链推理。

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
文章地址：访问文章快照

分享到微博