专栏名称: 焉知汽车

聚焦ADAS、自动驾驶、车联网科技资讯、知识等。

购买VIP

购买成为VIP，可查看文章或者RSS订阅

提交新专栏

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

小宇宙RSS订阅方法

X平台RSS订阅方法

Telegram频道RSS订阅方法

油管文字版RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

TodayRss-海外RSS稳定源

小鹏最新！NavigScene：全局导航实现超视距自动驾驶VLA（ACMMM'25）

焉知汽车 · 公众号 · 自动驾驶科技媒体 · 2025-07-16 20:38

主要观点总结

本文解决自动驾驶系统中局部传感器数据与全局导航背景之间的脱节问题，提出NavigScene辅助导航引导自然语言数据集。通过三种互补范式：导航引导推理、导航引导偏好优化和导航引导视觉-语言-动作模型，在问答、感知、预测和规划等驾驶相关任务中显著提高自动驾驶系统的性能。实验结果表明，NavigScene显著提高了VLMs在驾驶相关问答任务中的推理能力，增强了端到端驾驶系统的泛化能力。

关键观点总结

关键观点1: 提出了NavigScene数据集，解决局部传感器数据与全局导航背景之间的脱节问题。

NavigScene是一个辅助性的导航引导自然语言数据集，通过模拟类人驾驶环境，在自动驾驶系统中引入全局导航知识，提高系统的推理和泛化能力。

关键观点2: 提出了三种互补的范式来利用NavigScene数据集。

1. 导航引导推理：通过结合导航上下文增强视觉-语言模型的推理能力；2. 导航引导偏好优化：扩展直接偏好优化，通过建立对导航相关汇总信息的偏好来改进视觉-语言模型的响应；3. 导航引导视觉-语言-动作模型：将导航指导与视觉-语言模型和传统驾驶模型集成，提高感知、预测和规划任务的性能。

关键观点3: 实验结果证明了NavigScene和三种范式的有效性。

在问答任务、感知、预测和规划等实验中，使用NavigScene和三种范式的自动驾驶系统性能显著提高，证明了其在实际应用中的价值。

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
文章地址：访问文章快照

分享到微博

推荐文章

IT之家 · 【659 元，雷鸟 Q5AD YYDS 款 24.5 英寸 30-20260517215232

18 小时前

虎嗅APP · AI到底会不会让大学变成一堆没用的砖头？

22 小时前

IT之家 · 手机电池容量“越用越大”！小米出奇招

昨天

新浪科技 · #蔚来总裁称超豪华车不该卖100万以上#【蔚来总裁秦力洪：大部分-20260516212000

昨天

InfoQ · OpenAI把手伸进你的钱包了！ChatGPT 打通银行 API，全网炸锅：这是给黑客发年终奖？

2 天前

独角兽智库 · 工信部重磅喊话新型储能，关注电池新技术（附股）

1 年前

农民日报 · “蹭饭书记”蹭出的是民心暖心，模仿“蹭饭”可别蹭歪了！

9 月前

东方财富-研究报告-个股研报 · [国元证券][][苏交科]2025年三季报点评：业绩短期承压，低空经济与数字化构筑新增长极

6 月前

一心谈药 · 头发太长会抢夺人体内的营养？

6 月前

财联社-电报-加红 · 商业航天概念持续走强中国卫星涨停创10年多新高

4 月前