【中国科学院大学】Plan-R1：将安全且可行的轨迹规划作为语言建模

自动驾驶专栏 · 公众号 · 科技创业自动驾驶 · 2025-06-08 15:10

主要观点总结

本文提出一种新型的两阶段轨迹规划框架Plan-R1，用于安全且可行的自动驾驶轨迹规划。受到大型语言模型成功的启发，将轨迹规划问题转化为原则对齐的序列预测任务。通过专家数据的运动token预测进行自回归预训练，并使用基于规划的奖励进行强化学习微调，使预测结果与规划原则一致。在nuPlan基准上的实验表明，Plan-R1显著提高规划的安全性和可行性，实现最先进的性能。

关键观点总结

关键观点1: 新的视角将轨迹规划问题转化为原则对齐的序列预测任务。

本文首次提出将轨迹规划问题转化为原则对齐的序列预测任务，实现了行为学习和规划原则的对齐解耦。

关键观点2: 引入两阶段轨迹规划框架Plan-R1。

Plan-R1结合了自回归预训练和强化学习微调，以符合规划原则。通过预训练捕获专家演示的多模态分布，然后通过强化学习微调自车策略。

关键观点3: 设计可解释的、基于规则的奖励函数。

这些奖励函数用于捕获基本的规划原则，如可行驶区域合规性、避障、速度限制合规性和驾驶舒适性，以指导强化学习微调。

关键观点4: 在nuPlan基准上实现SOTA性能。

实验结果表明，Plan-R1显著提高规划轨迹的安全性和可行性，特别是在反应式闭环仿真环境中优于现有的规划器。

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
文章地址：访问文章快照

分享到微博

推荐文章

上海科创服务 · 2026年度上海市高新技术企业认定管理相关申报指南

昨天

IPO早知道 · 中科类脑刘海峰：普惠AI核心在于效能革命，需关注能源成本向智能价值转化效率

2 天前

创乎 · 免费融资辅导”正在拖垮你的公司：一个FA的良心话

2 天前

信而泰XINERTEL · 邀请函 | 信而泰邀您参加2024第三届上海网络安全博览会暨发展论坛

1 年前

三节课 · 没上班觉得天要塌了，一上班天真的塌了...

1 年前

大河报 · 李成伟已任郑州大学党委书记，此前任河南农业大学党委书记

1 年前

医学生 · 【医者手记】肝胆外科医生的苦与甜

11 月前

新东方家庭教育 · 父母请自查：这5大行为，正在毁掉你的孩子！希望你一个都没有（深度好文）

9 月前