今天看啥  ›  专栏  ›  焉知汽车

超越DiffusionDrive!华科提出ReCogDrive:结合强化学习的三阶段VLA训练框架~

焉知汽车  · 公众号  · 科技创业 科技自媒体  · 2025-07-06 22:58
    

主要观点总结

文章介绍了两种自动驾驶技术:DiffusionDrive和ReCogDrive。前者是一种用于实时端到端自动驾驶的扩散模型,解决了普通扩散策略在机器人场景中的挑战。后者则是一个结合视觉-语言大模型(VLMs)与强化学习增强的扩散规划器的端到端自动驾驶系统。文章还详细描述了ReCogDrive的多个组成部分及其实验验证。

关键观点总结

关键观点1: DiffusionDrive的特点和创新

解决了普通扩散策略在交通场景中的模式崩溃和计算开销大问题,提出了截断扩散策略和级联扩散解码器。

关键观点2: ReCogDrive的系统构成

结合了VLMs的泛化能力与扩散模型的轨迹生成能力。使用大规模驾驶问答数据对VLMs进行驾驶场景适应,引入基于扩散模型的规划器和模拟器辅助的强化学习提升轨迹质量。

关键观点3: ReCogDrive的实验结果

在NAVSIM数据集上实现了89.6的PDMS分数,超过了现有方法。通过结合驾驶问答数据、扩散模型和强化学习,模型能够生成平滑、舒适、安全的驾驶轨迹。

关键观点4: 关于华中科技大学王兴刚课题组的信息

介绍了课题组的负责人王兴刚及其科研成果,包括CCNet、Mask Scoring R-CNN、FairMOT、ByteTrack、EVA和Vim等,并阐述了其在计算机视觉、深度学习等领域的研究工作。


免责声明

免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址:访问原文地址
总结与预览地址:访问总结与预览
推荐产品:   推荐产品
文章地址: 访问文章快照