冷静看待VLA：不是救世主，也不是“垃圾”

自动驾驶之心 · 公众号 · · 2025-12-26 17:18

主要观点总结

本文讨论了关于自动驾驶中的VLA技术的一些批判和观点。文章指出了一些关于VLA技术的槽点，如任务设置过于简单、背景单一等。同时，文章也提到了NVIDIA的CoT-VLA工作，展示了VLA思维链的拆分，包括LLM、VLM和Policy模型的作用。文章还讨论了模型的泛化能力，提到了subgoal embedding的设计对模型表现的重要性。最后，文章表达了对纯end-to-end方法的质疑，并提倡按照VLA思维链去构建模型。

关键观点总结

关键观点1: 文章概述了VLA技术在自动驾驶中的争议点。

作者指出了VLAVLA技术的几个主要问题，包括任务设置过于简单和数据背景过于单一等。

关键观点2: NVIDIA的CoT-VLA工作的介绍。

作者对NVIDIA的CoT-VLA工作进行了介绍，指出该工作展示了VLA思维链的拆分，包括LLM、VLM和Policy模型的应用。

关键观点3: 模型的泛化能力的重要性。

文章强调了模型的泛化能力在自动驾驶中的重要性，并讨论了如何设计subgoal embedding来保证模型的泛化性能。

关键观点4: 对纯end-to-end方法的质疑。

作者表达了对纯end-to-end方法的质疑，认为这种方法可能无法训出真正的通用AGI，并提倡按照VLA思维链去构建模型，通过拆分任务和训练action head来执行。

关键观点5: 对研究态度和实验内容的评价。

作者表达了对某些研究态度和实验内容的批评，认为某些研究过于注重简单的场景和任务，忽视了模型的泛化能力和实际应用价值。

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
文章地址：访问文章快照

分享到微博