主要观点总结
本文是对Tesla FSD(自动驾驶系统)的解析,针对最近关于FSD是否是一个端到端大模型的争议进行了阐述。
关键观点总结
关键观点1: Tesla FSD被认为是一个大模型。
根据ICCV上Ashok的分享以及著名Tesla黑客green的发现,证实Tesla端到端自动驾驶使用的是一个大模型来完成Photon In到Control Out的计算。
关键观点2: 质疑FSD是一个大型网络的主要原因在于发现FSD模型参数文件数量众多但规模不大。
green发现的模型参数文件中有数量众多但规模不大的参数文件可能不属于端到端网络,实际上是一些小的任务Head的模型参数。
关键观点3: Tesla FSD在显存带宽上的优化。
HW4上使用的GDDR6显存带宽高达384GB/s,理论上可以在36Hz支持约100亿参数的端到端模型。此外,Tesla使用了类似MOE的架构,通过部分激活专家网络,节省显存带宽开销,最大程度提升模型等效参数量。
关键观点4: 关于FSD是否使用独立小模型的讨论。
原文中提到的根据人工设计的规则完全切换一套独立的小模型的方式不仅不端到端,而且实际很难实现,因为在场景切换的过程中很难保证前后模型输出的轨迹可以平滑连接。
关键观点5: 对FSD技术先进性的评价。
作者认为FSD代表了先进的科技进步,不仅是因为科学家们的发现,更是因为工程创新。马斯克作为美国工程院院士,其公司和团队的技术不能被简单地称为落后或伪装。
免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。
原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过
【版权申诉通道】联系我们处理。