|
|
视觉几何嵌入Transformer(VGGT):前馈神经网络直接估算多输入视图三维场景属性,多任务领... 智驾实验室 · 公众号 · · 1 年前 · |
|
|
DEST:受状态空间模型启发的3D目标检测范式,以新颖参数化及四设计提升室内检测性能创 SOTA ! 智驾实验室 · 公众号 · · 1 年前 · |
|
|
L2COcc:轻量级以相机为中心的语义场景补全框架,借EVT与跨模态知识模块降负担、提精度! 智驾实验室 · 公众号 · · 1 年前 · |
|
|
ChatBEV-QA:新颖BEV问答基准助力交通场景理解,微调ChatBEV及语言驱动流水线增强场景... 智驾实验室 · 公众号 · · 1 年前 · |
|
|
TransMamba:跨架构训练实现Transformer知识向Mamba迁移,两阶段策略及多方法赋... 智驾实验室 · 公众号 · · 1 年前 · |