|
|
阿里通义Lab提出LLMDet!利用LLM构建强大的开放词汇检测模型!超过Grounding DIN... AIWalker · 公众号 · · 1 年前 · |
|
|
英伟达提出首个Mamba-Transformer视觉骨干网络!打破精度/吞吐瓶颈 | CVPR 20... AIWalker · 公众号 · · 1 年前 · |
|
|
CVPR 2025 | 低层交互破局!GIFNet实现多模态融合通用模型,单一框架横扫多任务场景 AIWalker · 公众号 · · 1 年前 · |
|
|
能效提升8.64倍!庆应义塾大学提出AHCPTQ!SAM模型的量化革命! AIWalker · 公众号 · · 1 年前 · |
|
|
革命性突破!中国传媒大学提出DLF范式!引领极端图像压缩革命! AIWalker · 公众号 · · 1 年前 · |
|
|
少至8Token完成视觉重建!Apple提出FlexTok!可变长度图像Tokenizer !性能超... AIWalker · 公众号 · · 1 年前 · |