|
|
聚合和适应自然语言提示用于 CLIP 的下游泛化 FightingCV · 公众号 · · 1 年前 · |
|
|
探讨CLIP在免训练开放词汇语义分割中的潜力 FightingCV · 公众号 · · 1 年前 · |
|
|
CLIP-Count:迈向文本引导的零样本目标计数 FightingCV · 公众号 · · 1 年前 · |
|
|
VideoRAG: 视觉对齐检索增强长视频理解 FightingCV · 公众号 · · 1 年前 · |
|
|
小米60k感知算法岗面试,考察热门Occ算法及难点! FightingCV · 公众号 · · 1 年前 · |
|
|
即插即用,显著涨点的模块总结 FightingCV · 公众号 · · 1 年前 · |
|
|
MedCLIP-SAM:桥接文本和图像,实现通用医学图像分割 FightingCV · 公众号 · · 1 年前 · |
|
|
多模态数据融合如何进行时空序列建模 FightingCV · 公众号 · · 1 年前 · |
|
|
CLIP 走向 3D:利用快速调整实现基于语言的3D 识别 FightingCV · 公众号 · · 1 年前 · |