|
Vision-R1:激励多模态大语言模型的推理能力 FightingCV · 公众号 · · 2 月前 · |
|
解决CLIP在组合式零样本学习中的固有局限性 FightingCV · 公众号 · · 2 月前 · |
|
用于统一物理数字人脸攻击检测的 La-SoftMoE CLIP FightingCV · 公众号 · · 2 月前 · |
|
HairCLIP:通过文本和参考图像设计您的发型 FightingCV · 公众号 · · 3 月前 · |