|
|
ACM MM 25 当MLLM遇上行人重识别:是“降维打击”还是“水土不服”?深度评测来了! 我爱计算机视觉 · 公众号 · · 6 月前 · |
|
|
AI“世界模型”离真实手术还有多远?首个外科视频生成基准SurgVeo揭示“合理性差距” 我爱计算机视觉 · 公众号 · · 6 月前 · |
|
|
NeurIPS25 | 清华&北大提出LinearDiff-ViT:让Transformer学会“找... 我爱计算机视觉 · 公众号 · · 6 月前 · |
|
|
有趣的迁移!港科大、港大等提出MedSapiens:让“人体姿态”模型“看懂”医学影像,人体解剖标志... 我爱计算机视觉 · 公众号 · · 6 月前 · |
|
|
生成确能辅助理解!多模态新基准Uni-MMMU:“边画边想”,考验大模型「理解-生成」双向协同能力 我爱计算机视觉 · 公众号 · · 6 月前 · |
|
|
TRO'25开源|机器人建图的终局?一个框架搞定光学、几何与语义! 我爱计算机视觉 · 公众号 · · 6 月前 · |
|
|
新国大发布Med-Banana-50K:首个5万张规模、跨模态医学图像编辑数据集 我爱计算机视觉 · 公众号 · · 6 月前 · |