|
|
LLaDA-VLA:首个视觉-语言-扩散-行动模型,显著超越现有VLA 我爱计算机视觉 · 公众号 · · 7 月前 · |
|
|
用统计学“净化”数据集:Beta-SOD框架让噪声Re-ID任务重获新生 我爱计算机视觉 · 公众号 · · 7 月前 · |
|
|
ICCV 2025 | 告别黑暗中的“盲视”:Dark-ISP让RAW图像在微光检测中大放异彩 我爱计算机视觉 · 公众号 · 科技自媒体 · 8 月前 · |
|
|
L-RPCANet:轻量、鲁棒、可解释,红外小目标检测迎来新框架 我爱计算机视觉 · 公众号 · · 8 月前 · |
|
|
暴力事件检测数据集:GTA-Crime,游戏里生成数据,现实中检测致命暴力 我爱计算机视觉 · 公众号 · · 8 月前 · |
|
|
CoRL 2025 | VLM的社交导航能力“翻车”了?德州大学奥斯汀分校发布SocialNav-S... 我爱计算机视觉 · 公众号 · · 8 月前 · |
|
|
导师放养,毕业压力,博士申请,斩获offer,“怒”发顶会! 我爱计算机视觉 · 公众号 · · 8 月前 · |
|
|
TPAMI 2025 | H2OT:分层沙漏型Tokenizer,重塑高效视频姿态Transform... 我爱计算机视觉 · 公众号 · · 8 月前 · |
|
|
TPAMI 2025 | IGEV++:迭代多范围几何编码,刷新立体匹配技术新高度 我爱计算机视觉 · 公众号 · · 8 月前 · |
|
|
IEEE TPAMI 2025| PointGST:参数量仅0.67%,精度首破99%,三维点云处理... 我爱计算机视觉 · 公众号 · · 8 月前 · |
|
|
ICCV 2025 | MOSEv2 全新亮相,第七届 LSVOS 挑战赛正式开启! 我爱计算机视觉 · 公众号 · · 8 月前 · |
|
|
腾讯 ARC Lab 开源 IC-Custom :一个强大且灵活的图像定制化工具! 我爱计算机视觉 · 公众号 · · 8 月前 · |