|
|
在“压缩域”进行视频理解,斯坦福&微软提出 CoPE-VideoLM:视觉 Token 骤降 93%... 我爱计算机视觉 · 公众号 · · 2 月前 · |
|
|
像 H.265 一样‘看’世界:OneVision-Encoder 开源,重新定义视觉 Token ... 我爱计算机视觉 · 公众号 · · 2 月前 · |
|
|
NTIRE 2026移动端真实场景图像超分辨率挑战赛 我爱计算机视觉 · 公众号 · · 2 月前 · |
|
|
视频生成新进展,Adobe & MIT 提出 SCD 架构:将因果推理与迭代去噪彻底解耦 我爱计算机视觉 · 公众号 · · 2 月前 · |
|
|
开源AlphaFace实时换脸:大模型语义加持,41 FPS,极端侧脸也不“崩” 我爱计算机视觉 · 公众号 · · 3 月前 · |
|
|
英伟达开源商用视觉大模型 C-RADIOv4:蒸馏 DINOv3 与 SAM3,参数量仅 1/10 ... 我爱计算机视觉 · 公众号 · · 3 月前 · |
|
|
为什么你的 ControlNet 效果不好?北邮&清华新研究:自编码器才是那个被忽视的“性能上限” 我爱计算机视觉 · 公众号 · · 3 月前 · |
|
|
何恺明团队新作:Drifting Models 开启单步生成新纪元,ImageNet FID 1.5... 我爱计算机视觉 · 公众号 · · 3 月前 · |
|
|
NTIRE 2026 高效低光图像增强挑战赛(Efficient LLIE Challenge) 我爱计算机视觉 · 公众号 · · 3 月前 · |
|
|
AdaptMMBench:多模态大模型自适应推理新基准,首个解耦评测「推理模式选择」与「推理过程质量... 我爱计算机视觉 · 公众号 · · 3 月前 · |