ICCV 2025 | 增强生成视频画质！GenVE为视频引入更多具有表现力的细节内容

HiDream智象未来 · 公众号 · · 2025-07-04 09:00

主要观点总结

本文主要介绍了智象未来团队提出的生成式视频画质增强框架GenVE，该框架旨在提升生成视频的主观视觉质量，特别是细节外观的美学表现力。文章介绍了GenVE的研究背景、动机、技术细节、实验结果及未来展望。

当前视频增强技术面临细节缺失的问题，难以满足用户对高质量视觉内容的需求。GenVE旨在通过引入高质量参考图像，实现视频生成中的全局语义与局部纹理对齐，提升视频细节的表现力。

GenVE的核心技术包括语义对齐和纹理对齐。语义对齐通过图像扩散模型生成高质量图像作为语义参考，确保整体布局和高级语义与原始视频帧一致。纹理对齐则利用局部感知交叉注意力模块，精准捕捉高质量图像中的局部纹理细节，并迁移到低质量视频中。

GenVE在多个真实世界视频数据集上取得了显著优势，超越了现有最先进的视频增强方法。视觉效果对比图展示了GenVE在合成更精细、更真实的细节和纹理方面的强大能力，同时的时间一致性也表现突出。

GenVE将持续推动视频生成技术向更高质量、更精细控制的方向发展，为视频创作带来更多可能。

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
文章地址：访问文章快照

分享到微博