今天看啥  ›  专栏  ›  AI生成未来

ICCV`25 | 定制视频革命!中科大DualReal:让身份与运动共舞的高保真定制视频引擎

AI生成未来  · 公众号  · 科技创业 科技自媒体  · 2025-07-25 00:01
    

主要观点总结

这篇文章介绍了DualReal:一种面向给定主体身份与运动动态的定制化视频生成新方法。该方法通过自适应联合训练身份与运动两大维度,有效化解了二者之间的冲突,实现高保真且流畅的定制化视频输出。

关键观点总结

关键观点1: 解决传统视频定制化生成的问题

传统视频定制化生成多聚焦于“身份驱动”或“运动驱动”单一维度,忽略两者的内在约束与协同依赖,导致一致性退化。DualReal在主体身份和运动动态两个模式上进行自适应联合训练,实现高质量的定制化生成任务。

关键观点2: DualReal的技术特点

DualReal应用的技术包括双域感知适配模块、阶段融合控制器等。双域感知适配模块在解决维度冲突的同时实现身份和动作的联合训练;阶段融合控制器根据不同去噪阶段及DiT网络各深度层次,分配细粒度权重,自适应控制身份与运动适配器输出的贡献。

关键观点3: DualReal的效果

DualReal实现了高保真且流畅的定制化视频输出,结合先进的DiT视频生成模型,在保持主体身份高保真的同时,实现了流畅的定制运动。在多项评估指标上实现领先。


免责声明

免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址:访问原文地址
总结与预览地址:访问总结与预览
推荐产品:   推荐产品
文章地址: 访问文章快照
推荐文章