专栏名称: 量子位
վ'ᴗ' ի 追踪AI行业和技术动态,这里更快一步!关注我们,回复“今天”,更多大新闻等你来发现
目录
今天看啥  ›  专栏  ›  量子位

阿里开源电影级AI视频模型!MoE架构,5B版本消费级显卡可跑

量子位  · 公众号  · AI  · 2025-07-29 08:40
    

主要观点总结

文章介绍了阿里开源的新一代视频生成模型Wan2.2,包括文生视频、图生视频和混合视频生成。Wan2.2率先将MoE架构实现到了视频生成扩散模型中,可实现电影级效果。模型具有强大的电影级美学控制系统,用户可通过选择美学关键词获取电影质感的视频画面。此外,Wan2.2还在复杂运动能力和复杂指令遵循能力方面有了大幅度提升。

关键观点总结

关键观点1: Wan2.2是首个将MoE架构引入视频生成的模型

MoE架构通过将复杂输入拆分给多个专家模型分别处理,实现在模型参数扩充的前提下,不额外增加多余的计算负载。Wan2.2根据扩散模型的阶段性降噪过程,利用信噪比将模型分为高噪模型和低噪模型。

关键观点2: Wan2.2实现了电影级美学控制

用户可通过选择美学关键词,如光影氛围塑造、镜头语言表达和色彩情绪渲染等,获取电影质感的视频画面。模型还提供不同的镜头焦距和镜头类型等。

关键观点3: Wan2.2在复杂运动能力和指令遵循能力方面有所提升

模型针对面部表情、手部运动、单人与多人交互以及高强度复杂体育运动的真实性进行了优化。此外,模型还具有强大的复杂指令遵循能力,可以生成物理规律严谨且细节丰富的现实世界动态表现。


免责声明

免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址:访问原文地址
总结与预览地址:访问总结与预览
推荐产品:   推荐产品
文章地址: 访问文章快照