阿里开源电影级AI视频模型！MoE架构，5B版本消费级显卡可跑

量子位 · 公众号 · AI · 2025-07-29 08:40

主要观点总结

文章介绍了阿里开源的新一代视频生成模型Wan2.2，包括文生视频、图生视频和混合视频生成。Wan2.2率先将MoE架构实现到了视频生成扩散模型中，可实现电影级效果。模型具有强大的电影级美学控制系统，用户可通过选择美学关键词获取电影质感的视频画面。此外，Wan2.2还在复杂运动能力和复杂指令遵循能力方面有了大幅度提升。

关键观点总结

关键观点1: Wan2.2是首个将MoE架构引入视频生成的模型

MoE架构通过将复杂输入拆分给多个专家模型分别处理，实现在模型参数扩充的前提下，不额外增加多余的计算负载。Wan2.2根据扩散模型的阶段性降噪过程，利用信噪比将模型分为高噪模型和低噪模型。

关键观点2: Wan2.2实现了电影级美学控制

用户可通过选择美学关键词，如光影氛围塑造、镜头语言表达和色彩情绪渲染等，获取电影质感的视频画面。模型还提供不同的镜头焦距和镜头类型等。

关键观点3: Wan2.2在复杂运动能力和指令遵循能力方面有所提升

模型针对面部表情、手部运动、单人与多人交互以及高强度复杂体育运动的真实性进行了优化。此外，模型还具有强大的复杂指令遵循能力，可以生成物理规律严谨且细节丰富的现实世界动态表现。

免责声明

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
推荐产品: 推荐产品
文章地址：访问文章快照

分享到微博

推荐文章

机器之心 · 全网苦等GPT-5，超级对齐团队遗作成重要线索，奥特曼发话「惊喜很多」

9 小时前

机器之心 · 拒绝了Meta 15亿美元的AI大牛原来是他

11 小时前

量子位 · IOI中国队全员金牌夺冠！奥赛打成乒乓，浙江中学生扛起3/4

昨天

Z Finance · 深度｜YC深度分享：依赖“听话”生存的职业路径，正逐步被模型替代，决定个体价值的是判断力、自主性及动手解决问题的能力

昨天

黄建同学 · 新的RAG架构——《Graph-R1: Towards Agen-20250802075225

昨天

OFweek维科网 · 宁德时代一客户摘牌退市！

9 月前

秋叶AIExcel · 你更适合做什么小红书赛道博主⁉️这篇教会你📚

7 月前

AIGC新智界 · 媒体再爆：OpenAI的GPT-5训练遇阻，时间延迟且成本高昂

7 月前

山西省商务厅 · 产品服务供给充足完善政策创新场景 “五一”假期，消费市场持续升温

3 月前

余姚明生活 · 深夜“炸街”半小时！余姚这段新修的马路竟成摩托车炫技场！

2 月前