专栏名称: 智东西

智东西－聚焦智能变革，服务产业升级！作为智能行业新锐媒体，智东西专注五大领域：VR/AR；AI/机器人/无人机；智能汽车/智能出行；智能家居/物联网；智能穿戴/智能医疗，通过内容、活动、报告以及社群等方式助力“智能＋”时代的创业和产业升级。

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

即刻RSS订阅方法

阿里又开源了！电影级视频模型，业界首用MoE架构，通义App已上线

智东西 · 公众号 · 科技媒体 · 2025-07-28 22:28

主要观点总结

阿里通义万相团队推出首个开源MoE视频生成模型Wan2.2，包括文生视频、图生视频和统一视频生成三款模型。该模型在光影、构图、色彩等美学要素上实现电影级控制，通过60多个参数调整生成高质量视频。使用MoE架构，计算资源消耗降低，支持消费级显卡部署。此外，模型还引入数据扩容和美学精调技术，提升生成视频的多样性和美学表达。针对复杂运动生成和物理世界还原能力进行优化，使视频更真实。Wan2.2的推出有望推动AI视频生成工具向专业化发展。

关键观点总结

关键观点1: 首个使用MoE架构的视频生成模型推出

阿里通义万相团队推出的Wan2.2模型是业界首个使用MoE架构的视频生成模型，总参数量为27B，激活参数14B，在同参数规模下可节省约50%的计算资源消耗。这一创新技术有助于提高视频生成的质量和效率。

关键观点2: 电影级美学控制系统引入60+参数

阿里通义万相团队推出的电影级美学控制系统，通过引入60多个专业参数，实现了对光影、色彩、镜头语言等美学要素的电影级控制。用户可以通过直观选择美学关键词，智能生成具有电影质感的视频画面。

关键观点3: MoE架构降低计算负载

Wan2.2模型使用MoE架构，通过高噪和低噪专家模型的搭档，有效降低了计算负载。这种架构在减少计算负载的同时，提高了模型的效果，为大规模视频生成模型的应用提供了可能。

关键观点4: 数据扩容和美学精调提升生成质量

Wan2.2模型通过数据扩容和美学精调技术的引入，提升了生成视频的多样性和美学表达。训练数据的显著扩充和升级，提高了模型的泛化能力和创作多样性。

关键观点5: 复杂运动生成和物理还原能力的提升

Wan2.2模型针对复杂运动生成和物理还原能力进行了优化。通过构建人类面部原子动作和情绪表情系统、丰富的手部动作系统以及对多项基础物理定律与现象的优化，显著增强了生成视频的真实感。

免责声明

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
推荐产品: 推荐产品
文章地址：访问文章快照

分享到微博