专栏名称: 智东西
智东西-聚焦智能变革,服务产业升级!作为智能行业新锐媒体,智东西专注五大领域:VR/AR;AI/机器人/无人机;智能汽车/智能出行;智能家居/物联网;智能穿戴/智能医疗,通过内容、活动、报告以及社群等方式助力“智能+”时代的创业和产业升级。
目录
今天看啥  ›  专栏  ›  智东西

阿里又开源了!电影级视频模型,业界首用MoE架构,通义App已上线

智东西  · 公众号  · 科技媒体  · 2025-07-28 22:28
    

主要观点总结

阿里通义万相团队推出首个开源MoE视频生成模型Wan2.2,包括文生视频、图生视频和统一视频生成三款模型。该模型在光影、构图、色彩等美学要素上实现电影级控制,通过60多个参数调整生成高质量视频。使用MoE架构,计算资源消耗降低,支持消费级显卡部署。此外,模型还引入数据扩容和美学精调技术,提升生成视频的多样性和美学表达。针对复杂运动生成和物理世界还原能力进行优化,使视频更真实。Wan2.2的推出有望推动AI视频生成工具向专业化发展。

关键观点总结

关键观点1: 首个使用MoE架构的视频生成模型推出

阿里通义万相团队推出的Wan2.2模型是业界首个使用MoE架构的视频生成模型,总参数量为27B,激活参数14B,在同参数规模下可节省约50%的计算资源消耗。这一创新技术有助于提高视频生成的质量和效率。

关键观点2: 电影级美学控制系统引入60+参数

阿里通义万相团队推出的电影级美学控制系统,通过引入60多个专业参数,实现了对光影、色彩、镜头语言等美学要素的电影级控制。用户可以通过直观选择美学关键词,智能生成具有电影质感的视频画面。

关键观点3: MoE架构降低计算负载

Wan2.2模型使用MoE架构,通过高噪和低噪专家模型的搭档,有效降低了计算负载。这种架构在减少计算负载的同时,提高了模型的效果,为大规模视频生成模型的应用提供了可能。

关键观点4: 数据扩容和美学精调提升生成质量

Wan2.2模型通过数据扩容和美学精调技术的引入,提升了生成视频的多样性和美学表达。训练数据的显著扩充和升级,提高了模型的泛化能力和创作多样性。

关键观点5: 复杂运动生成和物理还原能力的提升

Wan2.2模型针对复杂运动生成和物理还原能力进行了优化。通过构建人类面部原子动作和情绪表情系统、丰富的手部动作系统以及对多项基础物理定律与现象的优化,显著增强了生成视频的真实感。


免责声明

免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址:访问原文地址
总结与预览地址:访问总结与预览
推荐产品:   推荐产品
文章地址: 访问文章快照