专栏名称: 新智元

智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

即刻RSS订阅方法

一夜颠覆Sora神话，H200单卡5秒出片！全华人团队开源AI引爆视频圈

新智元 · 公众号 · AI · 2025-08-07 14:14

主要观点总结

本文报道了UCSD等机构发布的FastWan系视频生成模型，通过采用稀疏蒸馏技术实现了AI视频生成的极速模式。该模型在H200上实现了5秒生成视频，并采用FastVideo架构实现了高效生成。文章还详细介绍了稀疏蒸馏技术和视频稀疏注意力（VSA）的核心原理及应用。

关键观点总结

关键观点1: FastWan系视频生成模型实现极速生成

采用稀疏蒸馏技术，实现了AI视频的快速生成。单块H200，5秒内即可生成一个5秒视频。

关键观点2: 稀疏蒸馏技术介绍

稀疏蒸馏是一种将稀疏注意力训练与步骤蒸馏相结合的模型后训练技术。它的核心思想是让一个「少步数+稀疏化」的学生模型学会匹配「完整步数+密集计算」教师模型的输出分布。

关键观点3: 视频稀疏注意力（VSA）技术的引入

VSA是动态稀疏注意力核心算法，能够自主识别序列中的关键token。不同于依赖启发式规则的方案，VSA可在训练过程中直接替代FlashAttention，通过数据驱动的方式学习最优稀疏模式，同时最大限度保持生成质量。

关键观点4: FastWan模型实现稀疏蒸馏的过程与挑战

高质量数据对任何训练方案都至关重要，尤其是扩散模型。研究人员使用高质量的Wan模型自主生成合成数据集，并采用DMD进行稀疏蒸馏。在实现过程中，内存效率成为关键挑战，他们通过FSDP2实现三模型的参数跨GPU分片，显著降低内存开销。

关键观点5: VSA的实际效果与评估

在Wan-1.3B的DiT推理时间上，VSA模式将推理时间从全注意力模式的31秒降至18秒。VSA精细块稀疏内核在长序列场景下更加接近理论极限，实现了近7倍加速。

免责声明

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
推荐产品: 推荐产品
文章地址：访问文章快照

分享到微博

推荐文章

爱可可-爱生活 · 恭喜@清欢渡悠悠 1名用户获得【《AI共生指南》】。微博官方唯一-20250809120258

12 小时前

返朴 · AI技术狂飙的背后，我们失去了什么？｜深度对话微软研究院负责人Peter Lee

昨天

宝玉xp · 穿越百万年的技术进化图谱 Historical Tech Tre-20250808060107

昨天

量子位 · GPT-5来了！人人都能免费用，最强大模型只需最傻瓜式使用

昨天

宝玉xp · “在最近一项关于生成式 AI 的最大规模调查之一——2025 年-20250808000424

2 天前

奇物论 · Adv. Mater：具有超高爆裂压和抗菌活性的可注射水凝胶用于紧急止血和伤口修复

1 年前

股道热肠也 · 转发微博-20250128175741

6 月前

广州日报 · 千万粉丝网红潘宏内容清空，下架所有视频，曾称“这辈子不塌房”

5 月前

大江网 · 山西稷山县回应“剧团团长被指公车私用”：违反业务用车规定，团长及其丈夫被诫勉谈话

3 月前

中国书画诗词院 · “ 转 · 九福临门 ... ” -20250510050000

3 月前