专栏名称: 机器之心

专业的人工智能媒体和产业服务平台

购买VIP

购买成为VIP，可查看文章或者RSS订阅

提交新专栏

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

小宇宙RSS订阅方法

X平台RSS订阅方法

Telegram频道RSS订阅方法

油管文字版RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

TodayRss-海外RSS稳定源

ICML 2025 | 视频生成模型无损加速两倍，秘诀竟然是「抓住attention的时空稀疏性」

机器之心 · 公众号 · AI · 2025-05-07 16:35

主要观点总结

文章介绍了AI视频生成技术的快速进展以及存在的速度瓶颈，提出了一种新的解决方案：Sparse VideoGen。它通过挖掘注意力机制中的空间与时间稀疏性，成功将推理时间减半，几乎不降低画质。目前，该方法已经支持多种开源模型，并且所有代码均已开源。

关键观点总结

关键观点1: AI视频生成技术进入快速爆发阶段，但存在速度瓶颈。

当前最好的视频生成模型在单张H100 GPU上生成一个5秒的视频需要30分钟以上，主要瓶颈在于3D Full Attention模块。

关键观点2: Sparse VideoGen的出现解决了视频生成的速度瓶颈问题。

Sparse VideoGen通过挖掘注意力机制中的空间与时间稀疏性，配合自适应稀疏选择与算子优化，成功将推理时间减半。

关键观点3: Sparse VideoGen对视频生成模型的画质几乎没有影响。

Sparse VideoGen生成的视频与Dense Attention方法相比，几乎没有肉眼可见的差别，保持极高的像素保真度（PSNR = 29）。

关键观点4: Sparse VideoGen支持多种SOTA开源模型，并且所有代码均已开源。

目前，Sparse VideoGen已经支持了Wan 2.1、HunyuanVideo、CogVideoX等多种开源模型，并且T2V（文生视频）、I2V（图生视频）都可以加速。

关键观点5: Sparse VideoGen的核心设计抓住了Attention中的稀疏性。

Sparse VideoGen通过识别Attention Map中两种独特的稀疏模式：空间稀疏性和时间稀疏性，来构建稀疏注意力策略。

关键观点6: Sparse VideoGen实现了无损像素保真度的关键。

它通过动态地组合空间和时间一致性问题的解决方案，并采用在线稀疏模式优化方法，实现了无损像素保真度。

关键观点7: Sparse VideoGen从算子层优化稀疏计算。

它通过硬件友好的布局转换和定制化优化QK-Norm和RoPE等模块，提高了内存访问效率和推理效率。

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
文章地址：访问文章快照

分享到微博

推荐文章

新机器视觉 · 视觉SLAM算法最新综述 | 一文览尽所有主流框架！

19 小时前

爱可可-爱生活 · 【AI时代的第一场瘟疫：当“糊涂码农”遇上智能Agent】微软最-20260610075854

22 小时前

爱可可-爱生活 · 【AI没抢走工作，但它悄悄拆掉了新人的梯子】宏观数据很漂亮：失业-20260610081713

22 小时前

AI思想会 · “AI再强也只是工具！”Linus再谈AI：“氛围编程”写一次性软件可以，但撑不起需要维护35年的项目

昨天

量子位 · 你最该认识的「硅谷CEO」：面试紧张，害怕演讲，管出最赚钱的AI广告公司

昨天

北极星电力网 · 关注 | 国家绿证核发交易系统6月30日正式启用

1 年前

毕凯今选 · 【肠言道】240905

1 年前

唯创知音 · AI在线对话，即时医学咨询与科普，赋能智能血压计健康管理新体验

1 年前

湖北日报 · 中国驻泰国大使馆最新提醒

1 年前