专栏名称: 快手招聘

快手官方求职入口，包括社招、校招、实习生招聘、求职类资讯及相关活动等。期待您的关注哟！

购买VIP

购买成为VIP，可查看文章或者RSS订阅

提交新专栏

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

小宇宙RSS订阅方法

X平台RSS订阅方法

Telegram频道RSS订阅方法

油管文字版RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

TodayRss-海外RSS稳定源

可灵AI数字人来了！快手重磅发布Kling-Avatar，面向多模态指令理解与控制的数字人长视频生成...

快手招聘 · 公众号 · 互联网短视频科技自媒体 · 2025-09-22 16:47

主要观点总结

快手可灵团队推出全新数字人功能，实现了分钟级长视频中生动细腻、情绪饱满、身份一致的影视级演绎。该功能基于多模态大语言模型的两阶段生成框架，实现了多模态理解让指令变成可执行的故事线，以及长视频的两阶段级联生成。此外，团队还展示了实验结果的对比和优势。

关键观点总结

关键观点1: 多模态大语言模型的应用

可灵团队使用多模态大语言模型实现了数字人的生动表达，通过设计多模态导演模块（MLLM Director），将音频、图像和文本输入转化为清晰的故事线。

关键观点2: 两阶段生成框架

可灵团队采用两阶段生成框架，首先生成蓝图视频，然后根据身份一致性、动作多样性等条件挑选高质量关键帧，并行生成子段视频，最后拼接得到完整视频。

关键观点3: 实验结果与对比

可灵团队通过精心设计的基于用户偏好的GSB测评体系，对比了Kling-Avatar与其他产品的效果，实验结果显示Kling-Avatar在多个维度上取得领先。

关键观点4: 长时视频生成能力

Kling-Avatar能够稳定生成长视频，采用两阶段生成+级联并行生成的框架，使得总生成时间与一段生成时间相当。

关键观点5: 团队与招聘信息

快手可灵团队是视频生成大模型的核心团队，致力于通过多领域的交叉帮助每个人更好地表达和创作优质内容。目前团队正在招聘多个相关岗位。

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
文章地址：访问文章快照

分享到微博

推荐文章

丁辰灵 · 不错过更多直播和线下活动：加灵哥微信

23 小时前

李楠或kkk · 大疆(DJI)及大疆灵眸(Osmo)已于当地时间6月10日和11-20260612143628

昨天

sven_shi · 这事情一出来后立刻就媒体找了鹅腿阿姨同地区的案例发出来，还上了热-20260612111831

昨天

李楠或kkk · 这就是我突然开始老老实实用 iPhone Air 的真实原因。 -20260611224222

昨天

小众消息 · 拼多多新公司落户雄安了

2 天前

深圳新闻网 · 雷军从6楼扔西瓜，展示小米SU7 Ultra“防弹涂层”

1 年前

上海普陀 · 【提示】“沪心成长热线”6月2日推出，为学生和家长送上心理健康“暖心礼包”

1 年前

群响 · 敢向宇宙下订单的销售，最赚钱。

12 月前

参考消息 · 中国AI应用跑出“加速度”

6 月前

中研普华集团 · 医美产业：从"颜值焦虑"到"健康价值"，合规发展黄金期深度解析

3 月前