今天看啥  ›  专栏  ›  机器之心

OpenAI被偷家,谷歌Veo 2反超Sora

机器之心  · 公众号  · AI  · 2024-12-17 20:13
    

主要观点总结

谷歌发布三款视觉生成工具:Veo 2、Imagen 3和Whisk。其中Veo 2是视频生成模型,能够基于文本或图像生成高真实感、高质量的视频。Imagen 3是文生图模型,可实现更丰富的细节和纹理渲染。谷歌反击OpenAI的技术,Sora等其他模型在生成质量和表现上仍有差距。

关键观点总结

关键观点1: 谷歌发布视觉生成工具

谷歌一口气发布了三款视觉生成工具:Veo 2、Imagen 3和Whisk。

关键观点2: Veo 2的优势表现

Veo 2能够创建高真实感的视频,其生成质量超过了当前最佳的Sora等模型。它不仅可以理解提示词中的相机控制指令,还能重建符合真实世界的物理交互和人脸表情。

关键观点3: 人类评估者的对比评估结果

在整体偏好和指令遵从度上,Veo 2的表现都非常强势。与其他模型相比,它在人类评审中的表现是压倒性的。

关键观点4: Veo 2的亮点

Veo 2对真实世界物理运动规律的理解有显著提高,能够生成更加真实的视频。此外,它还能生成更加真实的人类表情和复杂的细节。

关键观点5: 谷歌反击OpenAI的技术

谷歌的这次发布被视为对OpenAI的反击。OpenAI的Sora项目虽然在社交网络上受到关注,但在技术迭代的速度和质量上,可能面临被谷歌超越的风险。


免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址:访问原文地址
总结与预览地址:访问总结与预览
文章地址: 访问文章快照