今天看啥  ›  专栏  ›  AI科技评论

视觉模型智能涌现后, Scaling Law 不会到头

AI科技评论  · 公众号  · 科技创业 科技自媒体  · 2024-11-22 09:30
    

主要观点总结

本文介绍了生数科技发布的视频大模型Vidu 1.5,该模型通过持续Scaling Up,已经来到「奇点」时刻,展现出「上下文能力」,理解记忆所输入的多主体信息,并表现出对复杂主体更精准的控制能力。文章还提到了Vidu 1.5的技术特点,包括统一高效的底层技术架构、数据工程的重要性、视觉上下文时代的智能涌现等。此外,生数科技不会完全对标Sora,而是会坚持自己的通用多模态大模型的定位,解决更多实际问题。

关键观点总结

关键观点1: Vidu 1.5通过持续Scaling Up已经来到「奇点」时刻,展现出强大的「上下文能力」。

Vidu 1.5能够理解记忆多主体信息,并对复杂主体进行精准控制,这是通过其统一高效的底层技术架构和大量高质量数据一同Scaling Up实现的。

关键观点2: 数据工程对Vidu 1.5的表现至关重要。

高质量数据对Vidu 1.5模型中的细节调控非常重要,例如人物特写的细节调控、不同主体之间的无缝融合等。

关键观点3: 生数科技不会像Sora那样追求世界模拟器的目标。

生数科技定位为通用多模态大模型,旨在解决更多实际问题,而不是仅仅追求世界模拟器的目标。


免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址:访问原文地址
总结与预览地址:访问总结与预览
文章地址: 访问文章快照