2024年05月03日 星期五
资讯品读
国内首个长时长文生视频大模型发布

    4月27日,在2024中关村论坛年会未来人工智能先锋论坛上,生数科技联合清华大学发布中国首个长时长、高一致性、高动态性视频大模型——Vidu。该模型不仅能够模拟真实物理世界,还拥有丰富想象力,具备多镜头生成、时空一致性高等特点,这也是自能生成60秒视频的文生视频大模型Sora发布之后,全球率先取得重大突破的视频大模型,性能全面对标国际顶尖水平,并在加速迭代提升中。

    “在Sora发布后,我们发现刚好和我们的技术路线是高度一致的,这也让我们坚定地进一步推进了自己的研究。”清华大学人工智能研究院副院长、生数科技首席科学家朱军说,团队基于对U-ViT架构的深入理解,以及长期积累的工程与数据经验,在短短两个月进一步突破并研发推出Vidu视频大模型,显著提升了视频的连贯性与动态性。

    点评:文生视频大模型在未来相当长的时间内会占据AI产业的风口位置。

京ICP备06005116