谷歌翻墙无法登陆方舟
据介绍,Veo2 能生成 2 分钟以上时长、4k 分辨率的视频,也能理解提示词中的相机控制指令,还能重建出符合真实世界的物理交互和人脸表情。
(该图也侧面显示,在 AI 视频生成模型方面,中国真的冲到了第一梯队,成为谷歌也不容小觑的对手)
谷歌 DeepMind 研究员 @babaeizadeh 还制作了一系列动画风格的土豆小人情景喜剧。
这也意味着,社交平台上的 Veo2 生成视频,要么时官方精挑细选出来的,要么是科技博主们一手评测出来的。
目前,已经有不少国外科技博主拿到了 Veo2 试用「门票」,并在社交平台上放出来各种测评视频。
比如,把几颗饱满的蓝莓丢进水中,无论是蓝莓入水后的浮沉,还是泛起的水泡、溅起的水花,乍一看都没毛病,但一细究就会发现杯子的水位并没有上升。
再比如铁球垂直砸入装满硬币的盒子,最初的「爆炸性」运动生成得很真实,但在「飞」走很多硬币后,盒子里又冒出了比开始还多的硬币。
DeepMind 研究科学家 @MattMcGill_评论称,在没有感官反馈的情况下,视频生成模型很难像人类一样准确地模拟和修正物理现象,从而导致生成的视频中出现许多物理错误。
这就像在缺乏感官基础的梦境中,人可以漂浮着下楼梯,物体之间可以随意转换,时间可以变得非线性等。
Justine Moore 在回复中表示,有 25% 到 50% 的情况下模型能够成功地完成任务或给出正确的结果。它在处理复杂任务、运动量大的场景以及分布外推理方面的能力有了显著提升,但仍有改进空间。
还有下面这个一群人围坐在一起吃火锅的片段,右侧穿红衣服的女生一度出现 4 根手指,左下角的男生手部则不断扭曲虚化。
这是因为 AI 需要能够捕捉到运动员在空中的旋转、翻转等动作,并且生成的视频要保持流畅和连贯。
下面这个 Veo2 生成的体操动作视频就是一个失败的案例:重力失灵、运动员腾空翻转时身体不正常扭曲等。
X 博主 @jerrod_lew 发布了一个 Veo2 生成的体育类视频合集,里面有多处诡异的情形。
网球拍击球的角度不正确,背后的力度看起来不够;跑步者的手突然反向运动,使得生成的动作不自然、不符合人体运动规律等。
还有这个机器人和人类踢足球的视频,人类和机器人的手臂会互相穿过;在无人触碰的情况下谷歌翻墙无法登陆方舟,球会自己旋转移动等。
提示词:一个人坐在咖啡馆喝咖啡的视频。过了一会儿,切到另一个视角,发现旁边桌子上的一个人正在给他们写信。
尽管在科技博主的一番测评下,Veo2 吊打其他对手,但我们还是想说,先别急着下结论,毕竟曾经的 Sora 也一度被捧上天,最后还是逃不掉翻车的命运。
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。