一个月蹦出4个国产Sora：“拍个手”集体阵亡-玉林市某某美容仪器有限公司

金磊一水发自凹非寺
量子位 | 公众号 QbitAI

家人们，拍个手咱就说这个国产Sora啊，个月个国就在七月这一个月时间里，蹦出兰州市某某设备经销部那“增速”简直就是体阵霸屏模式——

可灵、PixVerse V2、拍个手清影、个月个国Vidu……

面对眼前一水儿的蹦出AI视频生成软件，相信大家也和我一样：

感慨过后，体阵一个想法立即浮上心头：

能不能把它们拉到一起，拍个手搞个横评，个月个国看看谁家的蹦出国产Sora更胜一筹？

说干就干，我们先来简单介绍一下此次参赛的体阵几位选手：

①号选手：可灵，快手AI团队出品，拍个手7月6日网页端正式上线。个月个国
②号选手：PixVerse V2，蹦出由爱诗科技于7月24日正式发布。
③号选手：清影，由智谱AI打造，7月26日在网页、APP和小程序端上线。
④号选手：Vidu，兰州市某某设备经销部清华系初创生数科技在7月30日发布。

我们这次的battle将围绕图生视频和文生视频两个大赛道展开，其中还会包含风景、动物、人物甚至梗图等多项生成能力测试。

对于各个选手来说，不仅要考验的是它们最终生成的质量，更关键的是画面一致性、是否符合给定prompt等更为细节的内容。

接下来，量子位一手实测这就奉上。

Round 1：图生视频

这第一关，咱就先来试试诸位选手的“图生视频”能力。

老规矩，开局只给一张图和一段prompt，不进行任何其他操作，以保证原汁原味儿~

经典梗图

提到梗，那就不得不搬出《甄嬛传》了~

我们先给每位选手“喂”下面这张图：

然后简单的给一句prompt：

甄嬛慢慢戴上了墨镜。

视频地址：https://mp.weixin.qq.com/s/C7bDx9J_-7jcJwUoO0NTdw

首先从戴墨镜这个细节来看，只有可灵算是把墨镜这个实体完完整整地给生成出来了。

而清影和Vidu生成的墨镜还是透明的，并非我们印象中的那种墨镜。

至于PixVerse V2……则直接生成了个寂寞。

其次，从自然度来看，可灵的甄嬛低头戴墨镜也是比较符合生活中的逻辑，属于最自然的那个。

而在清影和Vidu里，甄嬛佩戴墨镜的位置略显高了一些；以及，清影生成的手指出现了6个。

因此在梗图的较量中，可灵明显胜出！

脑洞大开的科幻大片

接下来，我们来测试一下AI们的想象力如何。

操作同样是先“喂”一张末日场景图：

这次的prompt涉及的“剧情”会稍微复杂一点，例如：

最后一艘人类飞船逃离，透过舷窗，一只彩虹色的气球慢镜头飘过。

我们来看下四位选手的生成效果：

视频地址：https://mp.weixin.qq.com/s/C7bDx9J_-7jcJwUoO0NTdw

这次battle的结果就比较明显了。

最符合prompt的便是PixVerse V2，不仅模式爆炸场景还在延续，也有一个彩虹气球飘过。

其次是可灵，但气球出现的较为突然和诡异，并且颜色只是单一的紫色。

清影方面则是莫名其妙的出现了一个彩虹团，并没有生成气球的样子。

但最惨的还是Vidu，直接什么都没有，但隐约似乎是把远处爆炸的云朵里带了点彩虹的颜色。

此局，PixVerse V2，Win！

老照片动起来

最后一个图生视频的测试，我们玩儿复活老照片：

prompt是这样的：

小朋友边转过身来边拍手。

我们来看下效果：

视频地址：https://mp.weixin.qq.com/s/C7bDx9J_-7jcJwUoO0NTdw

嗯，集体阵亡。

不拍手的不拍手，拍手的手基本上全鬼畜。

但相比来看，Vidu的效果会稍微强一些，不仅完成了关键“拍手”动作（虽然有几帧还是出错了），还自带降雨效果，活脱脱一场“儿童雨中嬉戏”~

看来AI处理手还是非常困难的。

本轮，Vidu的表现相对出众一些！

至此，先来一个小总结：

Round 2：文生视频

在图生视频之后，我们进入下一个大赛道——文生视频。

同样的，在这个环节中我们还设置了多个细分项目，从多个不同维度来测试各个AI选手的实力。

Sora同款prompt

首先就是跟文生视频“鼻祖”Sora，用官网呈现的同款prompt来对比看下效果。

例如最为经典的“Sora女郎”：

A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.

视频地址：https://mp.weixin.qq.com/s/C7bDx9J_-7jcJwUoO0NTdw

所有的效果均不如Sora那般逼真，但可以说是各有风格特色。

例如可灵和Vidu的人物在走路姿态上更自然一些；PixVerse V2的人物在面部的一致性上较好；而清影则是整体画面的色彩更为丰富。

一镜到底

接下来，为了测试AI选手们生成画面一致性的能力，我们来一段一镜到底的复杂prompt：

生成一段主题为《城市公园的早晨》视频。请使用一镜到底的拍摄技巧，从公园入口开始，缓慢推进镜头，捕捉清晨阳光下公园的景象。镜头应平稳移动，依次展现以下元素：
1、公园入口的标识牌，阳光透过树叶间隙，形成斑驳的光影。
2、晨跑的人群，他们脸上洋溢着活力和朝气。
3、儿童游乐区，孩子们在秋千和滑梯上玩耍，笑声充满整个场景。
4、最后，镜头回到公园的另一侧出口，结束视频。