最近,人工智能(AI)视频生成技术备受关注。OpenAI发布的Sora是一款可以根据提示词和图片生成最多60秒连贯视频的AI。尽管这项技术仍存在一些漏洞,但AI能够达到这种程度仍然令人惊叹。

虽然Sora在半年前发布了展示视频,但除了最初发布的几段视频外,似乎没有更新更好的内容。此外,该产品似乎也没有公开使用的迹象,因此AI视频的概念逐渐淡化。然而,从上个月开始,这种趋势似乎又有所回升。例如,有人制作了一只弹吉他的熊猫的视频。

最初我以为这是Sora发布的作品。但经过一番调查,我才知道,这个AI视频是由国内的AI模型“可灵”生成的,而且更让我意外的是,这个AI居然还是快手研发的。

半年前Sora发布展示视频后,许多公司都在研发类似的AI视频生成产品,如Viggle、Luma等。在具体的实现效果上,这些产品的实力可以说与Sora不相上下。然而,对于国内用户来说,想要使用这些产品,需要拥有高质量的网络环境。


因此,就使用环境门槛而言,国内的可灵自然受到了更高的关注。根据官网展示的技术力表现来看,国内的产品也并不逊色,甚至还有所加强。它不仅能同样精准地执行文生图生视频,而且最大时长也能达到2分钟之多。

现在可灵大模型已经在快影APP上开放邀测,感兴趣的可以去申请一波,只是这玩意异常地火爆,不一定能抢到资格就是了。

虽然我还没有抢到资格,但不妨碍我看看其他网友整出的活,毕竟有这么好用的工具,不拿来整活可就太屈才了。一开始网友们的整活范围还只是停留在比较正常的让静止的图片动起来,比如这幅经典名画蒙娜丽莎,动起来丝毫没有违和感。

当然你是知道的,网友是不可能一直正经的,创作内容也开始慢慢往奇怪的方向发展,比如那张最经典的老人地铁手机的表情包,在AI的调教下,做出了让人意想不到十分难绷的后续发展。

而随着玩法的深入,网友们已经不满足只让静止的图片动起来了,改变视频的剧情走向似乎更有节目效果,而经过AI调试后所演绎的新剧情也被网友们调侃是“幕后花絮”和“删减片段”。比如即使面对焊接技术也依旧面不改色的关二爷:

原来孔慈嘴角的那是酱汁啊,不知道的还以为那是被排云掌打出来的血呢(狗头):

鸡汤来喽,他奶奶滴,为什么不喝,再不喝那我就....自己喝了:

甚至更离谱一点,还有人专门用AI做出了一套完整的“农村养殖致富”视频,本来这种采访的形式就毫无违和感,再搭配上这标准的电视节目模板,要是把很有反差感的恐龙和异形换成常见的鸡鸭鹅牛猪羊,拿给家里年长的长辈看,保不准他们真以为这是真的呢。


看了这么多近期的AI视频,感触还是蛮大的。早期的AI视频要么拼接感十分严重,要么就是恐怖谷效应拉满的伪人感。不知道大家还记不记得威尔史密斯吃意面的那个视频,那是原作者用一个叫ModelScope的文本转视频工具来制作的,当时还是23年3月。

然而,时隔一年之久,同样的题材再用可灵的大模型生成一遍,看这重制后的效果,那可真是立竿见影啊。

看乐子的同时也有不少网友对AI如此恐怖且自由的学习速度感到后怕,他们担心未来的一些AI视频很有可能改变人们的第一认知。有这种担心其实很正常,毕竟有些视频的改法尺度确实有那么一点...离谱。

不过也并不是所有人都想用AI来搞怪整活。对于那些喜欢怀旧的人来说,用AI来怀念某段时光或是某个人显然比整活更有意义。他们会把这项技术用在那些老照片上,可以是自己的,也可以是亲人的。具体实现起来你别说效果还真出奇的好,看着过去尘封的记忆“活”了过来,心里还真会有一种莫名的感动。

我觉得这也算是弥补了有些人早些年没有留下什么摄影带来的遗憾。其实我是相信AI会向更好的方向发展的。与其担心AI会改变人们的生活习惯,倒不如在整活之余也给自己留下一个存在过的证明。毕竟过去没有消失,未来也早已命中注定,只有珍惜当下才是永恒。