扫码打开虎嗅APP
沈腾版斯内普,宋小宝版庆余年,赵四儿版美国队长,PDD版桥本环奈······
AI换脸视频满天飞,我有个朋友对此还提出了些更大胆的想法。
不过,看似已经出神入化的AI换脸,到国产神剧里却变成了这样。
所以AI换脸的门槛到底高不高?我朋友那些大胆想法,该怎样实现呢?
Deepfake是目前最主流的开源面部替换算法,我们看到的绝大部分换脸视频,都是通过该算法实现的。
这种算法是基于人工智能领域的深度学习,可以直接在电脑上运算生成逼真的换脸视频。
以宋小宝版张若昀为例,我们尝试用最简单的语言来解释Deepfake的原理
第一步,是给AI准备两份学习材料,一是《庆余年》中我们选中的视频片段,二是宋小宝老师的高清视频素材
系统会将两个视频的每一帧都提取成图像文件,并从中识别、抽出人脸信息,生成只含有脸部的图片,作为机器的学习素材。
随后系统将两个人的脸扭曲变化,
并训练AI学会一件事:分别把扭曲的脸还原成本来的模样。
经过一段时间训练,AI修复的人脸几乎与扭曲前的人脸一模一样。
此时系统开始发出大招,丢给AI一张”张若昀“的照片,
丧心病狂地告诉AI:这是一张扭曲的宋小宝的脸,请修复。
此时,已经被PUA的人工智能相信了系统的鬼话,用尽平生所学,
把张若昀的脸“修复”成了宋小宝的脸。
等AI辛辛苦苦将数以千计的张若昀的脸修复成宋小宝之后,
系统再将这些脸放回到原版庆余年之中,
由宋小宝鼎力巨献的《宝余年》就诞生了。
当然,这只是为方便大家理解,所做的简单解释。
真实情况中,基础的换脸工具会使用一种叫做“自编码器”(Auto-Encoder)的神经网络,
由一个编码器和两个不同的解码器构成。
训练过程中,张若昀和宋小宝的图像被放进同一个编码器中进行编码,但由两个不同的 解码器A和解码器B分别进行还原。
而之所以要让两个解码器共用一个编码器,
是为了让编码器能够找出两个不同人脸的共同特征数据
从而再用相反的解码器实现两个人脸的替换。
另外,现在的换脸工具还会使用生成对抗网络(GAN)进行升级,优化换脸效果。
知道原理后,我们可以聊聊AI换脸的局限了。
首先是素材,要制作一段真假难辨的宋小宝版《庆余年》视频,
我们必须要有一段时间够长,清晰度够高的宋小宝视频,
或者300张以上宋小宝的照片,交给AI进行训练。
保证数量的基础上,素材中的人脸最好还是各种角度兼具,不能只是千篇一律的45度角自拍
特别要注意侧脸,否则换脸视频中的侧脸镜头,就会出现非常严重的模糊。
另外我们还发现,当原视频中出现,手遮挡脸的镜头时,AI往往会难以处理。
此外,制作逼真的换脸视频,需要一块优质的显卡和足够的学习时间。
Deepfake的机器学习主要通过显卡完成,显卡性能越强悍,学习时间越长,就能输出越逼真的视频。
这是我们自己生成的换脸视频,将钢铁侠的脸换到了希亚.拉博夫身上,可以明显看出,随着AI训练时长的增加,换脸效果得到了明显提升。
目前来说,下载AI换脸工具后,制作一段基础的换脸视频并不算难,难的是想要达到真假难辨的效果,一般需要对根据不同的明星手动调整参数,
需要花费的精力还是非常大的
所以,还请珍惜你关注的每一个换脸视频博主。
有意思的是,就如同没有人知道是谁发明了比特币一样,至今也无人知道是谁开发了Deepfake的源代码。
就像人们尚未真正找到比特币的正确用途一样,目前AI换脸的应用,也仍局限在一些搞笑视频甚至灰色产业中。
但这并不代表AI换脸是没有意义的。事实上,AI换脸能更快速更逼真,也代表着它背后的AI深度学习、神经网络、图像识别等技术的越来越成熟。
其实科技与人类的进步,总是从那些看似毫无用处的新技术开始,它所谓的“毫无用处”,往往错在时代的局限性,而非技术本身。每当一项“无用”的新技术变得“有用”时,这世界会天翻地覆。
对AI换脸感兴趣的朋友点赞关注后,可在评论区获取详细教程和下载链接,切记合法合规使用。