宋小宝版庆余年“上线”，换脸视频是如何实现的？-虎嗅网

沈腾版斯内普，宋小宝版庆余年，赵四儿版美国队长，PDD版桥本环奈······

AI换脸视频满天飞，我有个朋友对此还提出了些更大胆的想法。

不过，看似已经出神入化的AI换脸，到国产神剧里却变成了这样。

所以AI换脸的门槛到底高不高？我朋友那些大胆想法，该怎样实现呢？

Deepfake是目前最主流的开源面部替换算法，我们看到的绝大部分换脸视频，都是通过该算法实现的。

这种算法是基于人工智能领域的深度学习，可以直接在电脑上运算生成逼真的换脸视频。

以宋小宝版张若昀为例，我们尝试用最简单的语言来解释Deepfake的原理

第一步，是给AI准备两份学习材料，一是《庆余年》中我们选中的视频片段，二是宋小宝老师的高清视频素材

系统会将两个视频的每一帧都提取成图像文件，并从中识别、抽出人脸信息，生成只含有脸部的图片，作为机器的学习素材。

随后系统将两个人的脸扭曲变化，

并训练AI学会一件事：分别把扭曲的脸还原成本来的模样。

经过一段时间训练，AI修复的人脸几乎与扭曲前的人脸一模一样。

此时系统开始发出大招，丢给AI一张”张若昀“的照片，

丧心病狂地告诉AI：这是一张扭曲的宋小宝的脸，请修复。

此时，已经被PUA的人工智能相信了系统的鬼话，用尽平生所学，

把张若昀的脸“修复”成了宋小宝的脸。

等AI辛辛苦苦将数以千计的张若昀的脸修复成宋小宝之后，

系统再将这些脸放回到原版庆余年之中，

由宋小宝鼎力巨献的《宝余年》就诞生了。

当然，这只是为方便大家理解，所做的简单解释。

真实情况中，基础的换脸工具会使用一种叫做“自编码器”（Auto-Encoder）的神经网络，

由一个编码器和两个不同的解码器构成。

训练过程中，张若昀和宋小宝的图像被放进同一个编码器中进行编码，但由两个不同的解码器A和解码器B分别进行还原。

而之所以要让两个解码器共用一个编码器，

是为了让编码器能够找出两个不同人脸的共同特征数据

从而再用相反的解码器实现两个人脸的替换。

另外，现在的换脸工具还会使用生成对抗网络（GAN）进行升级，优化换脸效果。

知道原理后，我们可以聊聊AI换脸的局限了。

首先是素材，要制作一段真假难辨的宋小宝版《庆余年》视频，

我们必须要有一段时间够长，清晰度够高的宋小宝视频，

或者300张以上宋小宝的照片，交给AI进行训练。

保证数量的基础上，素材中的人脸最好还是各种角度兼具，不能只是千篇一律的45度角自拍

特别要注意侧脸，否则换脸视频中的侧脸镜头，就会出现非常严重的模糊。

另外我们还发现，当原视频中出现，手遮挡脸的镜头时，AI往往会难以处理。

此外，制作逼真的换脸视频，需要一块优质的显卡和足够的学习时间。

Deepfake的机器学习主要通过显卡完成，显卡性能越强悍，学习时间越长，就能输出越逼真的视频。

这是我们自己生成的换脸视频，将钢铁侠的脸换到了希亚.拉博夫身上，可以明显看出，随着AI训练时长的增加，换脸效果得到了明显提升。

目前来说，下载AI换脸工具后，制作一段基础的换脸视频并不算难，难的是想要达到真假难辨的效果，一般需要对根据不同的明星手动调整参数，

需要花费的精力还是非常大的

所以，还请珍惜你关注的每一个换脸视频博主。

有意思的是，就如同没有人知道是谁发明了比特币一样，至今也无人知道是谁开发了Deepfake的源代码。

就像人们尚未真正找到比特币的正确用途一样，目前AI换脸的应用，也仍局限在一些搞笑视频甚至灰色产业中。

但这并不代表AI换脸是没有意义的。事实上，AI换脸能更快速更逼真，也代表着它背后的AI深度学习、神经网络、图像识别等技术的越来越成熟。

其实科技与人类的进步，总是从那些看似毫无用处的新技术开始，它所谓的“毫无用处”，往往错在时代的局限性，而非技术本身。每当一项“无用”的新技术变得“有用”时，这世界会天翻地覆。

对AI换脸感兴趣的朋友点赞关注后，可在评论区获取详细教程和下载链接，切记合法合规使用。

本内容为作者独立观点，不代表虎嗅立场。未经允许不得转载，授权事宜请联系 hezuo@huxiu.com
如对本稿件有异议或投诉，请联系tougao@huxiu.com

最新评论

大 家 都 在 看

大 家 都 在 搜

大家都在看

大家都在搜