扫码打开虎嗅APP
本文来自微信公众号:量子位(ID:QbitAI),作者:丰色,原文标题:《草图变真人脸?AI:可以,多草都行》,头图来自:视觉中国
画画手残,也想搞出一个逼真人像?
这个可以有。
油管(Youtube)上的一位小哥,就用一个简单的小程序办到了!
效果还不错!分辨率和逼真度应有尽有。
你要知道,草图可是这样的……
见鬼了。
画画手残党的AI人脸生成作品
第一组首战告捷,小哥决定换个性别看看。
OK,性别识别成功,就是看起来有点“瘆人”。
要怪就怪小哥的“灵魂”画技吧……
下一组——
作者逐步画脸、头发、眼睛……让大家看看AI是怎么一步步生成人像的。
看起来,随着细节的完善,人脸也被训练得丰富起来。
接下来,脑洞大开的作者居然画起三角形/芒果形/方形/梨形人脸……
要玩坏了吗?No!
管他什么脸型还是歪耳朵斜眼睛,都成功了。结果还算满意,有一张颜值居然还可以。
那,画个鸣人看看?
现实世界里的鸣人会长什么样子呢?
救命!
后面小哥又整了两组:
△Minecraft中Steve的AI人像:还原了方方的头发
△动画片角色Rick Sanchez的AI人像: 神似迈克尔·杰克逊?
有没有发现AI居然能够基本呈现相应原人物的皱纹和肤色,再加上上面鸣人AI的头像也“歪打正着”的黄头发。
这么神奇?但作者调侃:是魔法……
灵感来自一篇论文
这个想法的提出和程序的实现者是一位网名叫做“Stochastic Machine”(随机机?)的小哥。
灵感来自一篇论文——Encoding in Style: a StyleGAN Encoder for Image-to-Image Translation。
这篇论文讲技术人员如何在StyleGAN顶层训练了一个深度神经网络来学习将源图像映射到StyleGAN模型的输入,最终输出高质量的目标图像。
其中有三个有趣的实例。
1. 将侧着的人脸输出为相应的正脸(Face Frontalization)。
2. 将一个糊了的人脸生成为一张高分辨率的人脸(Super Resolution)。
但是还原的最接近长相不止一种。
3. 和pix2pix非常相似的条件图像合成(Conditional Image Synthesis)。
编码器输入一张手绘或face mask,就能生成一系列高清真人头像!
pix2pix是在GAN的基础上设计出的一个算法,完成成对的图像转换,可以得到比较清晰的结果。
GAN(Generative Adversarial Networks),生成式对抗网络,是一种深度学习模型,是近年来复杂分布上无监督学习最具前景的方法之一。
小哥对最后一个效果表示非常赞许和感兴趣。并转念一想:
也许我可以做个简单的程序来实现信手涂鸦一键生成高逼真AI人脸。
说干就干,小哥先前就搞了一个基于pix2pix技术的草图生成人脸程序。
无奈效果相去甚远——根本不是人!
现在他将原代码结合这篇论文的技术,做成了这样一个简单的应用程序。不管你的画功有多烂,都能生成一张像模像样的高逼真AI人脸。
AI人脸生成技术:从模糊到难辨真假
一开始,很多AI人脸生成作品(技术基于GAN)只能勉强模仿出一个人类的脸的大概样子,但是多少都有点“糊”(lack quanlity)。
且不说有的生成的还只是黑白的人像。
2019年,StyleGAN的出现让AI图像生成技术迈出了超一大步!
该技术生成的人像终于能够逼真到“如果我不说,你就根本猜不出来我是AI”了!
StyleGAN是基于GAN开发的模型。
StyleGAN中的“Style”是指人脸的各种属性,包括脸型、发型等,还有人脸肤色、是否有皱纹等细节。不同的“画法”,可以精确控制人脸不同的“style”。
上面“随机机”小哥用到的StyleGAN2是对StyleGAN的改进。
基于这项技术的人脸生成应用数不胜数,这位小哥的最大不同就是不需要你按着底图临摹加工,也不需要你有多好的画画技术,多“灵魂”都能给你生成相应的高逼真人像!
不过有人表示小哥这个程序生成的肖像大多具有印度(次大陆)常见的人脸特征。
当然,小哥说这都是在相应的数据集(CelebA-HQ)上训练的结果。
参考链接:
[1]https://www.youtube.com/watch?v=oRRtSYxGf6w
[2]https://www.reddit.com/r/deeplearning/comments/mpf6qd/using_stylegan2ada_and_pixel2style2pixel_to_turn/
[3]https://zhuanlan.zhihu.com/p/263554045
本文来自微信公众号:量子位(ID:QbitAI),作者:丰色