扫码打开虎嗅APP
本文来自微信公众号:游戏研究社 (ID:yysaag),作者:藻起藻睡,头图来自:unsplash
几个月过去了,绘图AI仍没有取代人类画师。
前段时间“用嘴画图”的AI很火时,就有一种“画师将被取代”的焦虑在传播着。又经过小半年的进化和更多新选手的入局,AI们再次取得了不小的进化,但这股悲观仍没有成为现实。
在目前市面上众多效果顶尖的绘图AI里,如果加上对性价比的考量,后发制人的Stable Diffusion无疑是其中的佼佼者。
它能很好地模仿艺术家风格,人与物的轮廓逻辑更清晰,而且没有不少AI禁用名人肖像之类的诸多限制。更重要的是,它已在8月24日正式将其算法开源。
开源的意义重大
在此期间,2D美术类AI的大放异彩,也自然地让人们想起了它主攻3D的同类。只不过相比起已经趟出了一条商业化道路的前者,2D转3D类AI还存在不少局限和进步空间,并没有什么惊艳的效果来吸引更多眼球。
就在这样的大环境下,一匹3D建模的AI黑马在前段时间突然杀出。
靠着一张图片就能转化成模型的智能,输入文字就能修改的便携,以及符合人工建模标准的高完成度,人们很快就开始畅想起它在各个领域一展拳脚的那天。
只不过,这惊人的一鸣刚刚初啼没几天,它就被此起彼伏的质疑声被打上了骗局的烙印。越来越多的证据被网友扒出,都指向这个AI的背后很可能只是一群拿着低廉工资的外包建模师。
一、一鸣惊人
创立于2020年的Kaedim,是一家致力于研究2D图片转3D建模AI的初创公司。他们旗下的产品只有一个,就是与公司同名的AI项目Kaedim3d。
在一个月前他们公布的正式版Demo里,这个AI展现出了强大的3D建模能力。最低只需要一张图片,它就能识别出图中物体的3D形态,快速建好模型,并用可导入几乎所有主流软件的格式输出给用户。
就算图片里存在一些遮挡和残缺,Kaedim也能和人脑一样根据客观规律将它补充完成。如果对模型的某个细节不满意,再加上一段文字描述自己希望得到的改进,还能很快得到更符合预期的模型。
就算是找不到参考的复杂物体也不在话下
如此智能的效果,让这个AI很快就在从业者间引发了讨论。这是因为在2D图片转3D模型的方向上,它看上去克服了不少以往的技术难点。
目前市面上的2D转3D建模的AI,主流方法是把一个物体划分为很多个区域后同时进行变形,有些类似于3D打印的过程,或是一块被上百只手同时拿捏的橡皮泥。
正因为它并不像人工建模那样,先捏出大致形状、再进行细节雕琢,而是直到完成的最后一刻,它的每一部分都还在不断变化,所以对参考图片的数量、角度和质量都有较高要求。
论文《Differentiable Signed Distance Function Rendering》里的展示
但Kaedim不一样,它似乎和人工建模使用了同一套“从整体到细节”的流程,得到的模型干净整洁到已十分接近使用需求,也基本没有以往AI常见的模型噪点和错误。
就算只有一张图片,它也能通按照人类的逻辑突破以往多角度、多图片的要求限制,判断出图片内容的空间属性,给出我们想象中的3D模型。
同一张图片被推特用户Rico拿来AI建模的结果就有明显差别
但这一点正是其他同类AI犯错的重灾区,仅凭一张单角度的照片,它们大多还很难判断其中物体的形态。深色实体和阴影的区别,图片里被遮挡一侧的形状,或者一些非纯色的颜色变化等,AI都还很难和我们一样去“想象”。
几个反面案例
特别是在模型布线——这个对很多3D建模新手来说也是个老大难的问题上,Kaedim竟然也能做得很好。
3D模型上的线条越简单清晰,意味着模型的结构更清晰、占用资源更少;模型上的线条越密集复杂,模型的可动性就越好。这并不是一个简单的疏密问题,而是需要根据不同模型的形状、类型或是使用场景灵活判断,需要靠经验积累慢慢摸索。
但Kaedim做出的模型,却好像完全没遇到这个问题。它不仅打破了很多人眼里AI对布线完全没概念的固有印象,很多模型上的布线就连人类新手都自愧不如。虽说它目前只能提供一些简单的模型,但在实用性上,对于很多小体量的开发者来说也够用了。
Kaedim官方演示里的模型
但就是这样一个眼看着就要引领行业革命的好产品,却在推出不久后就遭到了部分网友的质疑:Kaedim根本就不是一个AI。
而一切怀疑的起点,都是因为它实在太贵了,贵到同等价格完全可以请来人工外包。
二、“人工”智能
在Kaedim发布的演示Demo下,很多人都提到这些建模功能对于小体量游戏工作室来说非常实用。在创始人接受的采访里,她也提到十分欢迎和小工作室进行合作,这部分游戏开发者正是他们的目标用户。
但是它的价格,却实在不是这些开发者负担得起的。
在他们的官网上,最低一档的会员每月价格显示为599美元,购买后能生成的模型数量只有30个,每个模型能进行10次修改。就算是标价最高的15000美元每月的会员套餐,依然还有每月1000个模型的数量限制。只有一个“价格面议”的最高档位里,才完全放开了生成模型的数量限制。
这个价格对于常常邀请业内人士进行免费内测的AI来说,着实不是一个小数字,高到足以支付外包建模师的工资。再加上不论模型的大小或者难易程度如何,Kaedim都需要15分钟左右的响应时间,尽管官方解释说这是AI的信息处理和中转时间,但显然站不住脚。
于是人们开始半开玩笑地怀疑,这个完全看不到建模过程的AI,背后难道真的只是一群外包建模临时工吗?
一开始,并没有多少人把这个对价格的吐槽当真,但很快就有人在Kaedim过去的招聘界面里,找到了几个月前他们曾招募外包建模师的信息。聘用标准里除了按模型结算和自由职业外,还有一个很奇怪的要求:能在给出需求的15分钟内参照2D图片制作出3D模型。
这条极不合理的要求,很难不让人把二者联系起来
尽管Kaedim很快就否认了这张图片的真实性,但又有网友在另一个英国的招聘网站上找到了相同的广告,其中还提到了这份工作的年工资为15000英镑,在当地并不算高。
目前这个网页也已经遭到删除
对Kaedim是骗局的质疑逐渐发酵后,官方又再次发言进行了回应。他们解释说这是因为他们对交给用户的模型有一定质量要求,所以在AI的输出的结果后,还进行了额外的人工审核和修改,这才出现了大家质疑的那些情况。
但对于这份并没切中要害的解释,大多数人并不买账。
在这篇解释文章下面,就有继续追问他们为什么要加上这么一步画蛇添足却成本巨大的步骤。因为对于AI——特别是有着技术突破的AI,现在的用户都心知肚明它们存在或多或少的错误,人们对新技术有着充足的容忍度,已不需要额外的遮遮掩掩。
“Kaedim的整个团队都对社区的关注感到谦卑”
也有人在下面建议,现在让质疑者闭嘴的更好办法就是展示出生成的过程,或是放出“人工干预”前AI制作的模型“生肉”。
在此期间,尽管又有人声称他们AI生成的模型和5年前网上出售的模型素材一样,但Kaedim再也没进行过任何回应。
他们在长文回应后因“已有了足够的会员”关掉了付费通道,质疑声也随着对它讨论度的降温慢慢平息了下去。
三、经典骗局
也许第一个提出“临时工”假说的人,只是抱着玩笑的态度提出了怀疑,但网友们会认准这样的质疑并深挖下去,其实也并不是心血来潮。因为就算在AI已经逐渐普及的这几年,用人工假装AI的骗局也已经算不上新鲜事。
2017年,《华尔街日报》曾报道过一家名叫Engineer.ai的印度公司。他们宣传的AI产品,能根据用户的描述智能化进行APP自动开发,进行高达80%完成度的基础功能搭建,极大地缩短流程和节约成本。
但在他们数位前员工的爆料下,所谓的“AI开发”其实只是为了争取投资的噱头,大部分开发工作其实交给了他们在印度等地雇佣的软件工程师完成。
在被《华尔街日报》曝光的一个月后,尽管他们声称这些都是前员工们因合同纠纷做出的报复,但还是对报道中提到的诸多事实进行了回应。
他们同样搬出了一套“人工辅助的人工智能”的说辞,表示尽管APP的开发主要由印度工程师完成,但AI还是参与到了“项目定位、定价和时间管理等重要的工作”中,APP的自动化开发平台工作仍在研发完善中,不再像之前宣传时那样底气十足。
如今已弃用了engineer.ai网址的他们仍然使用着相同的口号
据英国风投机构MMC Ventures 的调查统计,在宣传中具有某类AI元素的初创公司,最多能比普通软件公司多吸引到50%的资金。但事实上其中超过40%的公司,其实并没有任何形式的人工智能技术。
每当历史上出现高出了大众认知的新技术时,人们一开始总会不自觉地去怀疑:留声机出现时,会怀疑里面蹲了个演奏家;电影出现时,会想银幕后是不是站着两个演员;第一次见到自动柜员机时,会猜测是不是因为里面真的藏了个银行柜员。
但是当某个新概念普及开后,我们又会对它的广泛应用变得不再敏感。从而被人认准这片“有所耳闻但不甚了解”的认知盲区,拖进一个又一个系满华丽彩带的“新事物”里。
如果在今天,音乐盒可能就叫该叫“元宇宙音乐家”了
对于市场来说,到底是人还是AI或许根本不重要。哪种外壳看上去高端就包装成哪种,哪种内核成本更低就选择哪种。
此前绘图AI刚刚兴起时,就冒出了不少“新锐画师”高价卖画。其实只是当时很多人没见过的AI画作,甚至还是盗用的其他人免费分享的作品,就打着信息差把AI又变成了“真人画师”的中之人。
起码在现在,AI和人类都还做不到完全替代彼此。除了在大幕还没落下台前扮演着自己的重要角色,它们还会根据需求在这场双簧戏的前后角色里不断转换、互为替身。
在以后的很长一段时间里,用真人伪装AI的骗局肯定还会有,拿AI冒充人类作者的新闻也一定不会缺席。
本文来自微信公众号:游戏研究社 (ID:yysaag),作者:藻起藻睡