扫码打开虎嗅APP

搜索历史
删除
完成
全部删除
热搜词
AI生成的人脸普遍呈现网红脸特征,并非技术缺乏创意,而是算法为规避风险主动选择保守策略,导致审美同质化,本质是技术局限与人类感知机制共同作用的结果。 ## 1. AI人脸生成的同质化现象 - 素人博主汉服照被AI盗用至短剧,生成角色形象与本人高度相似却带有负面设定 - AI虚拟偶像(如YURI、AYAYI)及韩国Rozy均呈现标准网红脸特征,小红书虚拟博主AYAYI一个月涨粉5万 - 多人同框时AI生成面孔呈现"人山人海"诡异感,显示算法输出高度趋同 ## 2. 技术保守性的底层逻辑 - AI通过"人脸概率地图"优先保证五官对称和结构稳定,主动忽略20%非常规特征(如疤痕、不对称) - 人脸特征协同变化机制难以模拟:AI独立调整单特征(如大小眼)时无法同步改变相关维度(眼睑、眉毛) - 训练数据80%为年轻主流面孔,算法天然倾向统计平均值,10¹⁰⁰维特征组合远超现实训练集规模 ## 3. 网红脸成为安全选择 - 网红脸处于恐怖谷远端,人类对其瑕疵容忍度更高(如视为滤镜问题而非非人特征) - 梯度下降训练使模型收敛于"局部最优"——最大公约数的平均脸 - 反馈机制强化保守策略:生成非真实人脸会被扣分,迫使AI选择平庸但安全的输出 ## 4. 多样化与AI本质冲突 - 探索低概率特征=高惩罚,算法默认优先保障80%主流特征 - 实现真正多样化需指数级样本量(100个维度各10种变化需10¹⁰⁰样本),远超现有几十万张训练图库 - 当前技术下,同质化是AI在准确性与多样性博弈中的必然最优解
2026-04-14 11:49

AI算法也更喜欢网红脸?

本文来自微信公众号: 印客美学 ,作者:小印


继易烊千玺、杨紫、肖战被AI偷脸之后。


AI又把手伸向了素人。


AI的脸,千篇一律


本来以为AI只会偷明星的脸,没想到现在连素人也不放过。


一个素人博主自己拍的汉服照片出现在了短剧《桃花簪》中。


不管是外貌、衣服还是妆容,都和自己的照片极其相似。


但是,剧里的这个人物却是被形容为“游手好闲,好色,浑身上下透着龌龊”。


除了他,另一位博主也发现自己的脸也出现在了短剧里。



而AI自己生成的脸更是透露着一种人山人海的诡异感。


前段时间出道的AI演员,女的神似赵今麦和张子枫混合体,男的则撞脸翟子路。


面对撞脸争议,幕后人员却说形象是完全按角色需求来的,并没有刻意参考任何真人。


不管是游戏还是短剧,只要跟AI沾上边,即便角色形象要求是独创的,但AI最终生成的脸仍然非常网红化。


尤其是多人同框时,更呈现“人山人海”的诡异感。



落户北京的AI虚拟偶像YURI,大眼睛、高鼻梁、尖下巴、无瑕疵皮肤,看上去感觉和抖音网红博主没什么区别。


小红书虚拟博主AYAYI也是典型的网红脸,极其协调的五官和标准的身材让她让她一个月内涨粉5万。



还有韩国第一虚拟网红Rozy,看起来也是那种能在小红书上火的颜值博主。


按理说,AI的素材库应该很丰富才对,但为什么生成的人脸仍然跟网红一样同质化严重?


AI审美也网红?


AI这么做,主要是为了保证像人。


生成人脸的时候,AI首先要保证脸部结构稳定,五官要对称,位置不能偏。


因此AI在抓数据的时候,自己也会生成一张“人脸概率地图”,地图上每个点代表一种人脸特征,虽然也会抓取到一些独特的特征,但是AI是会忽略的。


因为过往的反馈表明,一旦尝试增加多样的局部特征,生成的脸会很奇怪。


人脸是一个整体,真实的人脸上一些不一样的点,永远不会孤立出现,而是会伴随着一系列协同变化。


比如一个大小眼的人,眼睑的褶皱深度、眉毛的高度可能会同时不一样。


这些协同变化共同构成了一个自洽的整体,因此在现实中,即便你看到一个大小眼的人也不会觉得奇怪,因为整个脸都在配合这个特征。


但AI生成人脸时,内部表示是高度解耦的,它可以独立调整某个局部,但很难同时自动调整所有相关的协同维度。


结果就是,它生成的大小眼就是单纯的眼睛大小不一样,眼睑没变,眉毛没变、鼻梁没变。


没有任何伴随特征,人在看到这种脸的时候自然会觉得不像人。


所以为了避免风险发生,AI会自动收紧生成空间,忽略独特性,选择最安全的输出空间——网红脸。


因为人类感知上,网红脸处在恐怖谷的远端,容错空间大。


一般来说,越像真人的脸,人类对微小的缺陷越敏感。


但网红脸已经是一种人造模板了,它的五官比例、脸部结构已经高度模式化,人类潜意识会把它归类为“半人造物”。


所以,网红脸的容错标准会比真实人脸更宽松。


因为即使生成时出现轻微瑕疵,你也只会认为是滤镜没调好,而不会认为它不像人。


就像小红书博主AYAYI。


她是一个有着网红脸的虚拟人,虽然目前已经确认是数字人,但之前网上对她到底是不是人的讨论却是络绎不绝。



而且,在生成过程中收到的反馈让AI逐渐变成了一个“胆小鬼”。


输的出和真实人脸不一样会扣分,输出的不像任何真实人脸会被大量扣分。


在这种机制下,AI会变得极其保守,宁可输出一张平庸但绝对像人的脸,也不要输出一张有特色但可能翻车的脸。


最终结果就是,AI也审美窄化了,所有的概率都压缩在了最大公约数区域——网红脸上。


多样化是AI的“反人性”?


现在很多制作公司都开始发力AI演员,还传出了“男二以下全用AI”的言论。


但就像上面说的,一旦都变成AI,那我们就真的很难看到多样化的面孔了。


并不是AI不能生成多样化的脸,而是它的底层运行逻辑天然与多样化为敌。


AI学到的所有内容都来自数据,主流人脸数据集的构成比例大致是:


80%是年轻、正面、主流的脸,剩下20%是疤痕、外鼻梁、不对称这些非常规特征。


统计学规律让它必须优先保那80%的主流特征,那特殊的20%则被自动忽略。


因为多样化意味着探索低概率区域,而低概率=高惩罚,AI学到的策略就是,宁可同质化严重,也不能冒险犯错。


而且,当前的AI其实也很难把人脸的所有特征都总结出来。


假设人脸特征可以用100个维度来描述。要让AI在每个维度上都学会“可以有多种可能”,需要的训练样本量是指数级增长的。


一个维度有10种变化就需要10个样本,100个维度就需要10¹⁰⁰个样本。


而现实中,AI的训练集只有几十万张人脸,所以它只能保留那些最稳定、最共性的特征,把所有不常见的组合当作噪声丢弃。


从模型看,AI使用的训练是梯度下降的,也就是沿着误差下降最快的方向走。


这个方向指向的永远是误差曲面的谷底,而谷底就是所有样本的平均。


在第一步梯度,它会把输出拉向所有人的平均脸;第二步会微调向某个群体的平均脸;在最后,则会停在“局部最优”,也就是网红脸,本质上还是最大众的那一类,所以一旦AI脸多了,看起来就会“人山人海”。


AI天生是平均主义者和保守主义者。


不是说它不能多样,只是这需要它反直觉、反数据,相当于让一个经过严格训练的会计去搞即兴涂鸦,这会破坏它的默认运行模式。


AI生成千篇一律的网红脸不是因为没创意,而是在现有的技术下,千篇一律才是它的最优解。

本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。

大 家 都 在 搜