扫码打开虎嗅APP
本文内容节选自《拆穿数据胡扯》(由中信出版集团授权),作者:卡尔·伯格斯特龙、杰文·韦斯特,译者:胡小锐,头图来自:《逃避虽可耻但有用》剧照
5 年前,谷歌的工程师将机器学习技术应用到他们自己的招聘过程中,试图找出最高效的员工。他们发现了一个令人惊讶的结果:工作表现与之前在编程竞赛中的成绩呈负相关。这可能是因为擅长编程竞赛的人还具有其他特点,不太适合员工这个身份。谷歌的研究主管彼得·诺维格推测,也许竞赛优胜者习惯于快节奏工作,而慢节奏对于他所在的岗位而言效率更高。但我们不能这样草率地下结论。编程竞赛成绩和工作表现之间表现出这种负相关性,可能是因为这些员工远不是全体员工的随机样本。在谷歌的招聘过程中, 他们已经因为编程能力和其他技能而被选中。但要理解这是如何产生负相关性的,我们首先要关注一个更广泛的问题:为什么帅哥都是浑蛋?
数学家乔丹·艾伦伯格曾提出,利用伯克森悖论可以解释一种常见的抱怨。在约会场所非常活跃的朋友们有时抱怨说,当和帅哥出去约会时,会发现这个人原来是个浑蛋;而当感觉某个人品质很好时, 却发现这个人长得不帅。对于这一令人失望的观察结果,一种常见的解释是,长得帅的人能够承担得起成为浑蛋的代价,因为他们拥有较高的地位,是人们一心想结为伴侣的热门人选。但还有另一种可能的解释。
艾伦伯格让我们想象把潜在的伴侣放在一个二维图表上,横轴表示品质,纵轴表示帅气。这样,你就会得到一个类似于下图的结果。
在这张图中,帅气和品质基本上是不相关的。帅哥是浑蛋的可能性,不比丑男大或者小。到目前为止,我们没有理由认为有品质的人就不帅气,也没有理由认为帅气的人就是浑蛋。
现在让我们看看,一旦你考虑是否真正愿意和某人约会时,会发生什么。当然不是那些既不帅又是浑蛋的家伙。如果一个人真的很优秀,也许你会容忍他在外貌上的缺点,反之亦然。所以,在图中表示男生的空间里,你愿意约会的人应该在斜线上方的区域:
在你想要约会的男生中,帅气和品质好之间存在一定程度的负相关性。一个非常帅的男生不太可能比你愿意约会的普通男生品质更好,一个品质好的男生也不太可能比你愿意约会的普通男生更帅气。这就是伯克森悖论在起作用。因为同时选择了品质和帅气,所以在你愿意约会的对象中品质和帅气产生了一种负相关性。
在相反的方向还会发生一个类似的过程。不仅是你会挑选你愿意约会的对象,别人也会选择是否愿意和你约会。很抱歉这么直言不讳,但除非你是约翰·传奇,否则有的人宁愿选择其他人。这样,你可能约会的对象又会少一些:
剩下的都是谁?现在,你的约会对象被限定在一个从潜在伴侣空间斜向穿过的带状狭窄区域中。在这个区域,品质和帅气之间有很强的负相关性。伯克森悖论的两个例子(一个是你愿意约会的人,另一个是愿意与你约会的人)在你的潜在伴侣中产生了这种负相关性, 尽管在全体人口中并没有负相关的趋势。
我们继续讨论编程比赛能力和在谷歌公司工作表现之间的负相关性。在全体人口中,我们有充分的理由认为编程竞赛能力和谷歌岗位能力之间应该有很强的正相关性。大多数美国雇员根本不知道如何编程,但编程技能是谷歌工程师岗位的先决条件。谷歌的员工是从更大的潜在员工群体中精挑细选的,被选中的原因可能是与编程相关的技能。事实上,招聘经理在招聘过程中使用的评估可能很像在编程竞赛中提出的各种任务或挑战。也许招聘过程过于看重编程竞赛能力,而忽略了其他能让人高效工作的特点。如果是这样,员工的竞赛成绩和工作表现之间可能会出现负相关性,参见下图:
一旦你开始考虑伯克森悖论,就会发现它无处不在。为什么职业棒球大联盟中最好的守场员往往是平庸的击球手,而最好的击球手往往是平庸的守场员呢?答:有很多球员作为守场员和击球手的技术都很平庸,但他们都没有入选“The Show”这款游戏。
在玩《龙与地下城》游戏时,为什么你最好的战士的魔力如此之低,为什么你最好的术士的体力如此之弱?答:因为当你的角色达到一个新等级时, 你会放弃某一项能力,换取另一项能力,并且为其分配奖励的能力点。
为什么一些优秀的词曲作者嗓音像迪伦,而一些优秀的歌手不会为自己创作词曲呢?答:有很多音乐家唱歌像迪伦,创作的歌适合长发金属乐队演唱,但谢天谢地,你永远不会在收音机上听到他们的歌声。
即使选择是在公开的情况下进行的,统计结果似乎也会违反直觉。假设一所学校可以根据学生的平均绩点(GPA)提名学生参加美国优秀学生奖学金竞赛。提名公布后,我们看一下被提名的200 名学生。我们发现被提名女生的平均绩点是3.84,而被提名男生的平均绩点是3.72。样本中有这么多的学生,所以差异不仅仅是一个偶然现象。我们能否断定尽管被提名男生的平均绩点较低,但学校在提名时肯定对他们有所照顾?乍一看似乎是这样的。如果学校对男女生实行同样的提名标准,为什么他们的平均绩点不是大致相同呢?
一种可能的解释是,男生的平均绩点分布与女生的平均绩点分布不同。如果是这样,那么即使针对男生和女生设置相同的提名门槛,在选择了最优秀的学生之后,被提名的男生和女生的平均绩点分布仍然会有所不同。下图说明了这一点。
图中,得分高的女生分数非常高,而得分高的男生的分数仅仅略高于分数线。这就导致了录取分数线以上学生的平均成绩存在差异。
这并不完全是伯克森悖论,但关键是选择可以产生各种各样的有趣结果。当我们在理解数据中呈现的模式时,必须考虑清楚是否存在选择偏倚或者刻意选择行为,如果有,这些因素会对观察到的模式产生什么样的影响。
最后,我们希望提醒大家,伯克森悖论为威廉·巴特勒·叶芝在经典的现代主义诗歌《基督再临》中的悲观评论给出了一个迄今未被认可的解释:
至善者信心动摇,而至恶者却躁动狂热。
《拆穿数据胡扯》
作者: [美]卡尔·伯格斯特龙 / [美]杰文·韦斯特
出版社: 中信出版社
出品方: 中信出版·鹦鹉螺
译者: 胡小锐
本文内容节选自《拆穿数据胡扯》(由中信出版集团授权),作者:卡尔·伯格斯特龙、杰文·韦斯特,译者:胡小锐