扫码打开虎嗅APP
本文来自微信公众号:极客公园(ID:geekpark),作者:维鹏,头图来自:视觉中国
互联网高速发展带来的不为人知的一面是怎样的?特朗普和他的“幕后推手”给了我们最极端的答案。
过去,互联网公司向我们证明了很多:短视频 App 可以利用数据和算法,掌控人们的注意力,使用户沉迷其中;机票、酒店预订 App,教给人们一个新词汇——“大数据杀熟”,让老客户在不知情之下,同一张票,买得更贵。
往往,商人更能够肆无忌惮地利用这些新技术,而不去考虑道德边界。房地产商人出身的特朗普,最近被曝出了企图利用数据和算法操控选民心智的丑闻,其数据的来源可能是非法的。
这不是第一次了。特朗普在 2018 年的时候就被调查指出,凭借这种方法赢得了 2016 年的大选,登上了美国总统的位置。他间接向美国人证明了:控制你的思想和行为,其实并不需要接近你。他们打造的系统比你更懂你。
而要完成这些,你需要悄悄找到“懂得抓取数据+掌握相关算法”的工程师,以及出钱,就基本可以了。
特朗普的“幕后推手”
这件事情可以拆解为两个问题去看:一个人的各种信息是如何被别人轻易地间接掌握的;以及,基于这些数据信息,他们是如何利用算法对你完成“洗脑”的。
数据(或者说隐私)有什么用呢?就是有人可以利用它来针对你。通俗地讲,数据往往来源于一个人的手机,它记录了一个人带着手机时做过的事情。它是一个人的历史行为记录、历史经验的集合。相对全面的数据可以拼凑出一个人的人物画像,甚至代表他的内心。
2018 年的时候,大数据公司“剑桥分析”被《纽约时报》曝出,曾在 2016 年非法获取 Facebook 的 8700 万用户的数据资料,那时美国的选民总数也就 2 亿左右。
他们利用这些资料,针对不同细分人群,设计了不同的竞选广告信息,分别投放给不同人群。进而,帮助特朗普影响选民的舆论和情绪,登上美国总统的位置。投放精细化广告的成本也是不菲的,特朗普仅仅在 Facebook 上就花费了 4400 万英镑(约合人民币 3.88 亿元)。
被曝光后不久,“剑桥分析”就宣布倒闭了。在美国 2020 总统大选即将来临之际,9 月 13 日,《纽约客》调查发现,特朗普雇佣的大数据公司 Phunware 似乎在做和“剑桥分析”同样的事情。巧合的是,Phunware 的部分高管就是来自于“剑桥分析”。
不过,两者也是有区别的。可以对比一下“剑桥分析”和 Phunware 获取人们数据的方式。
2014 年,名为 Kogan 的学者为了做调研,开发了一款心理测试 App,并上传到 Facebook 上,用户只要下载并完成填写,就可以获得金钱奖励。这种办法吸引了 Facebook 上 27 万用户下载。
而通过这 27 万用户,Kogan 通过代码可以追踪到他们点赞、评论过的人的数据资料,进而抓取、存储在自己的数据库里,就这样,Kogan 收集了 8700 万人的数据。然后,卖给了“剑桥分析”。在别人不知情之下,收集和贩卖对方的资料当然是违法的,也最终导致了“剑桥分析”的惨淡收场。
2020 年,这一次,特朗普和 Phunware 显然学聪明了。Phunware 本身就具备广告 SaaS 服务,帮助品牌方在各个平台分发广告。他们的高管称,通过接入不同的网站,他们每月能从 10 亿台活跃的移动设备中收集用户的位置数据。不用再去购买数据了。
手机已成为数据收集引擎|Getty
另外,Phunware 为特朗普打造了“特朗普 2020”App,用来发布特朗普相关的竞选信息。而它嵌入了 Phunware 的位置追逐功能。
为了吸引人们下载这款 App,团队使出了各种“互联网营销裂变”的方法:
1. 如果你按照 App 里提供的玩法累积 10 万积分,你甚至可以与总统合影留念;
2. 通过共享你手机通讯里的联系人,你可以获得积分;
3. 通过邀请好友下载,你可以获得积分;
4. 达到一定积分,可以获得 25 美元的购物优惠券。
想必中国的网友对这一套玩法,应该是相当熟悉了。
要访问这个 App,用户必须使用手机号码注册。“政治上,最重要的就是手机号码。”数据分析公司 Apptopia 的 CEO,Sapir 表示,如果下载用户共享了他们的通讯录,那么只要有 140 万人下载,这款 App 就可以抓取到 1 亿人的电话号码,即便那 140 万之外的人并没有同意。
同时,一位 Phunware 前雇员称,即便用户没有打开“特朗普 2020”App,它也会悄悄运行。
他说,这款 App 可能会嗅出用户手机上的所有信息。比如,手机上有哪些 App、最近删除了哪些 App、以及使用时长等。它几乎可以了解到用户生活的全部,帮助特朗普随时随地完成监控。
Phunware 在商业上一直都很流氓。与 Phunware 合作过的人透露,在 Phunware 参与竞标测试的时候,它会收集每部手机和电脑的设备 ID,之后悄悄监控每一台设备的使用数据。
就这样,在争议中,Phunware 完成了数据积累。可怕的是,在世界上很多地区,都可以找到与 Phunware 相似的公司,极尽可能地“违规”收集用户的各种数据。
仅需 68 个“点赞”
掌握数据只是基础,重点是要怎么让其发挥作用,达到最终目的。
剑桥分析的 CEO 尼克斯在 2016 年的时候,曾经介绍过他们引以为傲的方法论,那时他们还没有被曝光。他说,他们会将收集到的信息进行归类,然后基于心理学的 OCEAN 理论并融合算法,将人们划分成不同类型的人格体,发掘出他们的政治倾向、恐惧和希望。
研究表明,只要获取你在社交媒体上超过 65 次的点赞信息,算法模型就可以预测出你的肤色、性取向、政治倾向、性格等;如果获取超过 300 次的点赞数据,那么算法模型可以“深入”到你的潜意识层面,比你更了解你。
事件被曝光前,尼克斯还在作为所谓的杰出的大数据科技公司创业领袖,到处宣讲|Getty
不再需要“问卷调查”了,网络上散落的资料甚至更能代表一个人。
这样,一个比你更了解你的机器系统,无异于扮演着上帝的存在。它可以掌控你的情绪和欲望。
接下来,根据系统的分析结果,“剑桥分析”会制作针对不同细分人群的广告,并通过 Facebook 等平台的广告系统定向推送。让一个群体接收到的信息总是和他人不一样。
比如说,根据 Channel 4 News 报道,2016 年大选的时候,特朗普团队通过数据系统筛选出那些潜在的可能支持希拉里·克林顿的黑人群体,向他们定向推送虚假视频广告,广告里希拉里·克林顿将黑人称为“威胁”,以此来“诱骗”这些黑人拒绝给希拉里投票。美国有色人种促进协会副主席 Jamal Watkins 在事后表示,这属于现代版“镇压运动”,利用数据和算法,让黑人选民放弃投票权。
Phunware 的一位前合作伙伴表示,想象一下,针对特朗普在 2020 年大选中的对手乔·拜登,Phunware 的系统会筛选出可能支持乔·拜登的人,然后在这些用户打开手机的时候,通过各个平台向他推送乔·拜登的坏消息,诸如“乔·拜登的美国意味着我们将在街上发生战争”。即便这些可能是假消息。
“剑桥分析”的 CEO 尼克斯曾认为,“竞选活动中决定成败的不是事实,而是选民的情绪。”因此,他们发布的内容或广告可能是假的,只要它能够煽动人们的情绪。
通过不断地“广告轰炸”,某一部分选民的政治倾向可能就会在“假新闻”影响下,发生逆转。这个过程是潜移默化的,几乎不可能被察觉。对于上千万人的“洗脑”就这么完成了。
个人数据的“资产化”
人的意志与野心,都藏在了算法里。
特朗普的竞选事件只是一个数据应用的最典型的案例。现在,算法、数据流淌在每一个存在互联网的角落,潜移默化地影响着每一个人。
数据的重要性在一桩又一桩的丑闻事件中,愈发凸显。Facebook 联合创始人 Chris Hughes 离开公司后对扎克伯格的后续做法感到不满,认为 Facebook 的算法加速着信息茧房的形成,“他对点击量增长的关注,导致他甘愿牺牲道德底线。”
各国政府开始进行数据立法上的尝试。比如,美国的一些州开始要求,从第三方购买和出售数据的公司需要向该州注册;加利福利亚州的居民可以选择不出售其网络平台数据给任何公司。
在中国,“数据”已经被纳入生产要素之一,与土地、劳动力、资本、技术并列,是每一个人的自身“资产”。10 月 11 日,中共中央办公厅、国务院办公厅印发的《深圳建设中国特色社会主义先行示范区综合改革试点实施方案(2020—2025 年)》显示,深圳将率先建立数据产权制度、探索数据交易市场。
在网络时代,群众的心智更容易被影响。出台相关法律、制度,想要限制的并不是技术的应用,而是在新技术野蛮生长的时候,让掌控、运用这些技术的人,不作恶。
每一个年代的人,都要面对和解决那个时段特有的共同问题。如何与算法、数据相处,就是我们这个时代的人所正在经历和将要解决的关键问题之一。
本文来自微信公众号:极客公园(ID:geekpark),作者:维鹏