扫码打开虎嗅APP
本文来自微信公众号:硅谷密探(ID:guigudiyixian),作者:硅谷密探
百度这两天争议不断,Google的日子过得也不舒坦。
当地时间1月21日,根据法国监管机构国家数据保护委员会(CNIL)提供的证据显示,Google的用户协议违反欧洲在2018年更新的《一般数据保护条例》 (General Data Protection Regulation,即大名鼎鼎的 GDPR),法国监管机构对Google母公司Alphabet罚款5000万欧元!
这是迄今为止,欧洲范围内一家公司因违反隐私数据法遭受到的最高额处罚金。多家英文科技媒体报道时,都用了“record high”(破纪录地高)描述处罚力度之狠。
根据欧洲的最新法规,Google违反的具体条例很多。比如数据收集信息不透明、用户不了解数据收集情况、数据处理和存储时间等完整信息并未全部出现在同一位置、Google搜索引擎未获得用户同意收集有针对性的广告数据等等。
到底是欧洲政府“截胡”还是Google“作恶”?
密谈记者通过调查,发现了一篇美国范德堡大学出版的题为Google数据收集(Google Data Collection)》的报告。这篇长达53页的报告,其作者是该机构计算机教授道格拉斯C·施密特(Douglas C. Schmidt)。这篇报告揭露了Google毫无节制的数据收集行为。
Douglas C. Schmidt,图片来自范德堡大学官网
密探记者在惊讶之余,更感到了深深的恐惧。那么,Google到底对用户收集了多少数据?又是怎么使用这些用户数据的?下面,我们就来看看这篇报告。
教授做了个实验,然而…...
施密特为了做这个实验,专门用一台新的Android手机,用新的SIM卡和新注册的Google账户,并给这位用户起名为“简(Jane)”,以此为我们讲述了一个Google用户的一天。
我们下面简单讲一下数据来源和调查方法。在这里,施密特教授通过下面四类数据进行了这次调查:
Google的 My Activity 和 Takeout 显示的数据;
Google服务器域被截获的数据;
Google的隐私政策出现的数据;
第三方研究机构观察到Google收集的数据。
密探打开了自己的My Activity,一天使用行为暴露无遗
“一个典型的场景是这样的:一个拥有 Google 帐户和 Android 手机的用户,Google 会在众多活动接触点收集数据,例如位置、路线拍摄、购买的物品和听过的音乐。令人惊讶的是,Google 通过被动方式收集或推断超过三分之二的数据信息。在这一天结束时,Google 就能准确把握住用户的兴趣。”
报告截图
看到这,很多大概都会觉得很正常,毕竟“没有隐私数据泄露”的当代生活已经不稀奇。那么,你的什么信息被收集了呢?Google又是怎么收集的?
一天340次跟踪:关手机、不用Google、关Wi-Fi都没用
从数量上看,Google服务器每天通过Android手机传输11.6 MB数据,不断上传备份到后台。Android手机的个人用户信息包括姓名、手机号码、生日、邮政编码、信用卡号码、手机上的活动(使用的应用和网站,包括如何使用)。
报告截图:一个普通用户日常使用Android手机和iPhone的收集数据对比
从上面这张图上,我们也可以看出Android手机用户被Google收集信息的频率高达90次/小时,比Google收集苹果用户信息都要高出一倍多。有趣的是位置坐标数据收集“很智能”,正在使用的手机比没有打开的手机,其被收集的数据量高出1.4倍。
但是实验发现Google的数据收集方式开始让人细思恐极。下面,正式带你体验Google用户专享的“贴心服务”,全方位的“被动收集”是Google的独门秘器。
“一台休眠的Android手机,只要Chrome浏览器后台处于活动状态,会在24小时内向Google传送位置信息340次。位置信息占发送给Google的所有数据样本的35%。相比之下,没有安装Chrome浏览器的iOS设备,Google就无法收集任何数据。”
实验进一步表明,即使用户未与任何关键Google应用程序进行互动,Google仍然可以通过其广告客户和发布商产品收集大量信息。“Android手机用户只要打开手机后,被动数据收集行为就会大幅增加,占向Google服务器发出的所有请求的46%。”
即使不打开Google的任何应用程序,不使用搜索,与Google服务器域的被动通信也会显着增加。那么Google为什么这样收集数据,收集的数据去了哪里?
一场好戏:打着“匿名”的旗号反追踪
相信大家已经猜到了,这部分的数据活动影响背后的核心是Google广告盈利工具 —— Google Ads,Google Analytics及Google Ad Manager。Google提供给商家的工具在全球独一无二,发布商工具还有AdSense和广告客户工具,例如AdMob、AdWords。
这些工具是怎么以平台的方式无处不在地收集用户数据信息的呢?
报告截图,注意和上面不一样,iOS和Android设备从用户端被发送出去的信息
Google通过专门在系统中标记“匿名用户”,把收集好的数据拿来使用,赤裸裸地演绎了“此地无银三百两”。为什么呢?
因为Google会收集自家相关应用和第三方网页访问的活动数据,然后再与用户的Google身份相关联。主要通过Android收集,将“设备标识”传递给Google服务器来实现的。同时,“广告标识符”也在这个时候派上了用场,形成了完整的闭环。
换句话说,Google将通过被动方式收集到的“匿名数据”,与用户的个人信息相关联,其实绕了一大圈,最后大费周章用“合法手段”利用这些数据信息。
同样地,Google Ad Manager的Cookie ID(跟踪用户在第三方网页上的活动缓存信息)据说是另一个“用户匿名”标识符。如果用户在同一浏览器中访问Google应用程序,Google可以将其连接到用户的 Google帐户之前所访问过的第三方网页。
看懵了?密探帮你清醒清醒,Google收集数据的特点都有这些:
利用各种产品、各种技术,以一般用户无法轻易察觉的方式来收集用户数据;
Google的数据收集的主要发生在用户未直接使用Google的任何产品时,尤其是在搭载Android的移动设备上;
虽然Google一般都是在用户匿名的情况下收集数据信息,但Google明显拥有利用从其他来源收集到的数据,并对此类集合进行去匿名化的能力。
这篇完整的报告很长,也希望有兴趣研究试验方法和实验过程的同学去仔细探究一番,密谈在这里就不再赘述。因为,这样的例子实在是太多了。
YouTube上的个性化广告是其中之一,Google的广告业务覆盖了90%全球用户,200万个主流网站,你的生活已经被Google的“数据操控”看了个清清楚楚、明明白白。
听起来,这是不是很像《黑镜(Black Mirror)》里的某一集?就如报告中所概括的:
“在上述产品中,Google大范围收集有关人们在线和现实世界行为的相关信息,然后用来支撑广告业务。比如,随着定位技术和数据的完善,Google的收入显着增加。”
Google是互联网公司,也是广告公司
密探和许多用户一样都热爱Google的产品,我们先来重新认识一下2019年的Google。
比如密探写这篇文章时,使用了Google的搜索引擎、Android手机、Chrome浏览器、Google翻译和Google文档。还有,视频平台Youtube,电子邮件服务Gmail和Google Maps。每一个平台的月活跃用户都超过了10亿,并且也都在各自领域里名列前茅。
谷歌帝国 图片来自 CS Open Source
Google的服务如此方便,但是作为免费用户,你给Google创造了多少价值?
根据福布斯(Forbes)的数据显示,Google在2018年的利润共计1.26千亿美元,在世界500强盈利最多的公司中排名14。Google进入福布斯世界500强已经有13年里,其业务利润的增长可以说是指数爆炸级别的。
图片来自Statista
Google的母公司Alphabet不只是互联网公司,也是全球最大的数字广告公司,这才是Google产品“免费”却能够盈利的关键。这次法国监测机构的罚款金额很庞大,但实际上,这连Google在2018年一整年盈利的百分之一都不到,只有0.0045%。
密探之前多次讨论过数据隐私的问题,但是在2019年实现数据保护还现实吗?科技公司仿佛科幻电影中的预言一般支配着我们的生活,现在Google对用户的了解已经远远超过了用户自己。
“老大哥在看着你” 国外网友根据《1984》创作的讽刺谷歌的图片
那我们作为人类,作为各种互联网产品的创造者、使用者,可以完全抛弃对隐私保护的需求吗?。英语里有一句俗语叫做Freedom is not Free,意为“自由是要付出代价的”。
就算我们能为所有产品找到替代品,例如用微软的邮箱服务,用DuckDuckGo搜索,用iPhone而不是Android手机,长远来看,只恐怕这些做法也没有什么意义。
数据决定一切,也许是时代发展的必然。
当你看到这儿,会不会想扔掉Android手机?还是对Google有了新的看法?