正确的提示信息
扫码打开虎嗅APP
从思考到创造
打开APP
资讯
视频
前沿科技
车与出行
商业消费
社会文化
金融财经
出海
国际热点
游戏娱乐
健康
书影音
医疗
3C数码
观点
其他
虎嗅视界
24小时
专题/活动
虎嗅智库
登录
极速注册
取消
搜索历史
删除
完成
全部删除
数码
互联网
数码
互联网
热搜词
钟睒睒
字节跳动
短视频
本地生活
美团
货币
抖音
网络暴力
房地产
账号或密码错误
2013-06-17 15:50
PRISM,像DropBox一样同步信息的云数据后门?
虎嗅
(原文来自
Arstechnica
,虎嗅编译)
NSA使用大数据做监控已经人所共知了,虽然NSA有能力从电话网络和互联网当中搜集海量数据,但是直到最近NSA都没办法真正从全部数据中截获并永久存储这些数据,不过倒是谷歌和雅虎的研究结果解决了这些问题,此外还要
感谢与电话公司的合作。
本文作者基于自己的采访和各方消息的整理,论述了NSA在“大数据”存储和分析上的实际操作方法,并就互联网公司否认的向NSA提供“直接访问”一点,提出新的质疑,即类似DropBox的云端数据同步模式。
NSA面对的是怎样大规模的数据?
2006年AT&T前雇员马克・雷恩(Mark Klein)揭露了该公司帮助NSA在光纤骨干网当中安装窃听装置的信息,这种装置被称为是“情报流量分析器(Intelligence Traffic Analyzer)”。生产这种装置的公司是Narus,2012年9月,我采访了该产品的数字分析模块负责人尼尔・哈林顿(Neil Harrington)。他在采访中对我说,这种仪器能够在每秒钟内对上千兆(gigabits)数据进行分类和排序处理。“一般10G网速的以太网界面能够始终保持每秒最高12G的速率,如果关闭标签匹配(tag pairs),还能再快些。”NSA在美国本土和全球其他国家的许多网络环境当中都使用这种监听设备,在如何处理这些海量数据的问题上,也遇到了一些问题。存储、索引和分析的数据体量需要更先进的技术。
思科的数据显示,2012年全球互联网每天的流量达到1.1EB,NSA想要捕获并存储这样大规模的数据是不可能。况且还有SSL加密技术,破解SSL加密连接需要花费许多计算成本,无法应用在全网流量上。所以就算NSA能够窃听网络传输,大概也没办法做到实时监控。
“社交网络”的雏形 & 秘密社交图谱
自从2001年的911事件之后,NSA就开始从电信公司那里用户信息,其中包括电话拨叫纪录、移动设备的地址信息等等。NSA从所有搜集的数据中进行挖据,这个数据库被称作MARINA。根据《卫报》上周披露的文档,NSA仍旧在搜集所有美国本土和海外拨叫电话号码——只不过现在有了FISA(海外情报监听法案)的承认。2006年,《今日美国》的文章称MARINA是“全球最大的数据库”。
具有讽刺意味的是,大概在同一时间段有两个软件程序被曝光,互联网公司谷歌和雅虎当时正在解决大数据存储和分析的一些问题。2006年11月,谷歌发布了一份有关BigTable的论文,BigTable是一种能够对PB规模级别的网络数据进行索引的技术,支持Google Earth和其他应用程序。雅虎则开发了比谷歌GFS文件系统(BigTable的理论基础)更先进的技术,成就了Hadoop的问世。2008年,NSA对BigTable进行了调整,改名为Accumulo,目前该项目由Apache基金会负责。
Accumulo能够基于数据的特殊模式产生实时报告。比如,系统能够从某个IP地址段当中寻找特定关键字或者电邮内容中的地址,也可以寻找与某个目标号码相隔两度的电话号码。接着Accumulo可以把找到的电子邮件或电话号码放到另外一个数据库里面,供NSA特工进一步调查。
换句话说,Accumullo让NSA可以像谷歌处理用户电邮和Web搜索一样,只不过一切信息都是从互联网的通讯流量、或者你拨叫的电话而来。Accumulo只是NSA的手段之一,过滤后的数据Accumulo可以传输给其他分析工具,比如Palantir。后者是可视化的数据分析工具,可生成关系图谱——这一点和Facebook的Unicorn搜索和社交图谱在概念上十分类似,谷歌的知识图谱和微软的Satori也是如此。
Accumulo已经可以为分析工具提供大规模的数据了,但是这还没完,NSA又引入了其他社交网络的数据源,这就是PRISM。
PRISM,像DropBox一样的云平台后门?
前文提到,NSA面临的问题之一是SSL加密连接,也就是Gmail、Facebook、Hotmail这些服务用来保护数据传输安全的技术。讽刺的是,PRISM让SSL加密技术成为NSA搜集数据的积极因素。
基于斯诺登披露的文件和发布在《华盛顿邮报》和《卫报》上的内容,微软实际上从2007年就在向NSA提供数据。PRISM帮助NSA在云计算平台上直接获取数据和用户信息,可以绕过SSL加密认证,直接调用云端存储的数据。
PRISM等于是NSA和云服务平台的在线通讯链接。尽管对于这一点还有些争议,是否为“直接连接”仍旧存疑。但是《卫报》和《纽约时报》的文章引述微软线人的信息指出,PRISM更像是DropBox那样的模式,好像是“安全在线空间(secure online rooms)”一样。互联网公司们可以用这种方式把数据提交给NSA,即与服务器信息进行同步。内容就是用户信息、电邮内容和分享的文档等等。FBI就曾在以往的调查行动中发现了前CIA情报部长大卫・皮特尔斯(David Patraeus)的婚外丑闻。
如对本稿件有异议或投诉,请联系tougao@huxiu.com
打开虎嗅APP,查看全文
频道:
前沿科技
支持一下
赞赏
0人已赞赏
分享至:
0
大 家 都 在 看
这次是彭博:用户隐私,还要出多少事儿?
虎嗅
12:52
#Web3.0完全手册
Web3.0如何真正地实现去中心化存储?
纳斯赛博伯
科技巨头被指向政府提供用户隐私,媒体社论称其“公信力尽失”
虎嗅
泄密者斯诺登若被引渡,前途渺茫
虎嗅
谷歌自证清白:称政府未直接访问谷歌服务器
虎嗅
关于“棱镜”泄密者斯诺登,美国主流媒体是这样评价的
F4bregas
Dropbox 大血拼:为上市”增肌”
虎嗅
Oracle或已引发今年最大的数据安全事件
极客邦科技InfoQ
苹果的数据保护服务,目标客户是斯诺登?
旗舰
微软承认客户数据泄露:云存储成网络攻击主要路径
极客邦科技InfoQ
多出20倍?Android 收集用户数据量远超 iPhone
CSDN©
08:17
你的隐私,是怎么被手机扒光的
张博文
21:24
习惯通用一个账号密码?你的隐私信息可能已经暴露了
造就Talk
06:48
#AI有多智能
隐私保护的终点是自发上传“果照”?
ECO新势
08:42
#想通了吗
“偷听”太简单,隐私早完蛋
想通了吗
07:13
互联网垄断来袭,谁来守住用户的隐私底线?
动动枪DongDongGun
07:42
大数据会怎么找出潜在的新型冠状病毒接触者?
动动枪DongDongGun
10:27
#高新技术流
《个信法》的这个彩蛋,99%的报道都没发现
所长林超
08:40
#苹果又来了
“壁垒森严”的苹果能保护隐私安全吗?
馒头De爸爸
15:58
#Web3.0完全手册
Web3.0是什么?能给我们带来什么改变?
纳斯赛博伯
大 家 都 在 搜
钟睒睒
字节跳动
短视频
本地生活
美团
货币
抖音
网络暴力
房地产
APP内打开
好的内容,值得赞赏
您的赞赏金额会直接进入作者的虎嗅账号
自定义
支付:
元
匿名赞赏
支付