正确的提示信息
扫码打开虎嗅APP
从思考到创造
打开APP
资讯
视频
前沿科技
车与出行
商业消费
社会文化
金融财经
出海
国际热点
游戏娱乐
健康
书影音
医疗
3C数码
观点
其他
榜单
虎嗅视界
24小时
妙投APP
虎嗅智库
登录
极速注册
取消
搜索历史
删除
完成
全部删除
数码
互联网
数码
互联网
热搜词
AI
人工智能
工作意义
年轻人
超级高铁
磁悬浮
高铁
火山
房地产
账号或密码错误
2014-02-10 14:08
那些你看不见的 Facebook 创新
虎嗅
(原文来自
Wired
,虎嗅编译)
Facebook 十年,深刻地改变了互联网。像 Like(点赞)、Wall(留言墙)和 Timeline(时间线)这些只不过是用户可以见到的产品创新,都是我们每次登陆时候能够见到的。在这些产品的后面,在庞大的数据中心里面,还能找到各种各样其他类型的技术。它们都在用不同的方式改变着我们的世界。
Facebook 在全球的用户数量已经超过 12 亿,Facebook 的工程师们要不断创造新的软件工具、新的硬件设备甚至是新型的数据中心,来为这样大规模的用户群服务。
从某种程度来说,Facebook 所做的事情以前 Google 和 Amazon 也经历过。但是与这两家公司不同的是,Facebook 将许多创新的方案开源,与全世界分享。这里说的不仅仅是软件代码,还有硬件设计,Facebook 的目的就是为了能够帮助到下一代互联网公司。
Cassandra
扎克伯格 2004 年创办 Facebook 时,使用的是开源数据库 MySQL,这是当时的标准 Web 开发工具。但是随着网站用户规模增加至百万级别,扎克伯格和工程师们发现需要用新的办法处理这个用户网络中的大量数据——也就是无穷尽的评论、点赞、图片和帖子。
幸运的是,Amazon 和 Google 之前也发布了相关的研究论文,探讨了他们处理机器中数据的方法。虽然两家公司描述了实现方法,但是却没有公开代码。于是 Facebook 的工程师们基于两家公司的论文内容,设计了一个新的数据库 Cassandra,并且在 2008 年开源了软件代码,这样其他人也可用了。
不过今天 Facebook 很大程度上靠的是 Hbase,这是一个基于 Google 所发布的 BigTable 论文设计的大规模数据库。Cassandra 的价值在于发起了 Facebook 的“NoSQL”数据库设计趋势,并且仍旧为一些知名的互联网公司(比如 Netflix 和 Digg)所使用。目前是全世界第二受欢迎的 NoSQL 数据库,并且是增长速度第三的数据库系统。
Hadoop
在全球重新定义数据分析的开源工具 Hadoop 是 Facebook 的另一个成功故事。基于两篇 Google 的研究论文,Hadoop 最早在 Yahoo 被开发出来,但是 Facebook 才是真正让 Hadoop 取得今天成就的原因。无论是互联网公司还是传统公司,Hadoop 都已经成为分析大规模数据的标准。
Facebook 是雅虎之外最早应用 Hadoop 的公司之一,在过去几年里,社交网络巨人 Facebook 改进了这个平台。比如,Hadoop 在早期有几个重大的系统缺陷,导致无法在日常使用中普及:一次简单的数据分析有可能导致整个服务器集群崩溃。为了解决这个问题,Facebook 的数据团队设计了一款名为 Corona 的工具,将计算进程隔离出来,这样就不会有独立任务拖垮整个系统。
与此同时,Facebook 还将 Hadoop 提高到全球的规模。Hadoop 最早是为单一数据中心的服务器设计,但是 Facebook 的团队让 Hadoop 能够在不同地理位置的不同计算中心上都可以运行。
TAO
和苹果一样,Facebook 是最早一批用闪存存储替代老式硬盘的公司。通过使用一种名为 Memcached 的工具,Facebook 将最频繁调用的数据分布到上千台服务器的内存子系统当中,进一步提高了速度。最近 Facebook 启用了名为 TAO 的工具,进一步利用了内存系统资源。
由 Facebook 设计的 TAO 能够用一个软件工具在硬盘和内存上存储数据。比如一些数据适合存储在硬盘上,另一些适合放在内存上,TAO 能够同时实现这两点。这种混合存储模式在现代的数据中心里面非常受欢迎。TAO 为这两种操作系统了统一的界面。
HHVM
在 Facebook 创办的早期,扎克伯格使用 PHP 语言编写网站代码。这在当时是最流行的编程语言,PHP 可以很迅速、便捷地更新网站,这也是 Facebook 迅速脱颖而出的原因。但是有一个问题:PHP 代码的运行效率不如 C++ 和 Java 语言。
于是 Facebook 的工程师团队开始研发一款名为 HHVM 的工具——Hip Hop Virtual Machine(译注:嘻哈虚拟机)的缩写。这个工具能够将 PHP 代码在执行时转化成机器代码。
硬件
Facebook 的创新并不仅仅限于软件方面,和 Google 一样,Facebook 也在设计自己的硬件设备。而且 Facebook 更近一步,通过开放计算计划(Open Compute Project)与全世界分享其硬件设计。
这一计划在 2011 年时被广受抨击。但是最终却在很大程度上改变了全球的硬件市场。许多公司现在都模仿 Facebook 的做法,直接到亚洲制造廉价的硬件设备,定制零部件。有一些甚至将自己的硬件设计开源。
Facebook 近几年实现了采用室外空气对数据中心降温的做法。不仅有助于缩减成本,而且对环境也有好处。
如对本稿件有异议或投诉,请联系tougao@huxiu.com
打开虎嗅APP,查看全文
频道:
前沿科技
支持一下
赞赏
0人已赞赏
分享至:
0
大 家 都 在 看
Facebook 新建人工智能实验室,负责人这样看“深度学习”技术
虎嗅
07:13
#AI有多智能
万物皆可生成式AI,风口还是噱头?
量子位
在很多英国青少年心中,Facebook是大叔与父母才呆的地方,对他们已不复存在
虎嗅
移动业务占营收53%!生于桌面的Facebook是怎么Pivot到手机的?
Mr.Jamie
Facebook的热门新闻阅读应用Paper够性感不?
虎嗅
Facebook 把我们都耍了吗?
虎嗅
SAP和Salesforce为什么要开发自己的编程语言?
阿朱说©
微软谷歌们纷纷站台,无代码时代真的来了吗?
硅心思鉴
微软:AI不抢你工作,只当副手
晚点LatePost
我一周内“克隆”了Twitter,没用一行代码
AI前线
微软,用最开放的云,玩最野的AI
极客公园
27:16
#AI有多智能
与Tapdata论道数据技术开放生态
大咖说小编
13:11
#华为稳不稳
解密安卓是凭什么断供华为的?
花狸胡说
14:05
#AI有多智能
微软、华为鸿蒙、Intel纷纷入局,什么是“AI PC”?
白呀白Talk
13:28
#AI有多智能
人工智能独角兽,就是不爱讲人话
宇多田
10:40
#内幕大揭秘
当我们伤害开源的时候,在伤害什么?
差评君
16:49
#大公司情报站
企业,如何抓住开源数据库的红利?
大咖说小编
12:52
#芯片新动向
阿里研发的CIPU要抢CPU的饭碗?
老石谈芯
04:07
#AI有多智能
中国大模型为什么更关注产业?
脑极体
25:27
#AI有多智能
越来越卷的人工智能,未来发展方向究竟在哪儿?
老石谈芯
大 家 都 在 搜
AI
人工智能
工作意义
年轻人
超级高铁
磁悬浮
高铁
火山
房地产
APP内打开
好的内容,值得赞赏
您的赞赏金额会直接进入作者的虎嗅账号
自定义
支付:
元
匿名赞赏
支付