扫码打开虎嗅APP
本文来自微信公众号:经济观察报观察家 (ID:eeoobserver),作者:陈永伟,原文标题:《上云还是下云?这是一个问题》,题图来自:视觉中国
10月27日,也就是马斯克收购推特(现在的X)一周年的日子,X的工程技术团队发布了一条帖子,向用户汇报了一年来的工作成就。
在这条帖子中,X技术团队宣称:过去一年是 X平台全面推进工程技术探索的一年。除了大家在 X应用端看到的直观调整之外,该团队还对X的后台进行了很多重要改进。在其列举的一系列改进中,就包括了“下云”(Cloud Exit)。
据称,目前该团队已经“优化了 X的云服务使用方式,着手将更多工作负载迁往本地基础设施。这一转变使 X每月的云成本降低了60%。”
众所周知,随着数字化的推进,很多企业将上云作为数字化建设的重要指标,很多研究也宣称上云可以帮助企业节约成本、提升效率。然而,X的此次下云似乎和云化的趋势唱了一个反调。X的此举究竟是出于何种目的?这是否说明了企业上云的趋势已经发生了逆转?对于云计算的使用者而言,此次事件说明了什么?对于云服务商而言,它又带来了哪些启示?关于这些问题,且让我们一一说来。
X为何要下云
所谓云,其实就是一种IT资源的在线化。企业使用了云之后,就无需再在本地建设相关的IT资源,只要按需从线上购买所需的资源和服务即可。在推特发展的早期,虽然也使用一定的云服务,但是其主要的IT基础设施是在本地。直到2016年前后,推特才开始考虑上云。
2018年5月,推特宣布和谷歌云达成合作,将其冷数据存储和灵活的计算Hadoop集群从本地迁移到谷歌云。对于推特这样一家“二线”的互联网公司来说,要依靠其本地服务器托管巨大规模的数据实在是一个不小的负担。更为麻烦的是,作为一个社交平台,推特每时每刻都在产生大量的数据。为了应付这种数据的增长,推特就必须不断地对基础设施进行扩容。而这对于一家连年亏损的公司而言,更是难以负担的。在这种情况下,将一部分基础设施,尤其是那些需求量变化较大,可能需要实时调整的设施从本地迁移到云上,就成为了推特的一个选择。
值得一提的是,在2018年的这次上云中,推特其实是采用了一种相对审慎和折中的态度。事实上,在2016年,推特内部就对于上云问题进行了讨论。当时,一些工程师认为,出于控制成本的考虑,可以将所有的基础设施都迁移到云端。但这种意见后来遭到了否决。推特的决策层认为,应该将那些最重要的设施保留在本地,只移动最能从云功能中受益的部分。可以看到,将冷数据存储和灵活的计算Hadoop集群迁移到谷歌云就是这种策略的体现。
在实践中,很多企业出于方便的考虑,在选择上云时会选择同一家云服务商来提供所有的服务。但推特并没有采用这样的策略,而是根据实际需要,选择了多云策略。在将部分Hadoop集群从本地迁移到谷歌云后两年,推特又和亚马逊旗下的云服务商AWS达成了合作。
2020年12月,推特宣布,将委托AWS为其提供“主时间线”(main time-line,这是推特的提示功能。用户可以从这里看到他人和自己的互动情况以及相应的时间)提供支持服务。按照推特和亚马逊当时的合同,这项合作会持续五年半,合同的总值达到5.1亿美元。根据交易细则,在此后的每个月,推特将向亚马逊支付773万美元的AWS使用费。
不过,这个合同并没有按照其预期的那样顺利地执行。从2022年初开始,马斯克就对推特发起了收购攻势,并且在2022年10月顺利完成了收购。早在入住推特之前,他就对推特的管理和经营表达了很大的不满,声称自己在掌控推特之后会对其进行重大的改革。后来的事实证明,马斯克确实是说到做到。他抱着水槽进入推特总部后,就立即开除了原来推特的几乎全部管理层。随后,他又雷厉风行地对公司展开了大规模的整顿。推特每月支付的云计算开支很快进入了他的视野。在他看来,推特在服务器和云服务上的支出实在是太高了。
马斯克认为,原推特管理层和谷歌、亚马逊等服务商签订的协议十分糟糕,出于成本控制的需要,应该撤销这些合同,或者就合同进行重新谈判。或许是出于谈判策略的考虑,马斯克接管推特后不久,就开始当起了“老赖”,拖欠起了云服务商的费用。早在今年3月,《信息》(The Information)杂志就爆出新闻,称马斯克执掌的推特拖欠的AWS服务费已经达到了7000万美元之巨。不久之后,又有媒体爆出,推特拖欠谷歌云的费用可能已经过亿,由于这个原因,谷歌差点就要把马斯克告上法院。幸亏马斯克任用的推特CEO琳达·亚卡里诺(Linda Yaccarino)从中斡旋,拍板让推特还清了对几家云服务商的欠款,才让推特和马斯克本人避免了法律上的麻烦。
尽管外界的很多评论认为马斯克的这一系列行动近乎无理取闹,但作为坚定的行动派,马斯克本人并不在乎外界的想法。事实上,事情正在按照他预计的推进。一方面,在他将推特更名为X的同时,他就已经把一部分业务从云上撤下,重新放回到了本地的服务器上。另一方面,在那些他认为可以通过谈判,向云服务商取得一个好价钱的领域,他依然选择了使用云。比如,他停止了使用AWS来支持X的主时间线,但却继续使用了AWS for Spaces等其他服务,并且考虑在条件合适的情况下,用谷歌云平台来作为X主时间线的支持。可以看到,马斯克的这一波操作其实是有上有下、有进有退的。从这个意义上看,与其说马斯克的这一波操作是一次纯粹的下云,倒不如说是一次对资源在云端和本地的重新配置。
关于这次X下云的战果,目前众说纷纭。如前所述,根据X方面自己的宣传,其成就是非常突出的。不过,也有一些评论提出了质疑。他们认为,虽然下云把用云成本降下来了,但这同时意味着X需要购置更多的服务器,建设更多的服务中心,两相比较之下,其净收益究竟如何,可能还不好说。
除了节省成本之外,马斯克可能还有更多的打算。一方面,由于马斯克鲜明的个性,他和谷歌、亚马逊等云服务商之间都存在着一些矛盾。在这种情况下,将对于公司来说至关重要的资源放在这些服务商提供的云上难免会有安全上的顾虑。另一方面,由于云业务本身就是一个十分吸引人的行业,因此马斯克本人也可能对其具有兴趣。事实上,现在马斯克已经投入了大量的资源研发了自己的大模型。众所周知,目前大模型最重要的业务模式就是作为SaaS云服务输出。照此看来,X的这次下云或许正是让自己成为云服务商的一个前奏。当然,关于这些,现在还只是猜测。要搞明白马斯克的思路,可能还要让子弹再飞上一会儿。
“下云潮”缘何出现
或许是由于马斯克个人的影响力,也或许是由于X公司本身的重要性,这次X的下云事件受到了很多媒体的关注,并被作为了一起典型的下云事件来进行报道。但事实上,如果我们对云计算行业有所了解,就会知道X下云并非个例。
从几年前开始,很多企业就已经开启了从公有云撤退的历程。比如,早在2016年,著名的云存储公司Dropbox就将大部分工作负载从公共云转移到了“托管设施中成本更低的定制基础设施”,并在两年内节省了近7500万美元。从2015年到2017年,其毛利率也从33%增加到67%。一举成为了“下云运动”的初代赢家。
在最近一两年,这种从云端撤退的趋势正在加速。根据IBM在2022年发布的《IBM企业转型指数:云现状》(IBM Transformation Index: State of Cloud),80%的企业已经考虑或正在考虑将已经部署在公有云上的工作负载迁回私有的基础设施。Wanclouds发布的《2022年云计算成本和优化展望》(2022 Cloud Cost and Optimization Outlook)也印证了这个趋势。这份报告公布了一次针对IT经理人的调查结果,在所有受访人中,81%表示,随着成本飙升和市场下行,他们的最高管理层已经指示他们要减少或不承担额外的云支出。
为什么会出现这样的情况呢?要回答这个问题,我们首先要对上云和下云的成本与收益进行一些说明。
我们不妨打个直观的比方:“上云”就好像是租房子住,“下云”则好像是买房子住。在现实中,租房和买房各有其利弊。租房方便、灵活,尤其是精装公寓,租户什么都不用置办就可以拎包入住。这对于那些手头预算有限,买不起房但却对居住质量有追求的人是非常有吸引力的。然而,租房也会有很多不便之处。租户不仅不能根据自己的想法对房子进行修改,还要担心房东哪天会涨房租,或者直接停止租约,把自己扫地出门。相比之下,买房十分花钱,而且买房之后,装修也十分费钱费力。但是,一旦有了自己的房子,就不用为有人来收租而操心了,并且还可以按照自己的喜好随意调整装修和陈设。
基于以上的原因,那些对灵活、便捷要求更高,住房需求变化很大的人一般会倾向于租房住,而相比之下,那些更为追求稳定的人则会更倾向于买房。与此同时,个人的财力也是影响买房/租房决策的重要变量。总体来看,大部分人在初入社会,收入不高时,都会选择租房,但在年岁和收入都有所增长之后,就会选择买房。
同样的道理,对于企业而言,使用云服务需要投入的固定成本很低,并且可扩展性很强,因此很多企业在创立之初,没有能力足够投入,创造自己的全套IT基础设施或私有云时,就会更倾向于选择公有云服务商提供的服务。但与此同时,云服务却具有较高的边际成本,并且安全性较弱,根据用户意志自行调整的空间也相对较小。此外,相对于本地资源,云端的IT资源还会有更高的时滞、更长的响应时间,这可能会对用户体验产生很大的影响。因此,很多企业在成长之后,就会选择下云,转而使用自己的IT资源或私有云。或者,如果公有云的价格不断上升,导致企业难以负担相关的使用费时,它们也可能会选择下云——就好像有些人会因为不堪房东不断涨房租愤而退租买房一样。
如果按照上述逻辑来进行分析,就会发现“下云”的趋势其实是两个原因共同作用的结果:
一方面,之前借助公有云成长起来的一部分企业目前已经具备了自建IT基础设施或私有云的能力,因而它们出于节约边际成本、保证安全,或者为自由发展业务考虑,会选择下云。
另一方面,受通胀等因素的影响,近年来公有云的成本也出现了上涨。这使得对于很多企业而言,上云的性价比出现了大幅下滑。在这种情况下,下云就成为了它们止损的一个重要方法。
值得一提的是,“下云潮”的出现并不代表云计算就此过时。事实上,上云下云,就如生老病死。如果从单个企业的角度看,它从上云到下云就走完了一个完整的周期;但如果从整个市场的角度看,每时每刻都有大量的企业诞生、发展和死亡,因此在大批企业下云的同时,也有很多新生的企业成为新的云用户。或许受经济周期的影响,在一定时期内,云计算的用户增长会出现一定的放缓,但至少在最近的十年内,公有云应该还是大多数中小企业的最佳选择。
当然,在当前的经济形势之下,企业对于成本效益的敏感性会变得更高。在这种情况下,企业在选择是否上云时,将会变得更加谨慎,云服务商的商业策略也应该随之做出一定的改变。
企业应该如何重新思考云策略
包括X在内的大批企业的下云可谓是给希望进行数字化改造的企业提了一个醒:上云虽好,但也需要谨慎。长期以来,在各种叙事中,上云是一个有百利而无一害的事情。它的好处很直接:需要的固定投入很小,使用完全可以根据客户需求决定,弹性很大。反过来,如果用户对云不满意,也可以随时退掉云服务,似乎不会产生任何成本。
然而,情况其实并非这么简单。事实上,上云的负面效果并不少。除了前面提到的高边际成本、低灵活性等通病外,云服务商的一些付费模式还可能放大云的负面效果。举例来说,现在的云服务商越来越多地开始使用订阅制的付费方式。在这种模式下,用户只用按时支付一定的年费或月费,就可以享受到一个固定量的IT资源“套餐”供应。如果简单计算单位价格,订阅制似乎是十分划算的,但事实上,这种定量的供应其实是取消了云计算的一个天然优势——按量取用。在这种情况下,如果用户没有用光“套餐”中的资源,就可能导致非常严重的浪费。其逻辑就好像公园年票看似非常便宜,但很多买了年票的用户其实每年去不了几次公园,因此如果按照实际的游玩次数计算,他们面对的价格可能比买零售的票更高。咨询机构Flexera发布的《Flexera 2023云状态报告》(Flexera 2023 State of the Cloud Report)似乎可以为此提供一些佐证。在这份报告中,Flexera汇报了一次针对全球 750位云决策者和用户的调查结果。调查显示:在企业的云支出总额中,有 28%是浪费的支出。而追究浪费的原因,很大一部分可以归结到订阅制带来的用量刚性。
另外,企业还必须注意的一个问题是下云的成本。所谓上云容易下云难,要从云端撤回本地远没有像云服务商宣传的那么容易,经常会遇到各种意想不到的困难。比如,为保证数据安全,云服务商会对敏感数据采用加密算法加密后再进行存储。这样,在使用时,服务商出示公钥,使用者出示私钥,在验证成功之后,提取相应的数据。有时,这些加密是单向的,加密后就难以解密。如果一直保持在云上使用这些数据,这并不会产生任何问题。但如果要把这些数据进行迁移回本地,就会非常困难,因为即使平台也没有完整的解密数据,不能完成迅速的传输。
除了类似的纯技术问题外,云服务商的刻意不配合也可能增加用户的下云难度。出于经济利益的考虑,云服务商总是希望用户可以继续使用自己的产品,因而当用户表露出下云的愿望后,他们可能会用各种方式来进行挽留甚至阻挠。比如,在前面的加密数据例子中,一些云服务商所说的单向加密数据其实并非真正进行了单向加密。也就是说,如果云服务商配合,它们可以被解密并传输。但是,在一些案例中,云服务商出于留住用户的考虑,会谎称数据无法解密。从理论上讲,当面临云服务商的类似阻挠时,用户可以通过技术和法律的手段来解决问题。但在现实中,一旦用户上了云,将关键的资源交给了云服务商,他们就可能在谈判中陷入十分不利的地位,而技术和法律的手段在现实中也经常不可行。
基于以上的理由,很多上了云的企业通常要耗费非常长的时间和资源才能完成下云工作。被视为软件天才的大卫·海涅梅尔·汉森(David Heinemeier Hansson),也就是业界鼎鼎大名的DHH曾向人们“直播”了自己的下云过程。去年10月,汉森就在社交媒体上表示,由于不满云服务的高昂费用,将把自己创建的项目管理软件Basecamp和电子邮箱服务HEY从云端撤回本地。在宣布了这一消息后,汉森马上在自己的网页上开辟了一个下云日记的版块,详细地记录了自己为下云做的各种工作,并实时向网友通报下云的进度。根据这份日记,从打算下云算起,到最后的一部分数据转移完成,他的整个下云过程持续了半年多。而他本人则表示,这个进度已经比他预计得快太多了。即使专业如汉森,他的企业下云也花了整整半年的时间,对于一般企业来说,下云的难度也就可想而知了。
考虑到上云可能并不如预期的那么好,下云又可能比想象的难,企业在进行自己的云战略规划时,就必须更加审慎。具体来说,他们应该要想好如下几个问题:
一是究竟要不要上云。如前所述,在数字化的大潮之下,上云已经成为了一股风潮,很多企业的上云其实是随大流。但通过前面的分析,我们已经看到,上云是有利有弊的,对于一些企业而言,上云其实并不划算。因而,对于是否上云问题,企业应该根据实际情况进行理性选择。
二是究竟要将多少资源上云。企业使用的IT资源是多样的,其中既包括各种硬件设施,也包括软件及数据。要将其中的哪一部分放在云端,哪一部分留在本地,企业必须有一个通盘的规划。
三是究竟要上什么云,上几个云。在市场上,不同的云服务商存在着很大的差异,不仅提供的服务各异、质量各不相同,定价也有高有低。因此,企业要想用到价廉物美的云,就必须货比三家。这里尤其值得一提的是,和过去的企业更倾向于选择购买同一个云服务商的产品不同,越来越多的企业已经开始选择“多云”战略,从不同的云服务商那里购买不同的服务。而随着类似策略的普及,如何在不同的云之间做好平衡和协调,也将成为希望上云的企业必须思考的问题。
汉森在完成了自己的下云后,曾经在自己的社交媒体上给正在考虑用云的企业留下一段忠告。他说:“云对于那些处于生命周期早期、支出微不足道或者存在24个月内可能无法继续经营的公司来说是有用的。但要当心,不要把那些慷慨的云服务赠品看成礼物,这是一个陷阱。如果你过多地依赖他们专有的托管服务或无服务器方案,一旦账单开始飙升,你会发现很难逃脱。”在笔者看来,在企业思考自己的云战略时,汉森的这番经验之谈是十分具有参考价值的。
云服务商将何去何从
对于云服务提供商来说,“下云潮”的到来也提出了新的挑战。当越来越多的企业认识到上云不再是一个不可逆的过程,并纷纷选择从云上撤退后,如何留住已经上云的老客户,同时给新客户上云的理由就成为了它们必须思考的问题。而在这一过程中,下面几个方面可能是值得他们关注的:
一是对云的收费模式进行调整。正如前面指出的,现在越来越多的云服务商开始采用订阅制的收费模式。尤其是SaaS服务,订阅制几乎是唯一的收费模式。在很多云从业者看来,订阅制就是公有云发展的必然。然而,在现实中,情况似乎并非如此,订阅制的实施并没有给服务商们带来他们希望的收益增长。为什么会这样呢?其原因可能还要从订阅制的根子上去找。
从历史上看,云服务,尤其是SaaS服务的订阅制是从Salesforce、Oracle等公司开始的。从初衷看,它们的本意是要通过付费模式把服务的价格压下来,从而让小企业也能用得起。然而,正如我们前面指出的,这种模式其实是破坏了云服务最关键的一个特点——按需取用。因此,一旦企业对“套餐”资源利用不饱和,云服务的性价比就会非常低。由于小企业受环境的影响较大,其用云量很容易出现波动和不饱和,这时它们就会认为用云不划算,从而下云。尤其是在经济不确定性日益变大的今天,情况更是如此。事实上,如果我们看一下Salesforce、Oracle这些最早倡导订阅制,期望以此来惠及中小企业的云服务公司,会发现它们的主要客户依然是大企业。更为重要的是,大企业由于更有能力自建IT资源,因而它们的需求其实并不稳定,这就会让云服务商的未来面临很大的变数。
针对这个情况,云服务商应当考虑对付费模式重新进行布局。为了吸引中小企业用户,应当设计更为灵活的付费模式,如按实际使用付费。或者,至少要给出更多可供选择的订阅套餐。通过这样的方式,才能稳住这批用户。
二是应当加强FinOps服务。从构词上看,FinOps是“财务”(Finance)和“开发运营”(DevOps)的组合。从直观上看,它指的是一种通过工程、财务、产品等方面的跨职能团队的协作,以实现更快的产品交付、获得更多的财务控制和可预测性的实践。
正如前面提到的,现在的企业出于成本控制等方面的考虑,将更多地选择“多云”策略,把资源部署在由不同的服务商提供的云上。这样一来,如何在不同云之间分配资源部署,实现它们之间的协作和数据传递,从而达到更优的绩效、实现更低的成本,就成了一个重要的课题。FinOps通过将财务责任文化变革带入云的可变支出模型,可以帮助分布式工程和业务团队在其云架构和投资决策中的速度、成本和质量之间进行权衡。因而,在“多云”策略越来越受欢迎后,FinOps的需求也应该出现大幅的增长。从这个角度看,云服务商有理由对FinOps服务进行一定的提前布局。
三是探索私有云的搭建服务。通过推特等公司的实践可以看到,私有云已经越来越成为规模较大的企业的选择。一般认为,这对于云服务商而言,不能算是一个好消息,因为这些企业通常是最有能力的云服务购买者。但从另一个角度看,这或许又是另一个机会。毕竟,并不是所有企业都有像推特那样的数字化水平,自行搭建和维护私有云的,最后这些任务很大概率还需要外包。从这个角度看,如果云服务商可以把握住这个商机,那就可以弥补部分企业下云所带来的用户损失,从而让自己的业务保持持续的稳定。
总而言之,“下云潮”可能会对云服务商带来一定的挑战,但这并不意味着云计算行业的下坡。恰恰相反,这是一个转折点。不久的将来,云计算行业很可能迎来一个全新的时代。
本文来自微信公众号:经济观察报观察家 (ID:eeoobserver),作者:陈永伟