正确的提示信息

扫码打开虎嗅APP

从思考到创造
打开APP
搜索历史
删除
完成
全部删除
热搜词

150万企业离“数据自由”更近了一步

特别策划

2022-12-02 21:50

题图 | 视觉中国


许多企业继续在加深数字化和智能化的路上狂奔。

 

上个月,《英雄联盟》全球总决赛S12落下帷幕,据Esports Charts报道,至少有510万名观众通过直播平台同时观看了《英雄联盟》S12总决赛(甚至这一数据,还不包含国内的观众数),稳居2022 年排行榜第一。

 

作为全球最受欢迎、运营最成熟的多端游戏,《英雄联盟》2022年上半年峰值月活跃用户数一度突破2亿。庞大的用户量生成了巨量的数据,每天20个大区、玩家们每秒贡献的50万次事件,都会转化为20TB记录数据,塞到拳头游戏(英雄联盟的开发商)手里。

 

这些听起来就很多的数据,包括了使用什么英雄与皮肤、购物篮中的物品(皮肤、回城特效),为各种产品提供支持,包括配对、个性化、分析、安全、反作弊和玩家行为等,是拳头游戏运营英雄联盟的核心数据。

 

例如每次《英雄联盟》发布了新英雄与新版本之后,后端数据分析师需要重点关注游戏玩家使用新版本后的反馈,比如:游戏时长是否有变化、防御塔是否更早地被摧毁等等。这些都和游戏对局的平衡性有关,分析师们需要通过这些数据来评估新版本的体验,以及未来的优化方向。

 

但在以前,这些对游戏日常运维极端重要的数据,即便已经生成,却不能马上查询,复杂的数据提取分析过程有些时候足足要6个小时。如此慢的反应速度,显然不可能最大程度保证游戏稳定运行,以及用户优秀的游戏体验。

 

在多番考察和比较之后,拳头游戏最终选择了和亚马逊云科技达成合作,通过采用亚马逊云科技提供的服务,转变游戏设计和内容部署方式,反过来对游戏体验进行升级。

 

通过使用事件驱动的无服务器数据集成工具Amazon Glue作为元数据存储,帮助数据工程师、数据科学家来进行数据查看与检索,并且借助流数据服务Amazon MSK Serverless,拳头游戏成功地将6小时一下子缩短到5分钟,节省下来的时间和人力可以聚焦在提升实际的游戏体验之上。

 

除了整体运维的数据分析之外,拳头游戏在亚马逊云科技的帮助下,还重点解决了游戏内部的恶意聊天信息检测、提升了客服的查询效率、对每个用户评估授予个性化的奖励。

 


在前阵子的S12全球总决赛中,双方还合作构建了一整套全新的决赛数据架构,在实现稳定的画面转播的同时,还首次在如此规模的电竞转播中引入了“由亚马逊云科技提供支持的统计数据”,这些数据将在拳头游戏面向全球的电竞转播之前、期间和之后呈现,向粉丝展现决定团队能够获胜的关键数据点。

 

彻底无服务器,云化的新时代到来


作为云计算领域的开路者、探路者,亚马逊云科技一直在行业内推动着无服务器技术的创新与发展。在前天召开的亚马逊re:Invent 2022大会上,亚马逊云科技就再次集中展现了它们云端能力的更新,其中无服务器服务就是重中之重。


回归到本质上,无服务器(Serverless)架构的出现,旨在让开发人员从基础设施资源的日常管理中抽身出来,从而能够将注意力集中到业务逻辑之上,最终通过更直接的应用和业务来实现运行。




早在2014年,亚马逊云科技就推出了整个行业内首款Serverless函数计算服务Amazon Lambda。发展至今,亚马逊云科技已累计发布了超过100款新的Serverless功能,覆盖了计算、存储、网络、容器、数据库等方方面面。


丰富的无服务器产品和服务,以及数年来持续的更新优化,让亚马逊云科技在为用户提供端到端数据服务能力的同时,也标志着无服务器技术彻底迎来成熟,云计算的无服务器时代全面到来。




最好的证明来自众多用户的采纳,根据亚马逊云科技官方的统计,全球超过100万客户都在使用亚马逊云科技的Lambda服务,每个月发出的服务请求次数就超过10万亿次。


针对Lambda这样一款成熟的产品,亚马逊云科技也没有停下优化的步伐,以这次发布会上再次升级的冷启动(Cold Start)能力为例,全新的Amazon Lambda SnapStart,可将Lambda函数冷启动持续时间降低至不到200毫秒,延迟率降低90%,使得冷启动跟非冷启动(缓存命中)几乎没有区别。


这就好比你冬天的时候发动汽车发动机,燃油车往往需要几分钟来“热车”,发动机才能达到平稳工作的状态;过去亚马逊云科技已经对这个发动机做过了很多的优化调校,缩短了“热车”所需的时间,但这一次他们利用全新的思路,直接给车的燃油发动机换成了“电机和电池”,只要插上钥匙就直接能走,再次实现了自我的大幅超越。


亚马逊云科技高级副总裁Peter DeSantis在现场演讲中还特别提到:这套已经帮很多用户降低了90%以上延迟的全新服务,无需变更代码或架构,也让众多用户能够更快捷地通过Amazon Lambda的Serverless能力面对业务峰值的挑战。


亚马逊云科技此次还重点推进了数据分析服务的全面Serverless化。在别人还在埋头猛追的时候,先一步实现了全覆盖。


在过去的几年里,亚马逊云科技已经打造了一整套丰富而强大的Serverless数据库服务,用户不需要就数据库技术本身支付费用,更不用担心容量不足,整套服务会随着数据量自动缩放,并按照使用量收费。




而在本次re:Invent 2022大会上,亚马逊云科技CEO Adam Selipsky宣布了Amazon OpenSearch Service Serverless的推出,用户将不再需要管理自己的OpenSearch集群,从而更轻松地运行大规模搜索和分析工作负载。这同时也宣告了亚马逊云科技所有数据分析服务全部具备Serverless特性,目前全球云计算行业中仅此一家。

 

数据驱动,助力用户高速发展


随着企业云上的数据的类型和规模正在不断增长,数据旅程的各个阶段都需要由云原生数据基础设施来实现赋能,以提升系统的效率、可用性和可扩展性,并降低成本。


而在数据这一块,亚马逊云科技也有着清晰的发展逻辑,亚马逊云科技数据产品掌门人Swami Sivasubramanian将其概括为3点:


  1.     需要有能够应对所有未来情况的云原生数据基础设施;


2.    需要有能力将数据连接起来,打破壁垒实现数据一体化融合;


3.    需要有好的工具与措施来实现数据的普惠。


对于第一点,亚马逊云科技通过十多年来的持续创新,已经形成了一套完整的端到端数据战略方案。从云原生数据库到数据集成工具,再到云原生数据分析工具,再到深层次的机器学习,用户不仅能够充分利用自身的数据资产实现优势整合与成本效益最大化,同时还能缩短企业提取数据价值的创新周期。


关于成本效益最大化,亚马逊云科技已经提供了一系列的专门构建的数据服务,让客户可以在任意场景下获得极致性能的同时保证性价比。比如云上首款专门构建的数据库Amazon DynamoDB,首个云上数据仓库Amazon Redshift,云上首个机器学习IDE Amazon SageMaker。本次新发布的Amazon DocumentDB Elastic Clusters也是这方面的创新,它可以在几分钟内自动上行拓展存储,用户完全不用担心运维或者迁移的复杂度,直接帮助用户减少相关维护成本。




而关于缩短企业提取数据价值的创新周期,则需要打破数据孤岛,实现数据一体化融合分析,但实现起来尤其困难的有三个部分。一个是企业不同类型的数据源在融合之前,需要确保数据质量,全新升级的Amazon Glue Data Quality旨在解决数据质量管理的问题。现在挖掘数据价值的手段很多,但假如用户不注重、谨慎处理数据质量的话,很快数据会像沼泽一样把价值淹没。过往只能投入更多的人力去提升管理水平,管理成本也随之水涨船高。




Amazon Glue Data Quality则能将这些手动的数据质量工作从几天缩短到几小时。它可以自动计算统计数据、推荐质量规则、监控并在检测到质量下降时向用户发出警报。并且能够在数据影响业务之前,操作极简地识别丢失、陈旧或不良数据。


第二,为了数据融合分析,就不得不把大量的资源投入到数据的整合工作,比较典型的就是ETL工作,来实现数据的集中分析,亚马逊云科技此次则提出了Zero ETL的理念,尤其是重磅产品Amazon Aurora zero-ETL to Amazon Redshift,允许企业将PB级事务数据上使用Amazon Redshift实现近乎实时的分析和机器学习,而不必构建和维护复杂的数据管道来执行提取、转换和加载(ETL)操作。这将使得企业可以节省大量的不必要的冗余投入,专注于数据分析本身。


不仅如此,亚马逊云科技各种数据集、数据库、数据湖中的信息,都能够通过Zero ETL工具快速流动,进而用不同的工具挖取数据其中的价值。原本用来管理复杂数据的时间,就能够用来拓展数据价值的潜力,并且最终转化为企业实际的业务策略更新。同时,对于一些第三方数据,亚马逊云科技数据服务已经可以连接超过100种外部数据源,像Adobe,Salesforce等各类SaaS应用,让企业可以能更全面地利用所有数据的力量。



另外一个难点就是企业跨部门的数据共享和数据治理。一个好的数据治理可以促进数据的共享,然而过去企业往往缺乏一个有效管理数据在企业内部共享的工具。亚马逊云科技此次推出的Amazon DataZone服务,重点就在于解决跨组织边界的大规模共享、搜索和发现数据。这一全新的数据分析门户,不仅可以帮助企业利用数据生成个性化视图,同时执行治理和合规的相关策略,并随之视情况开放给企业中的任一成员查看。




企业内部数据应用的工作流程随之得到了优化:跨团队可以无缝协作,并以自助服务方式访问数据和分析工具,大幅提高效率;整个过程中使用基于Web的应用程序实现数据个性化视图,轻量化且快捷;企业管理者还能够根据相应的法规以及公司内部的规章,一站式管理数据和各种访问权限。


企业内广泛的数据孤岛现象进一步打破,让数据的价值能够被真正发掘、生产出来。


今天,全世界有超过150万家公司来亚马逊云科技寻求数据服务上的帮助,包括数据库、数据分析和机器学习服务。像Toyota(丰田)、Coca-Cola(可口可乐)、Capital One等等,这些知名公司都在采用亚马逊云科技的服务来建立完整的数据战略。比如,知名生物医药公司Bristol Myers Squibb通过亚马逊云科技的数据服务,把单细胞数据应用在他们的诊断和开发里面。此外,Hyundai(现代)也在采用亚马逊云科技的数据分析他们的机器学习模型,极大地降低了他们的机器学习时间。

 

写在最后


作为全球云计算的先行者和开拓者,亚马逊云科技再次兑现了大家对于re:Invent大会,这个云计算行业“春晚”的期待。多年来在云计算赛道中的持续发展,才是如今其能够实现多种云应用和服务“全Serverless”、数据一体化融合对分析与价值萃取能力的提升。这些完全基于行业发展需要、企业业务拓展需要的能力,是客户最终选择亚马逊云科技的关键。


很显然,在现实世界之外、由比特组成的虚拟世界之中,亚马逊云科技这个龙头还在引领着整个行业发展前进。凭借其所构筑的数字能力,数量庞大的企业减轻了身上的负担,以更灵活的姿态继续前行。可以预见,亚马逊云科技的前行和超越,远没有到终点。

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
打开虎嗅APP,查看全文
频道:

大 家 都 在 看

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: