正确的提示信息

扫码打开虎嗅APP

从思考到创造
打开APP
搜索历史
删除
完成
全部删除
热搜词
2020-09-14 10:37
乌兰察布,一座被大数据包围的“寂寞”之城

本文来自微信公众号:全现在(ID:quanxianzaiAPP),作者:马程,题图来自:视觉中国


内蒙古乌兰察布市政府所在地——集宁新区的最东部,方圆三公里内,华为、阿里、苹果、快手一系列顶尖公司的大数据中心(IDC)招牌,出现在这个小城的边沿处。每一条路上都有浓郁的绿化带,松树、草坪、盆景交织在一起,路口处,花草拼出硕大的英文字样——Big Data。


街道上却空无一人,只有洒水车偶尔驶过,吊车、挖掘机在工作,数辆货车停在路边,装满了大型散热器,那是正在建设中的阿里巴巴园区。


位于乌兰察布的阿里巴巴大数据中心。图/全现在


这个大数据中心的目标是,到2020年,总服务器承载能力突破200万台,而2019年国内IDC的总体装机规模为995万台。


这座力图支撑大型科技公司数据存储的数据之城,与15公里外的乌兰察布人口最为密集的集宁老城,虽相隔不远,但却仿佛活在两个世界中。集宁老城区,20多年都没啥变化,建筑老旧,道路拥挤,一到晚上,广场上都是人。


每个工作日下午5点,出租车司机李同会空车穿越大半个城市,赶到大数据中心门口。6点左右,员工们陆续出现在门口,搭出租车回租住的公寓或者酒店,7、8公里的路程,20元车费起步,算是一笔大单,象北京中关村、望京的蹲守网约车司机一样,当地的出租车司机都熟知这个行情。近期,苹果等园区进入测试阶段,各地赶来的员工也多了起来。


沿着阿里大数据中心门外的道路一直向东,3公里后就走出了集宁市区,进入广阔的草原和乡镇,路边,立着大型的广告牌——草原云谷欢迎你。


“云”在这里不再是头顶的一片天。随着5G时代的开启,巨量数据让许多地方的政府了解了“云”的别意,而云计算的基础设施就是大规模、绿色高效的数据中心。


大数据中心远景。图/全现在


独特的气候、地理和能源优势,让乌兰察布成为科技公司争抢的标的。2017年至今,在距离北京300多公里、车程几小时的乌兰察布建一个大数据中心,已经在诸多科技公司的规划当中。


为了发挥大数据中心带来的集聚效应,乌兰察布政府还成立了大数据局,搭建创业基地,虽然很多公司目前只是发展劳动力密集的外包业务,比如呼叫中心、大数据、人工智能的数据标注等。不过,大数据行业内已经有了“南贵北乌”的说法,贵阳率先跑出了大数据之城的产业集聚效应,也因为廉价劳动力产业受到质疑。


乌兰察布延续了贵阳的路。


上班时间,上百人的写字楼里回响着此起彼伏的接线声,这些工作看起来是在科技和人工智能产业链上,却依然是月薪3000出头的体力活。在当地一些人看来,甚至算不上一份“正经”工作。据了解 ,数据中心员工90%左右为外派,这意味着对于大多数乌兰察布市的居民来说,大数据中心还是一个新闻里的名词,和他们的日常生活并无关系。


集宁老城的一角 图/全现在


乌兰察布,一个只有200万人口的内蒙古东部小城,曾经的标签是农牧区、大风和穷。贫穷带来的偷盗、欺骗事件,让“乌盟”一度成为一个贬义词,在内蒙、山西各地深受歧视。


2003年,乌兰察布的GDP仅为133亿元。到2019年,乌兰察布在内蒙古12个地级市中,GDP排名第8位,比2018年上升一位。因此,这个小城有着强烈的愿望,想甩掉过去的头衔。它把希望寄托于科技的碰撞中,获得“弯道超车”的机会。


2003年至2016年乌兰察布GDP走势 图/聚汇数据


但这个过程绝不简单。“大数据中心”带来的连锁响应,有待证实。


一、“天赐”的大数据中心


2013年,被称为中国的“大数据元年”。这一年,华为经过多次考察,决定在乌兰察布建设北方云数据中心。


“大数据中心的选址,一定是企业和政府双方的意愿,首先,这个地方必须满足基本的地理气候因素,同时,政府的重视和土地、用电等各方面的优惠,也是无法忽视的。”一家国企的管理人员屠飞飞说,他曾参与过多个全球大数据中心选址项目。


大数据中心选址的要求极为复杂。需要满足气候、 土地租金、交通、能源等多重条件。而乌兰察布是少数满足全部需求的城市之一。


首先,散热能力是决定大数据中心能量效率的重点。国际的评价标准是PUE( Power Usage Effectiveness),它是数据中心消耗的所有能源与IT负载消耗的能源的比值。其中,数据中心总能耗包括IT设备能耗和制冷、配电等系统的能耗。比值越接近1,表明非IT设备耗能越少,能效水平越好。


乌兰察布华为云数据中心 图/全现在


包括谷歌、微软等公司的数据中心PUE在1.8上下,而在乌兰察布,PUE可以全年保持在1.26以下,能够让数据中心效率发挥到极致。


这源于乌兰察布位于云计算产业发展的“黄金纬度”,当地全年平均气温只有4.3℃。尤其夏天凉爽,春秋多风。为了降低PUE,微软需要在水下建数据中心,而贵州等地也使用水冷散热、或者利用洞穴等环境,乌兰察布却可以实现全风冷散热,相比在贵州等地的水冷散热,对水源和技术难度的要求更低。


同时,乌兰察布的土地和能源都具备很强的优势。小城地广人稀,城市之外有大片草原可供开发,且地处蒙西电网范围,电价比周边都要低廉,风电和光伏等绿色清洁能源也可以在这里实现。


“绿色高效的能源,是大数据中心长久发展的重点。”阿里巴巴集团AIS研发事业部负责人高山渊说,乌兰察布可以实现全绿色化的供电和制冷。


交通便利,也是乌兰察布的特殊优势。与更多坐落在西部的数据中心先对比,乌兰察布在北京“大六环”的3小时生活圈内。最近,快手宣布,将在乌兰察布建立第一所大数据中心,距离快手在北京“上地”的总部,只有300多公里,驾车约3个半小时。


华为乌兰察布的运维业务负责人张燕平,从2016年开始在大数据中心工作,是第一批进入乌兰察布的工作人员。他在距离乌兰察布只有200公里开外的呼和浩特长大,在北京读大学。直到接到派驻任务,才第一次来到乌兰察布。


“印象中,这里是农牧业为主,没有太多工业项目,比起临近的呼和浩特、鄂尔多斯,人口更稀少。“虽然张燕平并不清楚华为当时选择乌兰察布的原因,但他赞同,乌兰察布是一个优质的大数据中心。他的同事中有人来自南方,刚来时,对这里的气候很诧异,即使在夏天,早晚出门都要穿上长袖,最高气温不过18度。冬春却没有特别的寒冷,只是天气干燥、风大, “设备的天然冷却效果非常好。”


工作的几年中,张燕平体会到乌兰察布对大数据中心的热情,专门的大数据管理局几乎每隔一段时间都会有团队到中心考察。在当地报纸、电视台中,大数据的代名词开始频频出现。


二、弯道超车,乌兰察布的野心和局限


整个乌兰察布市,都在围绕打造“大数据之城”的概念快速地变化着。


2017年后,乌兰察布市政府和集宁区政府,逐渐从老城向东部扩张,迁至据大数据中心8公里左右的集宁新区。新城区的建设速度很快,房地产开发商进入,周围的住宅区逐渐落成,万达、居然之家等商业中心交付开业;新区政府附近,一众招商引资项目逐渐落地,出现了10多个写字楼。远远望去,仿佛一个二线城市的市中心。


2018年,乌兰察布市委书记杜学军表示,乌兰察布要在发展中实现“弯道超车”,就需要依托云计算、大数据企业,形成“南贵北乌”的产业格局。“草原云谷”,由此成为这座城市对外形象的一个新标签。


草原云谷 图/全现在


2016年,张燕平回到呼和浩特定居,开始适应在家和乌兰察布来回通勤的日子。最初,华为大数据中心的周围全部是荒地。只有华为一家,最近3年,越来越多的大数据中心渐次落成。


“开始我住在老城区,来园区要10多公里,走到一半就已经见不到人,绿化没建好,风一吹尘土飞扬。”张燕平回忆,“现在园区附近有住宅区了,人气也旺了些。”


每到周末,张燕平回呼市,与家人团聚。“动车单程2个小时,去年开通了高铁,只要50分钟。开车大约2个半小时。”


路途的便利不只是政府的一头热,华为等公司也参与了道路、供电系统等基础设施的建设和升级。2019年底,京张(呼)高铁开通,从北京清河高铁站出发。1小时45分钟就可以到达乌兰察布高铁站,再驾车20分钟即可到达园区。直通北京的144芯点对点光缆,光缆端对端传输时延在5毫秒以内,是一条“信息高速公路”


自然禀赋优渥的乌兰察布,想要搭建更宏大的大数据产业链,却并不容易。在大数据产业链上,最核心的部分在于大数据开发与分析,包括数据抽取,预处理,大数据架构的搭建,数据库运维,数据展示,数据接口、数据安全、数据可视化等工作。


“理想的情况下,大数据相关的公司和人员应该与数据中心在一起,工作沟通更加方便,也会在当地形成集聚效应。” 屠飞飞认为。


大数据中心机房 图/全现在


但事实是,国内数据中心和大数据相关公司的工作都是分开来。“数据中心选址本身,会侧重在电力、土地,不太考虑机器上跑的内容。”他说,更高端的研发技术等工作,大公司们往往会借助发达的网络基础设施,在发达城市的办公室通过云端调用等方式解决。


“这在成本和效率上可以达到一个最优,但数据中心本身就不会做开发,甚至连应用也不需要做。”


理想与实现的矛盾点在于,要实现产业集聚,乌兰察布首先要获得人才和技术支持,但现实中乌兰察布,几乎没有科技和互联网基因。市内只有2所二本高校,一所师范,一所医学院,加上一所专科技校,都与大数据、互联网没有太大关系。


2017年, 乌兰察布市在集宁师范学院中建立了草原云谷大数据学院,开设大数据理论、应用及实践课程,想利用企业和高校联合办学模式、培养大数据人才。对于以师范学生为主的集宁师范,这个学院的存在感并不强。近两年,相关信息变成了“服务外包呼叫中心储备人才职业技能培训班”。


无法在当地培养人才,引进也困难重重,乌兰察布市设想中带动上下游的集聚效应,还是一个遥远的目标。


三、“大数据之城”的中间态:廉价劳动力


在距离大数据中心7公里处,集宁区政府周边有多个楼群,大多在最近5年内建成,这是集宁区为了配合大数据中心战略引进的“科技企业”。


工作日,这里几乎没有人在户外走动。随意走进一座大厦,可以听到密集的电话节点声,或者是快速的点击鼠标声音。“消除后进面,月进4000元”“我们是脊梁,苦战30天拿下最高业绩”等等标语,张贴在各个工区。


外包服务基地园区外景 图/全现在


在宣传板上,可以看到这里被命名为“大数据外包服务基地”,包括大型数据标注、通信公司的内蒙古分部等。最初入驻的公司主要是华唐、中信鸿联九五、博岳通信、中服英才等10多家服务外包企业。


据当地媒体报道,2020年这里的总坐席将达到3万席。虽然冠上了“大数据”的标签,但大多数工作是传统的呼叫中心。


附近的创业基地里,虽然有百度等互联网公司等的背书,入驻率不到一半,大多数是新媒体公司、咨询、财务、人才服务等公司,大量的工位空置工位,在58的招聘版块里,开放的职位主要也是接线员、数据标注师等。


华唐大厦内有一家高档的咖啡厅,白天门庭冷落。“在这里开咖啡厅,是以为新区办公楼会吸引到很多创业团队和白领,但是楼上办公的人,平时根本不会来。”老板说。


2018年底,高楼上还有大数据行业的研发项目,聘请了专家团队,不时有人在咖啡厅的包间里讨论项目。但一年后,很多研发项目中止了,大厦只剩下接线员等相关岗位。


现在这家咖啡馆主打商业聚餐、儿童生日派对等,只有周末和晚上忙碌。


周四下午5点,王迟完成了一天的工作,提前走出大厦,他盯着空旷的篮球场,歇了歇眼睛,准备在高峰期之前开车回到老城的家。


这是他在AI数据标注公司“梧桐木咨询”乌兰察布中心的倒数第二个工作日。


王迟刚刚从山西一所二本学校毕业,专业是通信工程。考研失败,又受到疫情影响,他从过年后就没有离开乌兰察布的家,也错过了很多求职机会。原本打算去北京或是呼和浩特找一个互联网公司的工作,但是爸妈坚持他留在家中。


“我的高中同学,基本都考公务员或者去了银行、医院、学校,我不想做,也没有参加考试。”王迟说。


疫情期间,他决定先来这家AI数据标注公司实习,按照正式员工的薪水和提成,一个月收入在2000~3000元,不交五险一金,实习生表现出色,毕业后就可以转正。


大厦内部 图/全现在


任何复杂的人工智能研究,都需要标注的数据作为基础。这是一个既需要背靠技术,又可以简单到只需点击鼠标就完成的产业链。王迟的工作不复杂,通过贴标签、做记号、标颜色、划重点,标注出数据的不同点、相似点或类别,这是为了给机器提供训练和学习资料。


他标注过一个小镇的道路布局,对其中的车辆、摩托车、自行车和行人打上边框,并标注行进方向和是否有遮挡,用来区分具体路况;他还标注过不同建筑物的边缘分割,用于自动驾驶中车辆对环境的认知;他还标注过山河湖泊,为每一个地区标注打点。


第一个月,王迟感到新奇,每天会提前半个小时到办公楼,看看前一天工作的检查员做出的反馈,总结一些标注过程存在的错误。每天的总工作量在30幅左右,多出的部分可以按照件数给予提成。


数据标注,有不同的精度,熟练者平均一天可以标注 40 张图片,前提是只需要为图片中的物体打框、标注类别和前后关系;但涉及到刻画建筑物边缘等复杂细节,忙活半天也到不了10张。


王迟最初认为,他的工作是精确标注高精地图,而高精地图是无人驾驶技术的基础,属于人工智能的范畴,但他很快感受到其实这是一个不太用动脑筋的“体力活”。


他的电脑前常备眼药水,一两个小时后就要点一次,否则眼睛干涩难忍。同事里除了学生,还有外地小镇的专科毕业生等,大多数人在来之前对数据标注没有概念。


工作时间,每个小组有组长在不停地走来走去,观察进度。尽管每个人的工作区域不算小,王迟还是感到不舒服。王迟没有接触过技术骨干,只听过组长当着所有人的面,骂一个员工标注质量不达标,员工不服气,第二天就辞职了。


王迟的父母很不满意他的这份工作,他们区分不出同一个大楼里的接线员或者是数据标注员。在普通乌兰察布市民眼里,这一群年轻人每个月拿着3000多块钱的工资,每天挤公交车穿过老区去新城上班,打打电话或者动动鼠标,称不上什么值得羡慕的工作。甚至不客气地说,和工厂的工作没有太大区别。


“哪里有公务员、老师稳定,多加班也赚不了多少钱。”出租车司机李同说。“我在东胜工厂里打工的朋友,虽然辛苦点,但是每个月还能赚小万元。”


位于集宁新区的创业园 图/全现在


在另一个大数据中心—贵阳,当地面对着同样的问题。虽然贵阳陆续搭建了很多数据标外包产业园,但2018年贵州省平均工资5200元,数据标注师仅为4200元。职校招的实习生甚至只有2000元。《极客公园》等媒体的报道中,把这些技师直接比作了富士康工人。


全国各地都在建立的”大数据产业园”中,很多都是以外包业务为主。在山东、山西等地,一些数据公司招收在校学生,每天50元,有些地方培养服务业的大叔大妈做数据标记,完全不需要对人工智能等技术有了解。


2013年,华为最初在乌兰察布建设数据中心时,发布了宏大的愿景——打造“智慧乌兰察布”,发展电子商务、物联网、电子政务、精准医疗、教育培训、智慧社区服务等云产业,助推乌兰察布的数字经济建设。2019,华为又提出共同打造华为北方数据中心,为了缩短建设的周期,华为采取了工厂预制化生产的模块化数据中心解决方案。


不过,对于现在的乌兰察布来说,“智慧化”还只停留在纸上。


四、乌兰察布与科技的距离


大数据中心15公里之外的集宁老城区,20多年容貌依旧,拥堵又热闹。


张燕平偶尔会和同事到市中心最大的商业区——维多利广场吃一顿必胜客,晚上遛弯经过公园广场,听一听当地流行的二人台。


“集宁旧城很有人情味,不论什么时候到广场,总有热闹的二人台可以听,夏天会有剧团搭起台子演,还有爱好者一边唱一边直播。”张燕平对无处不在的二人台印象深刻。疫情刚过去,老城区的广场外又挤满了人。


集宁老城的广场上的二人台表演 图/全现在


王迟在集宁旧城里长大,他的父母都是老师,年少时他的活动范围不过人民医院附近的几个街区,再多走一个街道,就会进入草原。在外地上大学,他从来都说自己是“集宁人”,因为“乌盟在外面名声很不好”。


这是穷困地区很难摆脱的名声,乌盟人在外地,小偷小摸的人多了,附近都流传着一些说法,比如“三个河南人闹不过一个乌盟人”等等。


他在太原上学时,很多上年纪的人提到“乌盟”会表露出厌恶。王迟印象最深的是2018年,大二时,“鸿茅药酒跨省抓捕”事件曝光,突然间身边同学都追着他问凉城县的情况,问他们家是否都喝鸿茅药酒,他不知道怎么回答。


“这些年,乌兰察布的声誉改善了很多。”王迟认为。


集宁新区的美食街 图/全现在


大数据中心的名声在外,吸引了周边城市的年轻人来就业,即使呼叫中心的工作没有太多晋升的空间,他们还是能在这个城市安定下来。然而,对于像他这样在集宁的大学生来说,就业是一个难题。


集宁周边没有工业,没有大工厂,也没有大型的互联网企业。“同学里很多人初中读完会去外地打工,去呼市或者东胜。那里有厂子。在北上广读大学的人,基本都留下了,不会回来。”王迟说。


王迟并不满足于每个月3000多元的数据标注工作。他喜欢编程算法,希望能做一名工程师。但是,即使在大学里,王迟也没有接触过大数据、人工智能等学科,“离我们很远。我相信这是大势所趋。即使我必须要离开家乡,一个人闯荡。”


6月底,王迟拿到了毕业证书,他辞了职。“准备利用这个时间,一边好好精进下编程技术,一边投简历,主要看看北京和呼市的工作机会。”


由于“天赐”的自然、人文条件,乌兰察布被发掘成为大数据中心,但当地期待的科技集聚效应远未形成。如何摆脱“人工智能版富士康”,成长为人才密集型真正的大数据中心,是乌兰察布以及更多大数据中心需要面对的问题。


但在这之前,当科技公司争抢着进入大数据之城的门票时,乌兰察布人王迟已决定先离开。


本文来自微信公众号:全现在(ID:quanxianzaiAPP),作者:马程

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
打开虎嗅APP,查看全文

支持一下

赞赏

0人已赞赏

大 家 都 在 看

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: