正确的提示信息

扫码打开虎嗅APP

从思考到创造
打开APP
搜索历史
删除
完成
全部删除
热搜词
2021-07-02 15:40
97年的麻省理工辍学青年,五年成就73亿美元独角兽

从团队到业务,Scale拥有一切硅谷宠儿的标签:AI、API、YC、野心勃勃、年轻、才华横溢、大学辍学创业、行业洞察。本文来自微信公众号:硅兔赛跑(ID:sv_race),作者:江江,编辑:蔓蔓周,题图来自:视觉中国


这几年,硅谷有一家 SaaS 公司的表现非常亮眼,光看下图的增长曲线,剔去我们熟悉的Slack、shopify、twillio,谁最横?


图片来源:CapIQ


无疑是那条陡峭的橙色曲线——Scale。从0到估值73亿美元只用了五年,ARR从0到1亿美元只用了四年,Scale几乎是SaaS公司里最快达到这些数字的。


一、脏活累活起家,Scale是无名之辈吗?


Scale所在行业无疑是当下最光鲜亮丽的行业:人工智能(AI)和机器学习(ML)。想到人工智能,我们脑子里可能都是科幻电影中那些能够与人争天下的机器人,但事实上,这个景象还离我们很遥远,离身处于这个行业的Scale更是遥远。


Scale最初做的是这个行业最不性感、最接地气、最能被称为脏活累活的事情,即数据标注。


所谓数据标注,就是企业客户,比如自动驾驶汽车公司,给Scale一些图片、视频等等,Scale找一群人,给这些图片和视频打上标签的过程。


这里的打标签,不是我们理解的命名那么简单。举个例子,Toyata和Lyft给Scale发送一张马路上的图片,如下图,Scale就得找人把这些汽车圈出来,并且标注为“汽车”。


图源:Scale Pandaset


这个过程其实大家都很熟悉,我们经常在登陆验证的时候被要求指出某些物体,比如下图要求指出所有带有船的图片,即标注这些图片:



你也许不会相信这世界上最性感而又高端的行业里,有如此无趣的一环, 而这才是开头那个具有靓丽增长曲线的Scale起家的业务。


Scale由Alexandr Wang和联合创始人Lucy Guo创立于2016年的YC,当时这个公司还叫做Scale API,只是一家有API的“土耳其机器人”。


这里的“土耳其机器人”,指的是亚马逊的一个众包平台——研究人员在网站上发布琐碎任务,比如给图像加标签、进行调查、抄录收据等,用户领取任务,在完成后能赚取少量现金。这听起来是个人力驱动的公司,需要大量来自发展中国家的外包团队,依靠经济发展的不平等获利。


但目的比手段重要。


二、尘埃里的资本宠儿


Scale的创始人Alexandr Wang出生于1997年,父母都是Los Alamos National Lab的物理学家。他的名字从Alexander去掉了一个e,因为父母想让他的名字刚好有8个字母,8在中国代表着好运。他本身非常优秀,大学被麻省理工录取,大一满绩,之后辍学。辍学之后,他先去了Addepar和Quora工作,也在Hudson River Trading也工作过一小段时间。


2016年,他和另一名来自卡内基梅隆大学的辍学生Lucy Guo认识了,跟一名同事组队,一起进入了YC2016春季营,其实当时的他也不清楚自己创业具体要做什么,只是对市场痛点有一定的洞察。


他曾描述道:“尽管麻省理工有数百名才华横溢、天资过人的学生,但是没有人用AI成功地构建任何东西。我们都在研究人工智能,却都遇到了一大瓶颈——没有好的数据。尽管如此,市面上也没有可以解决这个问题的标准化工具,我们有AWS、Strip 和 Twillio,却没有任何人系统性地解决数据问题,这导致AI和ML的发展止步不前。”


具体来说,他每天打开冰箱的时候,都会想在冰箱里安装一个摄像头,摄像头会告诉他什么时候需要补充哪些杂货,这听起来并不难,但他根本做不到,因为没有适用的数据工具。


因此,他们决定做Scale。


Alexandr确实精准地击中了市场痛点,因此Scale发展地顺风顺水:


2016年6月,Scale正式成立,YC投资了12万美元换取公司7%的股份。


2017年7月,Accel领投450万美元A轮。


2018年,完成1800万美元B轮,同年,Scale进军自动驾驶领域,并且拿下了许多行业内赫赫有名的客户,比如GM、Cruise、Lyft、Zoox和nuTonomy,标注的数据超过20万英里。


2019年8月,完成Founders Fund的Peter Thiel领投的1亿美元C轮,跟投包括Accel、Coatue Management、Index Venture、Spark Capital、Thrive Capital、Instagram的创始人Kevin Systrom和Quora的CEO Adam d’Angelo。此时的Scale正式迈入独角兽行列,估值十亿美元。同年,Scale宣布扩展行业领域,拿下了OpenAI和Lyft这种其他行业的头部用户。


2021年1月,以35亿美元估值完成老虎基金领投的1.5亿美元D轮融资,同时宣布进军标注之外的新业务,发布Nucleus。


2021年4月,以超过70亿美元估值完成来自Greenoaks Capital,Dragoneer和Tiger Global的3.25亿美元E轮融资


至此,可以说,Scale是个彻头彻尾的资本宠儿。


从团队到业务,它拥有一切硅谷宠儿的标签:AI、API、YC、野心勃勃、年轻、才华横溢、大学辍学创业、行业洞察。


Scale一扫早期的包工头形象,俨然已经是一家性感的AI/ML公司。而相比其他AI/ML公司,它又不受“红颜薄命”的诅咒,就连知名的硅谷投资人Peter Thiel都说:“在激烈的竞争中,AI公司们会出现又消失,但是Scale会一直存在。”


那么这样的转变原因是什么呢?


Peter Thiel一语中的:“因为Scale提供的是整个AI/ML行业的基础设施,数据是这个行业最重要的东西。”


AI/ML的基础是数据,所谓的机器学习就是机器输入并学习数据,从而输出正确的编码。没有数据也就不会有ML或者AI,并且,不好的数据比没有数据更加糟糕。学习一堆垃圾只会导致机器产出另一堆垃圾。


可以说,数据标注是个普适性的需求,只要一个公司存在,它就有数据标注的需求。


这个领域的领头人Andrew Ng曾发推说:“AI系统=代码+数据”,大多数的学术型竞争对手都不会去碰数据,而是在代码上埋头苦干,但试想一下,如果有一个team可以不动代码,光在数据上下功夫。”而这刚好就是Scale在做的事情。



既然数据如此重要,为何没有更有实力的巨头躬身下场,拿下这块香饽饽?


前文也提到,数据标注是份脏活累活,受过良好教育的精英们宁可在代码堆里狂卷也不愿意碰数据标注。巨头不太可能在这个领域费心,他们的员工都太优秀了,不太可能把时间浪费在注释上。这一点刚巧给到了早期的Scale足够大的成长空间。


三、始于数据标注,不止于数据标注


当然,如果一直沉迷于数据标注,Scale无疑只是一家利用发展中国家便宜人力牟利的外包公司,何谈科技?


其实不然,尽管Scale的商业模型最初看起来更像是服务业,通过人工支撑起业务,但是随着它自身数据的积累和模型的成熟,有些标注工作正在被机器取代。


相比于最初的纯人力驱动,现在Scale能让算法和人工配合着去做数据标注。算法会先把视频切成一帧一帧,并且粗略标注这些图片,在这之后,人工会接过来做更精细的标注。由此,Scale在服务价格降低的同时,利润率也在升高。


同时,Scale在战略上颇有远见,他们从很早就计划着从数据标注起家慢慢开发出一整套产品,让这些产品协同作用,以更快的速度创建更好的模型和更好的结果。


Alexandr Wang 认为,数据是ML和AI领域的基础设施,因此数据标注只是个开始。Scale 的存在就为了通过建造最以数据为中心的基础设施平台来加速AI应用的开发,它的核心信念是,数据就是新一代的代码。Scale想做AI领域的AWS,支付领域的Stripe,数据分析领域的Snowflake。


图源:NotBoring.co


2020年1月,在完成D轮融资之后,Scale宣布除了标注之外的新业务Nucleus。Nucleus是一个用于数据调试的SaaS工具,具体包括解读数据、数据可视化、清洗数据和数据合作,从而帮助公司们建立更好的ML模型。


图源:Scale


Nucleus的推出使Scale开始得到一些长尾客户,并且拓展到更多行业。同年5月,Scale发布文档产品Scale Document


Scale在完成了前五年数据标注积淀之后,一步一步把触角伸向整个AI的生命周期,毕竟,数据标签和数据生成只占整个AI/ML基础设施图谱中的1/20。按照Scale的划分(如下图),AI的生命周期包括标注、管理、自动化、评估、搜集、产生数据,这其中的每一步,Scale都要漂亮地拿下。


AI的生命周期,图源:Scale


在E轮融资过后,Scale正式宣布其新的愿景:“让每个行业都能实现AI的应用。Scale为公司提供管理AI整个生命周期的基础,无论他们是否有自己的AI团队,我们都会帮助他们建立AI策略,保证他们能够拥有产出高效模型基础设施。”


这是一副极其宏伟的蓝图,回忆一下互联网如何从一个小圈子扩展到如今万物互联,我们就可以想象,Scale的野心有多么大。


AI/ML基础设施市场将在未来几年内达到3000亿美元。到2024年,预计Scale数据标注业务的潜在市场份额能达到200亿美元,光是Document和Nucleus的潜在市场份额就可以达到100亿美元和80亿美元。


除了战略远见之外,Scale的内功也够硬。


和Stripe一样,Scale很受程序员们的喜爱,因为它把细节做得很好。“API非常好,有开源数据集、文档很干净。”一名程序员评价道。


许多大客户用Scale也不单单是因为不想干数据标注的活儿,而是因为Scale的人才密度更高,Scale的推特有一半都是在欣喜若狂地宣布从哪儿挖了大牛,或者是组织了什么集聚大牛的行业盛会。


图源:Twitter


Scale的CTO就是创始人从亚马逊挖过来的AI专家,而战略负责人则是前美国国家首席技术官。


图源:Twitter


财务SaaS公司Brex也是Scale的客户,而在问及为什么Brex不直接自己雇佣一个AI团队时,其CEO Dubugras说:“他们拥有许多AI市场上最优秀的人才,而我不能只是打个响指就雇好一个优秀的团队。AI工程师们也希望可以在解决领域内最难的问题的公司工作,Scale就是其中之一。”


回望Scale短短的五年,它的故事像极了灰姑娘,看似毫不起眼,却一路逆袭,骨子里是对商业极度敏锐的纯正血液。


我们期待着AI/ML领域下一个AWS、Twillio、Stripe或是Snowflake的诞生。


参考资料:

1.Scale AI hits $3.5B valuation as it turns the AI boom into a venture bonanza. (Techcrunch)

2.This Founder Dropped Out of MIT to Help Accelerate the Development of AI Technology. (Inc)

3.Data-labeling company Scale AI valued at $7.3 billion with new funding. (Fortune)

4.How The 22-Year-Old Founder Of Scale AI Built A Billion-Dollar Business. (Forbes)

5.Scale: Rational in the Fullness of Time. (notboring)


本文来自微信公众号:硅兔赛跑(ID:sv_race),作者:江江

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
打开虎嗅APP,查看全文

支持一下

赞赏

0人已赞赏

大 家 都 在 看

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: