扫码打开虎嗅APP
本文来自微信公众号:爆米花独角兽,作者:VC Popcorn,原文标题:《原创研究 | AI创业:团队决定命运?》,头图来自:《赌神》剧照
本文是《AI算法分析94家海外AI独角兽》的姊妹篇,前文我们详细分析了94家独角兽企业的细分赛道,本篇将聚焦于团队分析,旨在为创业者和投资人提供指南,帮助找到可靠的对标基准(benchmark)。
VC通常会关注公司或产品的对标(benchmark),因为对标的高度通常决定了项目的潜力。然而,除了赛道分析之外,团队的对标和标准参考同样重要,但这一方面却往往被忽视。本篇将借助机器学习模型的分析方法,对独角兽团队进行系统化的分析,从而提供一个更加全面的团队参考标准。
如果你是经济学或管理学的博士生,推荐阅读推理过程,它可以成为一个学术课题素材;如果你是时间有限的投资人和创业者,可以直接跳到文末查看结论和深度吐槽。大家也可以对VC或者创业分别祛魅一下。
一、团队Team
我们把94家独角兽企业的团队打了6类标签,然后又把6类标签合并为2个分类,分为CEO brand 和 Team grade两个部分,互相关联:
CEO brand指的是这个创业者最鲜为人知,或者对VC而言最能代表他的品牌标签;如果有一个CEO有多个品牌标签,我们会选择最突出,或者代表他最高成就的品牌标签,例如Sam altman有很多标签,在AI领域,我们把他叫做明星创业者,即Star。李飞飞既是大学教授,又是谷歌云AI首席科学家,我们则定义他为大厂C(科技大厂C level)。
Team grade则是看这一个创业公司创业时期的团队组成,我们为每一个创业团队的成员都打了标签(后面加入的高管排除在外),每一个标签赋予了不同的分数权重,然后对每一个创业公司进行了打分。分数越低,代表团队级别越高,1分为最高级别。换句话说,CEO brand是个人标签,team grade则是集体标签。
CEO brand介绍
每一个企业只有一个CEO brand标签,一共14种标签:
Star(明星):这一类别的CEO通常是知名或杰出人物,往往在媒体上有显著的曝光率或公众认可度。他们在科技或商业领域可能具有类似明星的地位。
例如Sam Altman,一系列Transformer作者和Open AI的coufounder等。
所对应企业:Anthropic, OpenAI, Cohere, Tenstorrent, Adept, Covariant, Character.AI。
big tech C(大科技公司C级高管):指那些曾在大型科技公司(如谷歌、微软或亚马逊)担任C级高管,例如CEO、CTO、COO。他们从顶级科技公司带来了广泛的领导经验。
例如,Chris Walker在创办Untether AI之前,曾在英特尔担任企业副总裁和总经理;Amit Bendov在创立Gong.io之前,曾在Sisense担任CEO等。
所对应企业:Inflection AI, SandboxAQ, Typeface, Gong.io, Xai, Untether AI, SiliconBox, Xaira Therapeutics, World Labs。
Unicorn Cofounder(独角兽公司联合创始人):包括那些曾共同创立过独角兽公司(估值达到10亿美元或以上)的创始人。他们在将企业发展到显著估值方面有着丰富的经验。
例如,AI21 Labs的创始人Amnon Shashua 是Mobileye的总裁兼首席执行官;Arvind Jain,在创立Glean之前,联合创立了云数据管理公司Rubrik(RBRK),当前市值56亿美元。这些创业者都极其成功,而且也不是仅仅沾边的10亿美元独角兽founder,但是又和Google等企业体量存在巨大差距,我们定义他们为Unicorn Cofounder。
所对应企业:Lemonade, Graphcore, Stability AI, G42, Augment AI, Harness, Glean,Eightfold, Krutrim, AI21 Labs, d-Matrix, TempUSA, K Health, Quantinuum, Figure
Serial Entrepreneur(连续创业者):指那些创立过多家公司的个人,通常具有成功退出的历史。这些创业者在创办和扩展业务方面有着丰富的经验,但是他们未达到独角兽高度,但是大多也有大厂经历或者藤校经历。
所对应企业:Together AI, Midjourney, Core Scientific, Cognition AI, Builder.ai, ShieldAI, Verbit, OpenSpace.ai, Jasper.ai, Advance Intelligence Group, NotCo, AlephAlpha, Metropolis, Flock Safety, Cerebras Systems, KoBold Metals, Weight &Biases, Wiz, Glance。
Scientist(科学家):指那些拥有强大科学或研究背景的CEO,通常拥有计算机科学、生物学或物理学等领域的高级学位。他们通常是各自领域的领军人物,以技术专长而著称。
所对应企业:Mistral AI, Xanadu, Anyscale, Sakana AI, Lightmatter, Ayar Labs, MammothBiosciences, Cera, Owkin, Skild AI
Big tech Senior(大科技公司高级职位):指在大型科技公司担任高级职位的管理人员,虽然可能没有担任C级角色,但他们通常负责管理大型团队或重要部门,具有重要的领导责任。
所对应企业:Perplexity AI, Monte Carlo, Cresta, SeekOut, SambaNova Systems, Groq,ConcertAI
Researcher(研究员):指那些在学术或企业研究领域有着丰富职业经历的CEO,他们通常都有phd学位。其实在Star,Unicorn Cofounder,Serial Entrepreneur和Scientist里也有很多研究院类型的创业者,但是我们只取了他们最突出的特点,而不是按照每一个特点都进行标签。
所对应企业:Snorkel AI, Viz, AMP Robotics。
Big tech Junior(大科技公司初中级职位):指那些曾在大型科技公司担任初级职位的人士。通常学历也是藤校,然后在大厂工作了2-3年。
所对应企业:Imbue, Relativity Space, ElevenLabs, Replit, Scale AI, Abnormal Security,Harvey
Ivy grad(常春藤盟校毕业生):指那些毕业于常春藤盟校(如哈佛、耶鲁、普林斯顿)的CEO。主要指的是刚毕业的藤校毕业生以及辍学生,他们没有其他工作经历。
所对应企业:Runway, Spring Health, EliseAI。
Grassroots(草根):指那些从基层起步的CEO,没有学历,和大厂经历的创业者。在创业初期也没有得到一线VC的支持。
所对应企业:Hugging Face, Notion, Synthesia, Vercel, Paradox,GeneDx, Shiprocket。
The Military(军人背景):指那些拥有军方背景的CEO,带有特定资源。
所对应企业:Helsing, Hailo Technologies, Salt Security。
Banker(银行家):指那些来自银行或投行行业背景的CEO。他们通常在金融、投资和资本市场方面有丰富的经验。
所对应企业:CoreWeave, Pagaya。
VC(风险投资人):指那些拥有风险投资背景的CEO,可能是前风险投资人,或者具有与风险投资公司合作的丰富经验。他们对创业公司融资和扩展的动态有深刻理解。
所对应企业:Fractal Analytics。
Serial Entrepreneur, grassroots(连续创业者、草根):这是一个混合类别,结合了“连续创业者”和“草根”的特点,指的是既没有学历,也没有大厂经历的创业者,他们曾经创办过中等级别的公司,并且成功退出;这个案例其实只有一个。
所对应企业:Bright Machines。
Figure 1:不同CEO brand的数量:
Table 1:不同CEO brand的数量:
从Figure1和Table1可以看出,AI独角兽的CEO主要集中在Serial Entrepreneur、Unicorn Cofounder;Scientist和Big tech C则为数量第二多的类别。背景最亮眼的Unicorn Cofounder;Scientist, Star和Big tech C四个加起来,就占比43%。而纯草根占比只有7%。
CEO 品牌与团队评级的关系
Figure 2:不同CEO brand的平均团队级别:
如Figure2,可以观察到不同团队分数(team grade)和CEO brand有肉眼可见的规律。似乎CEO brand越响亮,团队分数越高。于是,如下图Figure 3,我们操作了一个方差分析去判断这个规律是否真的存在,测试结果显示,p值为 2.05 * 10^{-32},小于0.05,这意味着这个规律是真的存在的,CEO的背景是影响团队整体质量或实力的重要因素,CEO品牌上限决定了创业公司初期的人才密度和高度。
Figure 3:团队级别与CEO品牌的方差分析:
CEO 品牌与融资额,估值的关系
Figure 4:CEO brand的平均估值与平均融资额:
如Figure 4所示,CEO brand的平均估值和融资额,按照规模进行排序,依然观察出每组不同,Star的融资额和估值远远高于其他类别。于是我们决定使用Tukey's HSD模型来检测一下这些差异是否在统计学上显著,结果如Figure 5表示。
Serial Entrepreneur 的融资能力显然强于Scientist和Researcher(大学教授);Unicorn Cofounder的融资能力显然强于Researcher;
除此之外,并无显著差异,也就是Star与其他类别的差异是无效的。因此我们觉得有必要再进一步研究一下Star是否真的无效;我们又用了Mann-Whitney U来检查我们的结果,如Figure 6 结果证明不同CEO brand之间无差异。我们认为是1. 样本量太少;2.因为本身就都是独角兽企业,背景差异已经被拉平。
Figure 5:Tukey's HSD on CEO brand的平均估值和融资额:
Figure 6:Mann-Whitney U on CEO brand的平均估值和融资额:
CEO 品牌与赛道/子赛道的关系
Figure II: AI Unicorn Mapping:
Figure 7:每个CEO brand项目x赛道的数量:
如Figure 15所示,我们推测CEO brand对于选择创业赛道会有一种倾向性,即不同类型的CEO会选择不同赛道;因为赛道过于宏观,我们更想知道子赛道与CEO brand之间的关系。于是我们采用标准化残差(Standardized Residuals) 去确定CEO brand和Sub-Category(子赛道)之间是否真的有显著关联。
Figure 8 :CEO brand与子赛道的标准化残差分析:
经过测试,我们发现一部分组合之间存在显著关联,如Figure 8:
Banker与Computing
Banker 和 Finance
Ivy grad 和 AIGC/Editing
Ivy grad 和 Real Estate
Researcher 和 Data management
Researcher 和 Robot
Big tech Junior 和 Devtools
Big tech Junior 和 space
VC 和 Enterprise
这些结果表明特定的CEO品牌在特定的子类别中有明显的偏好或优势,这些偏好可能与他们的职业背景、教育经历或行业经验密切相关。例如,Banker去选择fintech领域创业;Ivy grad选择了real estate和Editing 工具这样技术门槛较低的领域;Researcher则选择了数据管理软件和机器人相对有技术门槛的赛道。
二、Team Grade
团队评级与数量的关系
Table 2:团队评级 x 公司 x 团队组合:
Figure 9 :团队评级 x 公司数量。
Figure 10 :团队评级组合比例。
我们将背景相似度较大的团队级别分组后,发现级别较高的团队在数量上远超过级别低的团队。
团队评级与融资额、估值的关系
Table 3:不同团队级别基本信息图:
如Table3,我们可以直观看到不同级别的团队融资额、估值、创办时间都有一些区别;各个级别的团队主要出现在2016, 2017 和 2021年,这和资本市场环境,以及AI技术发展都有关系。
Figure 11 :Team Grade的平均融资额和平均估值:
从Table 3和Figure11数据中可以看到,Team Grade较高的团队(即分数较低的团队)通常对应更高的融资额和估值。这表明团队质量越高,获得的融资额和估值可能也越高。于是我们做一个相关关系分析,去看一下进一步的结果。
Figure 12 :Team Grade的平均融资额和平均估值相关关系分析。
如Figure 12展示,相关性分析结果显示了Team Grade与融资额和估值之间的相关系数:
Team Grade与融资额的相关系数: -0.236
Team Grade与估值的相关系数: -0.215
结果解读:
相关系数为负值,表明Team Grade越高(即团队分数越低),融资额和估值越低。这符合我们预期,即团队质量越高(Team Grade越低),融资额和估值越高。
不过,相关系数的绝对值不大(接近0.2),说明这种关系虽然存在,但并不非常强。
Figure 13 :Team Grade的平均融资额和平均估值回归关系分析:
在这个基础上,我们对数据进行了回归分析,试图找到每一个团队级别对融资和估值的影响系数是什么。融资额的回归分析结果显示了以下内容:
截距(const): 1637.66,这表示当Team Grade为0时的预期融资额。
Team Grade的系数: -250.60,这意味着每增加一个Team Grade,融资额平均减少约250.60百万美元。
t值和p值: t值为 -2.32,p值为 0.022,表明Team Grade对融资额的影响在统计学上是显著的(p值 < 0.05)。
估值的回归分析结果显示了以下内容:
截距(const): 8367.14,这表示当Team Grade为0时的预期估值。
Team Grade的系数: -1260.57,这意味着每增加一个Team Grade(降级),估值平均减少约1260.57百万美元。
t值和p值: t值为 -2.11,p值为 0.038,表明Team Grade对估值的影响在统计学上是显著的(p值 < 0.05)。
结果解读:
Team Grade对估值也有显著的负向影响,说明团队评分越高(质量越低),估值越低。
总结:
• Team Grade与融资额和估值之间存在显著的负相关关系,即团队质量越高,融资额和估值越高。
• 每降低一个团队等级(1为最高,每增加一分),公司的融资额平均会减少约2.51亿美元,估值则平均降低约12.61亿美元。
• 回归分析结果进一步确认了这一趋势,且这种关系在统计学上显著。
团队评级与子赛道选择的关系
我们想看一下team grade和子赛道之间是否也有关联系,是否能得出不同的子赛道匹配不同级别的团队,于是我们对team grade和子赛道的关联度进一步做卡方检验,得到结果卡方统计量(Chi-square statistic): 148.37,p值(p-value): 0.258。由于p值大于0.05,整体来看,Team Grade与子类别之间没有显著的统计学关联。然而,个别Team Grade与子类别之间可能仍存在显著的关联,这可以通过观察标准化残差来发现。
通过标准化残值我们发现,以下组合有显著正向关联,这还是说明部分团队组成和部分行业有特定的吸引力;例如等级1的团队喜欢创业大模型和社交方向(大模型相关);等级5和6则以垂直领域创业居多。
Team Grade 5 和Data management:
Team Grade 5 和Gov & Public affairs
Team Grade 5 和Security:
Team Grade 6和Real Estate
Team Grade 1和Social
Team Grade 1和Fundation models
三、多维度分析
全维度,多标签统计分析
我们把AI独角兽的所有大类标签一起做了一个统计分析,包括,创办时间,团队组成,CEO品牌,团队评级,融资额,估值,国家,VC机构,大厂投资等等,想去探究不同标签对估值和融资额的影响。结果发现,
如Figure 14,成立年份 (founded) 也具有统计学上的显著性,成立年份越早的公司估值越低,成立越晚的公司估值越高。
其他变量如 团队评级、子类别、类别、国家、CEO 品牌 对估值的影响不显著。这个则推翻了我们先前的结论,也就是他认为团队级别和品牌对估值等等没有影响。所以我们觉得有必要进一步研究一下。
Figure 14:Founded yr vs. Funding
CEO Brand在更大样本量下的分析
于是我们随机抽取了800个公司(非独角兽),然后去分析和计算不同CEO brand对估值或者融资额的影响。最后果然在更大的样本下,如Table 4,我们发现了不同组之间都存在显著差异,而品牌属性更强的与品牌属性较弱的差异则更大。
Table 4:Selected T-test results
我们在想那么CEO brand之间的差异是否也有可能是不同AI赛道估值不同造成的结果呢?于是我们在同一组数据上进行了统计实验。如Table 5,结果发现在Category里,只有Infra和其他组是有显著差异的。也就是infra的估值显然高于类别,其他类别之间则无差异。
Table 5:Selected T-test results
那么Infra的估值和融资额更高,会不会和infra 里的CEO品牌更好或者team grade更高有关系呢?于是我们又做了一个这三者之间的相关关系分析。如Figure 15,结果证明三者之间并无关联,换句话说,infra的估值和融资额就是高,并不是因为团队背景好,所以估值高。证明AI投资也还是有赛道可以选。
Figure 15:M-W U Test results
四、结论与吐槽
CEO背景、团队等级、赛道影响:
部分CEO背景对公司估值和融资有明确影响;
团队等级对公司的估值和融资有很大的影响。每降低一个团队等级即增加一分(1为等级最高),公司的融资额平均会减少约2.51亿美元,估值则平均降低约12.61亿美元。
此外,只有"Infra"赛道对估值和融资有明显的影响,其他赛道则没有显著差异。
AI创业方向的选择:不同的团队在AI细分创业方向的选择上没有明显差异。
新兴AI企业的估值和融资趋势:近年来创办的AI公司,估值和融资额普遍更高。
因此,我们可以得出:
毫无疑问,在AI领域,投人远远大于投赛道;投人是第一位的;细分赛道没那么重要。
而且我们的VC们,创业公司们可以按图索骥,找一找自己的portfolio和自己的团队的benchmark,属于什么CEO brand,什么团队评分,可以评估一下自己公司的上限和成功率。
事实上我们知道中美创业团队背景差异巨大,一个中国的第一梯队创业者(大学教授+4亿美金成功退出连续创业者)在美国只是第三梯队。也就是说中国顶流团队要比美国顶流的公司少几乎26亿美元估值。
这里面还有几个有意思的点:
在传统互联网投资里,往往是越靠近C端的估值越高,CEO背景也更多元化。2C离钱近,离变现越近,估值越高。所以我们也看到了现在海内外最强的AI巨头都是由2C产品转化而来,例如Google,国内的字节,阿里。
但是在AI创业公司这里,如果我们把所有赛道都分析一遍会发现,他介于半导体和软件software之间,和Web3极其相像,都是底层基础设施的估值更高。换句话说,离钱越远,估值越高。
为什么?
除了表面上的技术驱动以外,很大的核心是在AI和web3领域 2C的创业方向太容易被证伪了:
首先,普通用户摸得到看得见,是个人就可以评头论足,bb几句产品体验;人人都是“投资人”,我听过无数投资消费的VC跟我抱怨,自己的工作和散户没有区别;也就是说,产品好不好,VC的评价没有权威性。
吐槽:2C创业最难的就是找方向,大多数钱花在这里,就是看似有个大方向,做起来全是坑,所有钱花在找方向上;相对而言,如果PMF明确了,那就绞尽脑汁把product做好就可以了,所以并不是中国创业者喜欢Copy to China,而是同等智商情况下,这么做省钱省力。所以国内的原创idea,弥足珍贵,例如共享单车,人人都能想到,但是idea与执行还有一道鸿沟。
其次有客观指标,用户数据就成为判断项目的金标准,必须保持持续增长,一旦不增长,就很难融到下一轮了。
而Infra就不一样了:
第一,方向相对而言更好找,很多infra赛道和科研无异,正如杨振宁所说,科研比商业简单,科研是有规律的。
吐槽:这里面要再说一下中美计算机科研的不同,比方说近几年清华的计算机论文publication和citation数量基本上全球前二水平,但是为什么最有影响力的论文却还是google那几篇呢?因为论文publication和citation数量就是学术界评分的pmf,这刷起来,国人团队又是第一。所以有pmf之前,是海外擅长的;一旦pmf确定了,国人团队往往后来者居上。商业创业,科研,都这样,这是中国特色。从这点上来说,只要美国那边搞定AI应用的pmf,中国这边就能出爆款。
第二,Infra技术门槛高,大多数人看不懂,大多数VC也看不懂,大多数学计算机的VC也看不懂,各种盲人摸象;因此也并不以技术高低作为是否投资项目的标准,这为“吹泡泡”估值奠定了基础。那么我们不禁要问,VC如何评估一个在3-5年内没有亮眼业务数据的技术项目呢?让我们看下面的两个小case。
吐槽:Case 1:Sam altman, Elon musk都不懂AI技术(硅谷工程师听过他们线下演讲的,都知道吧),Elon musk甚至连原理都不太了解,看他和杨力坤的论战得出,此人连基本科研规则都不懂,和高晓松一个路数,主打把道听途说讲的身临其境,《硅谷》里的嘴炮哥,这种真的是硅谷创业奇才;说实话我现在不太相信他几句话解决了什么tesla,spaceX众多科学家解决不了的科研难题,这和孙正义3分钟投马云一样,就是一个公关小品文;但是,这不妨碍他们创造了Open AI。
Case 2:李开复老师是真的懂AI原理的,他在微软主导和推动了统计学成为NLP主流,替代规则流派,极大发展了NLP在语音识别、机器翻译等领域的效果,可以说这个是大模型出现的前提。笔者有一大半本科同学硕士时期从神经学领域(基于统计学)转去机器学习专业就是受此影响。但是,他创办的零一万物(也很牛b)技术会超过Open AI吗?
第三,Infra经常迟迟不推出产品,久久不商业化;这就是为持久“吹泡泡”量身定制的,金融人士最爱。
吐槽:事实上多数AI企业商业化落地的那天就是死亡的那天,看看过去的自动驾驶,芯片领域的案例,比比皆是。在这一刻web2,web3 VC精神交汇了。中国VC在这里有时候很拧巴,一方面也想做那个“撑死胆大的”,一方面又担心政策变脸,不敢真的下注烧钱没完的项目,心里想的是寒武纪,但是又担心投的是柔宇科技。
但是硅谷VC就知行合一了,他们投web2,web3都是一个路数,自己造势,自己抬轿子,没有技术壁垒也要造出一个资金壁垒,吃的准就Netscape /coinbase 高位套现,吃不准就Wework/Opensea。区别就是中国的泡泡靠揣测圣意,而硅谷泡泡却是自导自演。
本文来自微信公众号:爆米花独角兽,作者:VC Popcorn