扫码打开虎嗅APP
本文来自微信公众号:中国企业家杂志 (ID:iceo-com-cn),作者:赵东山,编辑:姚赟,原文标题:《对话创新工场汪华:把AI大模型当作定语,应用才是主语》,题图来自:视觉中国
沉寂10多年,创新工场联合CEO汪华最近又开始公开发声了。
2010年时,汪华对移动互联网的笃定和热情,如今再次投注在AI大模型之上,他认为这将是一个大于移动互联网10倍的市场空间。
汪华毕业于美国斯坦福大学,随后在谷歌中国供职。2009年,他和李开复等人共同创办了创新工场。过去20多年中,汪华一直致力于技术投资和研究。此前,他在移动互联网领域的判断和远见,现在看来已经被时间和商业实践一一证实。
过去一年,随着AI大模型的狂飙突进,短暂的瓶颈期正在显现,投资人在投入巨大的资金后,却因为没收到足够的正反馈而开始焦虑;创业者因为对技术和未来的不确定,而感到迷茫。有人开始悲观,有人感到彷徨。
不同于大多数人在2016年AlphaGo战胜李世石时,才开始关注AI,汪华从2012年开始就投资AI。如今,在移动互联网到AI大模型的技术变革期,他依然坚定和冷静,他的研究和判断也再次成为创投圈重要的参考。
以下为核心要点:
1.在移动互联网,你也不可能在2009年就投出一个TikTok,那时候设备、带宽、普及率都是不支持的。
2.现在的AI应用基本是在原来已有的东西上加个AI框,就跟移动互联网早期,大家把爱奇艺、优酷原封不动往手机里搬一样,但移动互联网的最终形态是TikTok,连内容的长度、类型、交互方式都变了。
3.如果模型成本降到现在的千分之一,再叠加模型性能的改良,有可能是移动互联网10倍的体量了。只是成本下降做普惠这件事儿,就可以再造一个移动互联网当年的规模。
4.ChatGPT到现在为止才一年半的时间,但AI大模型的投入已经相当于当年移动互联网在2016、2017年级别的资本投入了。
5.AI应用这个事,理论上应用是主语,AI是定语。但AI现在太dominate了,变成了AI是主语。AI投入成本高,底层技术栈目前又不稳定,所以焦虑。
6.文心一言、通义千问、Kimi这些应用全部都加上,日活也不过就1000万,国内可是10亿多网民。中国的老百姓对AI的接触是“伪接触”,所以,还谈不到有没有产生增量。
以下为《中国企业家》对汪华的专访内容实录(有删减):
一、谈应用现状:你不能期望在2009年就投出TikTok
《中国企业家》:这一年,您体感比较强的行业变化是什么?
汪华:技术扩散的速度非常快,无论OpenAI顶尖的技术,还是多模态,扩散到非OpenAI的公司甚至是开源模型速度非常快。整个市场竞争非常激烈和开放,这些对于做AI应用的同学,都是好事儿。
唯一让我觉得最惊讶的是整个资本预期,让我觉得有一些不理性。
《中国企业家》:在AI大模型领域,您的投资逻辑是什么?
汪华:不同阶段不一样,2023年主要在投底层的infra(基础设施),从2023年下半年开始,我们主要看to B的应用,包括生产力、出海等等。从明年初开始,to C的应用也可以做了。
整个逻辑跟当年移动互联网一样,本质上还是技术投资,就跟当年互联网先出来的是Cisco和Netscape同样的道理,这个阶段没过去,后面的东西都出不来。在移动互联网,你也不可能在2009年就投出一个TikTok,那时候设备、带宽、普及率都是不支持的。
跟移动互联网当年不太一样的是,那时大家的风险偏好程度比较高。这次虽然是新科技,大家赌未来赌得也是挺乐意,但更追求确定性。
所以,抛开资本的起伏,我们投资的整个逻辑,一是要跟着技术趋势走,二是要跟着生态培育和渗透的方向走。
《中国企业家》:具体拆开如何理解?
汪华:技术的话,本质上就是模型的能力和成本,其中能力又包括:第一,模型智能的能力;第二,模型的多模态。
多模态和模型的智能能力,这个轴越往后推,理论上能做的应用就会越来越多,从to B到to C,从纯线上到物理世界,甚至做到机器人具身智能的世界,从虚拟APP到物理世界成为APP。
还有一条更重要的轴,是成本。对于整个应用普及来讲,在GPT-4o级别的模型性能在很多应用已经够用的情况下,成本这条轴甚至比模型性能更重要。
现在的模型主要集中在to B,接近于当年的大型主机和早年PC做生产力的阶段,因为它太贵了。现在哪怕to C的应用,都是收月费的。OpenAI今年说不定能达到50亿美元收入,还是亏本的。如果推理成本降到现在的1/10,生产力工具类的to C应用就可以不收钱了,做用户量了。
现在流行的AI搜索,其实挺适合在下一阶段的。因为我当年在Google的时候,搜索的用户量并不是很大。当年在Google一个重度用户,一天搜索也不超过10次,平均都是几次而已。其实,一天也占不了你多少服务器时间,你说抖音一天玩几个小时?
如果推理成本降到现在的1%,哪怕是杀时长的应用,也是可以做的,其实又回归到当年移动互联网的逻辑了,应用基本上不是看你的成本多少,而是你的用户体验有多高,用户质量有多好,用户量有多大。
如果要支持很好的多模态,推理成本甚至要降到现在的千分之一。因为一张图片就相当于几百个token,一段视频相当于几十万个token。问题也不是特别大,现在基本上已经到了突破期拐点了。
最近两三年,模型的成本都会以一年8~10倍的速度下降。再往后,这个降速会变缓,只能按摩尔定律往下降了。其实降到千分之一也是可见的事情。所以,再接下来,C端应用疯狂普及,会把所有现有的应用,娱乐、社交等重写一遍。
移动互联网当年也是把人类的界面重写一遍,所以很多广义的交互、沟通、交易之类的又可以换一种形态。AI做得不一定比当年移动互联网更大,但只是做到这一点,就已经很大了。相当于再造一个移动互联网的市场,这还只是成本驱动的。
如果再叠加上模型性能和多模态的提升,供给侧也可以变。因为可以生产内容了,比如说以前的推荐算法只是把已有的内容更好地给你匹配,未来可以直接提升供给侧的效率,自动化供给。甚至如果多模态加进去了之后,在原始侧实现自动化之后,物理世界的供给侧也会发生变化。
如果做到这一步,再叠加模型性能的改良,有可能是移动互联网10倍的体量了。
《中国企业家》:创新工场会有哪些方向是一定不投的吗?
汪华:因为我们比较偏纯技术、应用一点,所以有很多偏capital intensive的,我们可能就不太投得动。
另外,海内外生态不一样,你要把投资范围一割细,会发现国内和国外表面上都是AI,但是能投的东西其实都是不一样的。
比如SaaS在国外就是一个非常好的生意,尤其是标准的SaaS,因为海外原来就有很强的传统SaaS的生态链,现有的公司只需要在上面加一层就行。
你放在国内,新阶段投大量的SaaS,明显就不太合适。因为我们比较偏大型央企,就算用SaaS,大家也喜欢私有化部署、项目制,中小企业也不存在很好的意愿。而且,中小企业原来用传统SaaS用得少,所以中小企业都没有完成数字化改造。你新弄一层东西,也架不起来。
二、谈中美差异:中国团队,更有可能做出现象级应用
《中国企业家》:一部分人对今年AI大模型发展的观点是boring,您的体感是怎样的?
汪华:从投资的角度来讲,最近几个月在美国市场,其实已经非常热闹。当然,这个“热闹”主要还是在to B的各种应用。
你会发现,投资事项的数目非常多,而且是越来越多。投代码的、编程的、法律的,而且动不动估值都是几亿美元,甚至十亿美元的估值。to B外,少量也有to C,比如Perplexity,还有一些多模态更小的模型,但投资人都是标准的财务投资人。
所以,其实是一个生态孕育的过程,我们反而是夹在这两者之间。因为国内虽然表面上是一起开始做的,但整个应用比美国要落后一年。去年年初,ChatGPT Moment来到,美国民众开始疯狂被普及应用。而去年一整年,国内老百姓新闻听了很多,但大多数老百姓其实没有用上。更多人是从今年才开始用上,所以整整落后一年的时间。
从今年Q2开始,看到很多to B的企业,AI上得很快,有很多的low-handing fruit(低垂的果实),当然都是Copilot类的,用在各种垂直行业里面。AI上升的速度,其实比当年的SaaS还是快。很多公司半年之内做到了上千万美元的ARR。
所以,你就可以看到这个速度,to B的这一轮应用已经起来。但这一次美国的投资人,也是比当年移动互联网更保守一点。移动互联网的时候,大家的风险偏好高,而这次投应用的角度,大家也比原来要保守。比如从to B往to C的转换速度,即便他们投Perplexity,也一定要等到Perplexity已经有了蛮大的用户量,并且还初步做了一些商业化的工作,才开始投。
《中国企业家》:在这块,中美会有一些差异和优劣势吗?
汪华:国内在做应用方面,要比美国强,无论是工程的力量,还是国内应用的竞争和迭代,包括各种方法论。哪怕在美国,最近几年暴增的大体量的应用,背后都有中国团队的影子。Temu、TikTok,Zoom也是中国团队开发的嘛。
模型上的优势,可能在做一些最复杂的任务上,美国比我们强。但是,如果AI infra的成本降到现在的1%,那就有可能出现亿级别日活的长时长、入口级别的应用,而做那些应用的时候,中美模型性能没有显著差别,但中国,有可能做出更好的应用。
说句粗暴的话,如果不考虑一些根本的研究突破,同一层次的小尺寸模型跟较大尺寸模型性能差别不会超过20%。关键是在数据——而如果中国的团队应用做得好,那能从应用里面收集到的数据,说不定反而比美国团队多。
三、谈FOMO:AI大模型应该是定语,应用是主语
《中国企业家》:现在行业里或多或少有一些焦虑或者是悲观的情绪存在。您有感受到吗?
汪华:投资人焦虑的是一大堆钱都投进去了,但应用迟迟起不来。如果应用起不来,整个行业的价值是不是比原来预期要低?我之前这么高估值、这么多钱投进去了,将来能不能修成正果,天花板真正的东西到底是什么,什么时候能出来?
这跟当年移动互联网不一样。移动互联网从2008年开始,一直到2012年都还有很多人没有那么认可移动互联网。所以,大家的预期不是特别高。但是,ChatGPT一出来,所有人就对它预期很高。去年太多资本投入在里面,甚至把英伟达“拱”成了世界第一市值。
但你想想,到现在为止才一年半的时间,这投入已经相当于当年移动互联网在2016、2017年级别的资本投入了。投资人会担心有没有一点像1999年的crash,预期过高,整个泡沫破灭。而且,大家还会焦虑GPT-5能不能出来,如果出来不尽如人意,大家原来对它整个领域的预期值是不是就要大大下降?
国内的创业者焦虑就更是来自于各个方面了:
第一,资本市场的焦虑肯定会影响他们。因为这直接影响到他们是不是还能融到足够多的资金。融不到资,创业连燃料都没有了。
第二,AI变化太快了,每个月背后的技术都在变化。很多人发现我今天还做这个呢,明天又得做那个了,创业者觉得没有方向。不知道该做什么,甚至担心会不会过两天风向或者底层技术再一变,之前做的东西都白做了。
第三,创业者也在观望,到现在为止如果在中国市场始终不能出现一个被证明的、一些领军的东西,创业者就开始怀疑,我做这个事儿的时机或者前景。
此外,大家虽然都在做应用,但实际上AI应用这个事,理论上应用是主语,AI是定语。但AI这件事太dominate(支配、占支配地位)了,变成了AI是主语。AI这件事本身变化速度又特别快,每个月都有巨大的变化。如果你就是想做一个主语是AI的东西:一是你不知道用它做什么,方向上就很迷茫;二是这东西底层变化又太快。
如果这两个焦虑跟融资的焦虑叠加在一起的话,就很难受。
《中国企业家》:投资人的焦虑,更多是因为这个共识形成得太快了,还是说也是因为大家FOMO(Fear of Missing Out,害怕错过)的情绪导致的?
汪华:去年共识是很明显的,但实话说,去年是基于FOMO的共识。今年大家要开始回归商业本质和担心天花板了,投资人的焦虑自然就来了。
大家忽略了一件事儿,生态的构建和形成本身需要渗透的时间。因为你想iPhone 1一共卖了400万台而已,虽然声势很大。一个新的技术平台,先得做生态能力。
从用户渗透的角度来说,一开始也都是极客、科技爱好者,包括科技从业者,然后是年轻人、学生这些受过高等教育的人,然后再一点点下沉到主流人群,甚至下沉到下沉人群中间去。
应用本身也是一样的。移动互联网早期的应用,就是把PC互联网的东西,原封不动往手机上搬。现在的AI应用基本也差不多,把原来已有的东西加个AI框,就跟大家把爱奇艺、优酷原封不动往手机里搬一样,但移动互联网的最终形态是TikTok这样的应用,连内容的长度、类型、交互方式都变了。
所以,你想人群的渗透、产品形态的演进,本质上就是生态的渗透,本身也需要时间的。就算技术走得再快,这个也快不了。
谈商业化:老百姓对AI是伪接触,还谈不到商业增量
《中国企业家》:从PC到移动互联网,再到现在的AI 2.0大模型,不管是技术基础或者是落地路径,包括最后能带来商业的增量也好,这三块有哪些是可参考的,有哪些是完全不一样的?
汪华:移动互联网的核心是联网和新的界面,不断把更多的场景连到网上。AI 2.0会带来更多的界面革新,通过多模态链接更多的场景。另外,内容生成也将比当年的推荐算法更厉害,比如说你在虚拟世界玩游戏,可能每个游戏都是你专属的。
AI大模型应用将来有可能是整合界面侧和生产力侧,实现双闭环。而移动互联网是连接场景,这样的话交易从线下搬到了线上,并且更多连接建立后,也扩展了边界,聊天聊得更多,商品买得更多。实际原始的productivity这块,其实还是没有变,背后是无数的外卖、快递小哥。但AI 2.0这一波,无论是线上、线下,可以更大规模自动化。
《中国企业家》:从PC到移动互联网,因为智能手机的诞生让全中国大部分人都触网,并因此带来了快手、拼多多等众多的商业模式,带来了巨大的商业增量,但是目前AI带来的增量似乎还没那么明显?
汪华:我同意你的说法,但得分开几点说。
第一,AI在国内压根还没有普及呢。美国好歹去年一整年ChatGPT Moment,所以美国各种各样的AI应用日活加在一起也是大好几千万了,美国总共就3亿人。在国内,老百姓都听过大模型,但国内那些大体量的文心一言、通义千问、Kimi这些应用全部都加上,日活也不过就1000万,国内可是有10亿网民。中国的老百姓对AI的接触是“伪接触”,所以,还谈不到有没有产生增量。
第二,它能不能产生消费增量,而不只是生产力增量。因为to B应用现在只是降本增效。而当年大家喜欢移动互联网的一点,是增加了交易和需求。
因此在我看来,一是现在离提供整个社会的消费增量,无论是to B和to C,都还有时间。二是必须要扩展出全新形态的消费。就像当年社交电商、直播电商、二次元、手游、IP或者是各种各样的虚拟消费,都是创造出来的增量消费。我相信AI智能化,包括界面改变,能增加出新的消费形态,但现在还没到这一步。
从效率增量到消费增量,其实是一个必然的过程。你有了AI,精神世界传统的消费,比如传统游戏、传统电影之类的可能就不要了。你可能就需要全新的内容形态和消费形态,而在那里面,用户会得到更大的满足感,愿意付出更多的代价,消耗更多的时间。
四、谈路径:我的5个判断
《中国企业家》:大模型落地应用会遵循怎样的路径?
汪华:我的判断是:
1.to B方向;
2.生产力工具;
3.大用户量工具;
4.图文级别的社交娱乐类产品;
5.海量的多媒体娱乐产品,以及真正意义上的商业重构。
这取决于两方面:第一,模型事物本身。第二,人群和应用形态的生态渗透。移动互联网时代,哪怕是从第一天开始,技术栈都是成熟的。无论是硬件、软件、网络、运营、服务器,所有都是成熟的。
AI底层的技术栈还不成熟,顺序一方面是很受技术栈本身的限制和影响;另一方面,模型本身的成本和性能起到的作用也会更大一些。
《中国企业家》:今年大模型厂商的价格战,对您做投资有什么影响吗?
汪华:在美国,其实投资已经到了第二阶段。第一阶段,投纯粹超级基座模型和投算力等投资事件已经变少了。大家整个重点转移到落地和应用这块了,中国也是一样。
每到下一阶段,上一阶段就会发生一些整合,并不是说上一阶段的公司就不是好公司,只是上一阶段已经投了足够多,市场上已经有足够多的玩家。
五、谈创新:AI大模型需要什么样的创业者
《中国企业家》:对于新一代的AI创业者来说,有什么样新的要求?
汪华:这次的AI创业者,要求肯定要比之前高。
移动互联网时代,技术栈稳定,资本状况也很好。最重要的是大家能不能找到一个对的场景。一旦找到对的场景,剩下就简单了。不存在你找到了对的场景后,因为技术本身把自己弄垮了这个事。
而在AI时代做应用,你要对场景很理解,还要对技术边界很理解。不能做现在技术或成本做不到的事情。此外,加上AI本身有比较高的成本,这一代的投资人更保守,对于商业化闭环和商业化落地的要求会很快,对于整个创业团队的要求更加综合。
之前的创业团队,一个产品经理配上一个工程师,甚至是一个大学生自己写东西,找到了对的场景,接下来拿到各种资源,快速增长。在增长过程中,再一点点解决问题。现在这样的方法行不通了。
虽然讲了很多不同,但是商业本质和用户需求还是没有区别的。其实AI这个事只是给大家一个重新洗牌的机会,真实的还是在做应用或者需求。
AI这件事太容易乱花迷人眼,而且不断在变,反而很多同学做AI应用的时候,太看重我要用AI做什么了。反而对于应用、人性、需求本质不见得挖得那么深。
《中国企业家》:AI这一波会存在大厂赢者通吃的情况,还是说大厂会有创新者的窘境?
汪华:两个都会,我分开说。
第一,大厂的资源毕竟多,而且它们现有的应用已经涉及了很多场景。所以,对于大厂非常重视的,而且跟应用相近的主战场,它们的优势是很难比拟的,你别跟大厂去拼这些东西。
但是,AI交互商业模式会很不同,如果新的形态跟原来的商业模式有冲突的话,大厂还是比较难受的。因为为了干掉你这家小公司,得把自己海量的商业模式给毁灭掉。
比如谷歌虽然在搜索很有优势,但原来商业模式本质上是一家广告公司,一旦AI化之后,就跟当年微软和安卓之间的关系一样,免费操作系统的商业模式对于微软是很难受的一件事。
第二,当场景重塑之后,大厂的优势就没有那么大了。比如说货架电商变成社交电商和直播电商,你会发现对于互联网电商巨头来说就非常难受。而AI这个形态,很有可能改变整个形态。
第三,全新的场景,就像之前的滴滴,对于传统大厂来说,不也是从零开始嘛。而且因为大公司成本、效率、人员等因素,尤其新业务比较小的时候的法律风险和成本速度、效率,还不见得干得过小公司。
综上,现有的场景加个AI框这事,就别折腾了,大厂具备垄断性优势,比如场景、资源、算力这些条件都很充足。所谓的AI native,创业公司都有机会,成功的几率甚至超过大厂。
AI有可能非常垂,这样很多大厂也覆盖不到很多东西。就像搜索,虽然在移动互联网时代的搜索还是百度、谷歌,但实际上搜索的互联网流量分配权、话语权是极大减小的,很多需求都是在小红书、知乎、头条、微信里面就解决了。
所以,AI也是这样,以后会把场景更多孵化出来,很多大厂现在依然是新领域的老大。但里面的很多东西将会被分割。