扫码打开虎嗅APP
本文来自微信公众号:投中网 (ID:China-Venture),作者:蒲凡,头图来自:Midjourney
先分享两件小事。
自从ChatGPT带火了AI赛道,我基本每隔几天就能在朋友圈里刷到小汉所在的公司。这家公司有大厂血统,自研大模型,有成熟的对话式AI应用,并且融资能力卓绝——成立不到两年,就成功地让红杉、明势、高瓴、米哈游这些自带光环的名字出现在股权架构里,进而成为国内最早一批估值超过10亿美元的大模型企业——从大家的论述逻辑来看,我发现很多人相信这种“强势”的成长方式背后意味深长,读懂了他们就能读懂中国科技行业在这场范式革命中所扮演的角色。
有说红杉、米哈游对他们的连续投资,象征着“通用大模型首战即将终结”的,有说他们横空出世的方式“神似OpenAI”的。乐观派会称他们的存在代表着中国有“一群信仰AGI的年轻人”,理性派把他们和小冰、西湖心辰、澜舟科技罗列在一起,推导谁最能带来属于中国的“AI的iPhone时刻”。
大概是出于职业的原因,我莫名地“共情”到了一股PR层面的压力。于是在上个月的某天,我忍不住转发了其中的一篇近似于捧杀的报道给小汉,问他“面对这么高强度的‘自来水’,公司现在的感受如何”,然后很快得到了一个非常简单的答案“哈哈哈都还好”。
由于“哈哈哈”的存在,我不确定小汉是在“谦虚”,还是希望能“一切尽在不言中”,于是我又求证式地补充了一个问题:“所以你们身处一个正在快速成长的行业,是觉得有宣传就好,还是‘宁可少宣传不要乱宣传’?”
这次小汉利落地回复了三个不带语气词的短句:“宁可没有,(面对报道)没有观感,我们不在意这个。”
另一件事也发生在上个月。大概是周受资代表TikTok出席听证会的那天晚上,科技媒体人老编辑同志在社交平台即刻上发一通关于“人工智能被卡脖子”的感慨,大意是李彦宏声称的“两个月代差”过于乐观了,与国外人工智能产业相比国内赛道用户差了一个数量级、硬件差了一个数量级,在英伟达GTC之后差距只会越来越大。不过他并不认为这是李彦宏的错,而是单独成段强调“这十年的弯路,完全是小眼镜片一手造成的”。
这里的小眼镜片,普遍认为指代的是张先生。在高喊过“确保Web3在此发生”的即刻,相当一部分用户认为字节跳动赖以成功的“算法推荐”是Web2最后的护城河,进而认为字节跳动的巨大成功让中国科技行业错误地评估了技术范式迭代的必要性。这通感慨显然是这个共识延伸。
但这次对共识的强调并没有带来整齐划一的点赞,相当部分围观群众更认同另一位即刻大佬金叶宸提出的反对意见。他认为老编辑整段论调毫无意义,当前的大模型训练方式决定了“数量级差异”很难出现,包括英伟达GTC之后也没有改变GPU的使用在“超过一定数量后很难再形成训练速度的边际递增”。更关键的是他跳出“大模型”发出了这样的感叹:我们要充分认识到一个人的认知知识体系必然是存在缺陷的……作为一个前自媒体从业者,一定要向ChatGPT学习,和自媒体从业者唠嗑还是要经常习惯性说“你说的是对的”还有“对不起,我只是一个大型语言模型”。
两件事前赴后继,让我的脑子里不断蹦出“毒奶”这个词。特别是到了4月初,先有马斯克拉着数名顶着图灵奖光环的科技界大佬联合呼吁“暂缓GPT5的开发”、扬言当下目前人工智能技术的发展面临失控,后有谷歌专家惊叹“大模型已经拥有了我们难以理解的推理能力”,我甚至有回到2017年的感觉。
那时候比特币正火,以太坊和EOS即将大牛,微信群里流传着各种命名为“ICO白皮书”的pdf,群友们最喜闻乐见交易所开单记录,其次是空投撸羊毛教程。创作来源于生活,整个科技媒体圈呈现出赤裸的“创世感”,前脚李笑来宣布“要用Pressone重建整个互联网”,后脚“价值互联网时代”的新概念应声而起,顺便再区分出来一个“古典互联网”,大胆地把BAT扫进历史的尘埃。宋欢平用一种“话不敢说太满”的画风提点跟风者们“少谈梦想,因为这个梦想的掌控者并不是你”,就已经称得上“清醒派”。
所以为了确定这波AI创业潮是否正在经历同样的剧情,过热的舆论是否严重拔高了行业现状,是否给创业者带来了额外的麻烦,是否干扰了投资人的判断,我设计了一份简单问卷,从上周开始向超过30个人工智能赛道内的创业团队发出的QA邀请。现在我试着整理答案。
“创业的霸权时代”
创业者们最明显的感受是,他们身处于一个备受鼓励的环境里,并且鼓励的力度正在持续升温,“千模大战”的口号在升温的过程中逐渐成型。
“千模大战”,“千团大战”的魔改,后者诞生于2010年前后,是《人民日报》盘点的2011年互联网11大看点之一。当时随着4G网络和智能手机的普及,陡然增加的“国民总时间”带来了大量高频、刚需、基建式的市场需求,很多人开始高喊“所有领域都值得在移动互联网时代重做一遍”,然后集体选择在“团购”“O2O”赛道尝试兑现这个“范式预言”。资本最疯狂的时候,整个电子商务领域一个自然年发生了所有融资事件,有三分之一投向了团购,仅2010年3月到8月这不到半年的时间里中国大陆就有超过200家团购迅速成立又迅速倒闭,很多媒体都选择引用某匿名VC的评价来形容市场的惨烈程度:“这是典型的红海,冲进去就得做好断胳膊断腿的准备。”
现在主流的观点认为,“千团大战”虽然本质上是一场“资本闹剧”,大量资本、人力、智力成本被浪费在“商场团购券贩卖机”之类的伪需求上,但在中国互联网产业发展史上“千团大战”却有不可替代的里程碑意义。它的资本过热在相当程度上帮助消费者们快速熟悉了线上消费场景,最终形成了规模化、常态化的线上消费群体。移动支付工具的超前成熟,“本地生活”等新兴概念被快速接纳,基本都可以看做是“千团大战”的副产品。
“千模大战”这个挪用理论上恰如其分地解释了当下大模型热潮的价值所在:这是一次新的底层技术革命,天然地需要大量的创业尝试来探索可能性。
也有更激进的人直接点出“千模大战”意味着小公司和个人将迎来前所未有的创业机遇,并按照这个思路重新拆解了midjouney等人工智能赛道的明星公司。例如一篇来自“AIGC研修社”的文章就写到:“midjouney没有软件、没有App、没有融资,靠着11个人自筹资金在不到一年的时间拥有了全球千万用户,年营收上亿美金……它寄生其中的discord这家非常正统的互联网公司,却需要不断融资,营收也只不过是一亿美金,并且员工人数目前是650人。”
但鼓励不是风险和成本的平替。需要不断被现实问题研磨的创业者们普遍觉得自己的脖子不够粗,戴不上这顶高帽子。永宁老师就认为现在的讨论氛围经常陷入极端,“一会儿说AI让所有人都要下岗了,一会儿又说AI能够给大家找到很好的工作。”
永宁老师的职场履历基本都围绕着“技术”展开,供职过字节跳动,在亚马逊担任过资深软件工程师。AIGC大热之后,他拥有了自己的创业计划,还出过一本科普读物《一本书读懂AIGC》。他用自己的写书经历举了一个“极端化”的例子:“最近很多媒体都在引用一家公司给AIGC提问工程师开40万美金年薪的例子,我的书里也用过……但这就是某家旧金山初创公司的招聘信息,全世界并没有哪家公司会开这么高的工资……这件事显然被过分放大了。”
拿掉被刻意放大的信息渲染,他觉得AI创业就是一个“屁股决定脑袋”的事。“没有非常强大的算力做支撑,很难去研发出一个很好的AI产品。”他说,“OpenAI也是因为很早就绑定了马斯克和微软,很廉价地获得了必要的资源。对于一个就是没有任何嫡系背景的小公司来讲(从0到1)就太难了……所以国内很多AI的公司其实都是在做应用。”
Synfesys创始人李金龙也感受到了同样的气息。Synfesys是李金龙开发的一款AIGC游戏生成工具,Base硅谷,拿过3个term,目前正在美国争取大VC的机会。他的肉测体验是,即使在“领先全球一个身位”的美国,在ChatGPT出现之前整个人工智能赛道也是一片寂静:“很多名校教授牵头的项目拿了VC数亿美元,高薪聘请了一群Phd和精英大牛搞研发,虽然有一些成果出来了,但其实在产业端并做不成什么大名堂。无非就是人脸识别、语音意义识别等应用相对普遍的技术,其他很多项目的投入产出都不成正比”。
集智魔方创始人徐大大则直接建议我和同行们不要过于乐观,认为人工智能这一次的热潮在应用层面的很难留下太多机会,反而可能即将面临一个“霸权式创业”的时代。我希望他能解释一下“霸权”的含义,他补充了很长一段话:“我们认为人工智能这一轮的发展是不断集成人类智能的过程,在这个过程中很多流程、环节、都会吞噬,形成端到端、自动化的解决方案,最后会不可避免地形成超级智能——这些环节在上一代互联网的时代是存在独角兽公司的(所以互联网时代是一个“平权”的创业时代),但是现在没机会了——比如GPT4出现之前很多企业做视频和图片处理,但GPT4出来以后对他们是一个重大打击,模式是否成立都是问题。”
而这种“霸权创业”的感受也正在完整地通过创业者传递给投资人。徐大大和很多VC接触后,发现大家目前形成的共识是创业规划要有“战略提前量”,而不是寻求“时间提前量”,因为“如果方向错了,早晚被AI追上”。于是他的团队目前的思路是推论“AI发展到最后可能有什么样的机会,以这样的终局反推现在做什么可能成”。
其实我和徐大大的交流并不是一开始就这么坦诚。刚刚加上微信表明身份和事由的时候,徐大大的第一个回复语是“费用这块怎么算”——我以为徐大大是在要求“采访费”,徐大大却以为我在进行一次“商务拓展”——这似乎一定程度上佐证了小公司、小个体的AI创业者们正在经历什么。所以我在通用QA之外补充了两个问题:
“会不会是您在正式开始AI创业后,出现了一波所谓的产业媒体、WEB3媒体、AI媒体,打着可以为您提供社群传播、投融资对接的旗号,希望您付费买他们的内容?”
“这个一直就有啊哈哈。”
“他们真的给你带来了什么帮助吗?”
“没多大帮助,顶多就是知道了一些案例吧。”
“枯竭技术的水平思考”
当然,没有人觉得“夸张”的舆论氛围是媒体的锅,中美之间在AI领域尤其是LLM(大语言模型)和生成式模型(如Stable Diffusion、Midjourney等)方面确实存在着无法回避的技术代差。一个更积极的应对心态是,媒体的下场参与可以帮助关注者们更简单、灵活地正视产业差距,进而再通过舆论的杠杆撬动更多资金投入和政策扶持创业来完成真正意义上的追赶。
唯一的分歧在于“重新造轮子”到底有没有必要。
永宁老师没有那么强烈的“造轮子”情怀。在他的认知里,“人工智能”是一个类似“计算机科学”这样拥有丰富细分赛道的领域,并且已经在消费级应用中得到广泛应用,开头被污名为“Web2护城河”的“字节算法”就是一个典型应用案例,其中支撑起算法引擎运行的标签识别、兴趣匹配都可以归类到技术范畴当中。他也因此更多鼓励“基于GPT再创业”——建议普通创业者们思考GPT如何改造已有的应用场景,而不是“掌握更好的技术”。
只是他发现缺乏从业经历的人很容易把“人工智能”想窄。再具体到人工智能尚未完全从实验室中走出的新概念,当ChatGPT在媒体的帮助下出圈成为大众层面的公共议题,“基建的必要性被夸大,应用层的执行难度被低估”的现象几乎不可避免。
行者AI持相同的观点。他们认为人脸识别、翻译、语音识别和Chatgpt、Mid Journey是AI1.0和AI2.0的关系,相信AI最实际的创业潮应该在细分领域发生。例如他们的产品游戏AI Bot,就是对游戏、元宇宙产品里刚需的内容填充进行“直接解决”。但缺点就是基于细分领域的应用往往在后端运行,对于普通网友缺乏接触的机会和了解的渠道,AI仍然难以摆脱“陌生感”——这其实是有隐忧的:“大家对于陌生的、能力强的事物都会先入为主的带有恐慌情绪,从而带来更多的负面情绪和一些过于激烈的言语和行动。”
徐大大建议创业者们换一个视角。一个基本逻辑是,相比于底层技术,应用层面的开发可以更容易形成数据,方便VC通过“唯结果论”来进行投资决策。而且他发现在和投资人交流的时候,最高频出现的问题就是“对AI的未来是怎么看”。他觉得这个规律说明了两个问题:“一个是看创始人的认识,第二VC也在这个过程中学习。大家都是很混沌的状态,追求模糊的正确而已。”
GPTHUB创始人杜宇洋认为目前的“大模型狂热”“人工基建狂热”不是行业发展的一个线性结果:“ChaGPT背后的语言模型如果从参数等技术指标进行考量,它一定不是最大的,国外很多公司与国内部分公司都存在参数量、模型大小比GPT大得多得多的模型……OpenAI公司在ChatGPT还不很成熟的时候就把模型公布出来,一定有商业层面最大化公司或组织利益的考量。ChatGPT的公布也使得这些仍然在人工智能领域布局过程中的其他公司不得不提前他们的计划,对自己的语言模型进行公布,并进行较大规模的宣传与营销。”
当风口以跨线性的方式“空降”,杜宇洋随之收获了一个和徐大大相似的遭遇:投资人会下意识地用ChatGPT及类产品与前几年元宇宙进行比较,他的办法是从“元宇宙是概念,ChatGPT是产品”的角度为投资人进行解释。“大部分人对此类产品属于‘知道是什么,但不知道它多有用’的程度……这说明赛道仍处于较早期,而且操作路径较长,公众仍然没有产生其使用层面的价值共识,也没有较大范围养成公众使用习惯……不过这也是一个很正常的现象,就像当初的互联网、抖音一样,早期的参与者中公众一定是占少数的。”
类似的保守表达在我的问卷反馈中不胜枚举,似乎一夜之间所有人都开始信仰横井军平的产品哲学。
横井军平是很多人心目中20世纪最伟大的产品经理,其一手打造的Game Boy在游戏主机赛道足以比肩乔布斯的iPhone 4,是能以一己之力定义全品类发展趋势的天才。但他从不寻求技术上“领先”,固执地相信优秀的产品都是“枯竭技术的水平思考”——掌握必要的成熟技术,通过应用层面让用户获得更好的体验——任天堂前掌门人山内溥在一次新闻发布会上把这套拗口的哲学翻译成了大白话:
无论游戏主机是16位、32位、64位,重要的是游戏能和玩家互动,能玩得有趣,画面很厉害,音效很厉害。
而且颇具“启示录”意味的是,横井军平的滑铁卢正是来自于对“枯竭技术的水平思考”的违背,低估了应用层面开发的必要性。他在1995年推出的全新主机Virtua Boy通过简单的“视觉延迟原理+镜像扫描显示器”,超前地实现了近似于VR设备所能提供的头戴式体验、裸眼3D纵深效果。但由于上市仓促,发售时没有任何一款游戏来得及根据特性进行过针对性开发,“不适应”成为了玩家们的集体感受,佩戴不便、伤害眼睛等差评“劫持”了这款产品的全部印象,产品出现严重滞销。截至停产前总销量也没有超过80万台,距离发布时山内溥提出的500万台目标相去甚远。
我沿着这个感受,邀请AI创业者们能试着回忆和投资人们沟通时记忆深刻的有趣场景。杜宇洋思考了一下:“应该就是在演示产品的时候,投资人对于目前语言模型生成结果的那种被惊艳吧。”
“我们希望英文报道”
我发出了超过30份问卷邀请,其中有三分之一表达了委婉的拒绝,理由几乎相同:“我们会在4月/5月发布大模型/类GPT产品,在此之前关于AI的深度问题我们都不作解答。”有一个团队询问我这次的采访是用“中文进行还是用英文进行”。我回答“中文”,对方很快表现出了失望:“我们这个项目可能更希望英文的采访报道这样子”,随即再也没有得到过任何回复。
不过其实我也无法确定这30多份问卷,是否都发给了合适的QA对象,很多项目的定义模棱两可。比如“更希望英文采访”的这个团队,通过搜索引擎的帮助,我得到的项目介绍是这样的:
“拥有继OpenAI、百度、谷歌后,全球首个基于Web3的GPT大模型发布。在香港发布。由Stability AI前联合创始人Cyrus Hodes发起,是一个公共、去中心化的第二层解决方案。用Go语言构建的,最初与以太坊和iPollo合作。”
——这看起来更接近“币圈创业”。海外社媒平台上的网友似乎也和我感受相同,他们大多将这个项目称之为“AI新公链大(羊)毛”“排名前3的AI概念币”,产品亮点是“申请节点可以获得代币空投”。
很多有相同观察的创业者,因此相信AI项目在资本市场上只能呈现出“外热内冷”的情况,产业会“实际上变得安静”。李金龙相信由于ChatGPT太过耀眼,太过强大,被因此吸引而来的“动态投资人”很难找到第二天可以借鉴参考的成功范式:“投出第二个GPT是极难的,而投资基于API做应用的项目又看起来没有壁垒,(投资人会想)不如观望一下让创业项目之间竞争内卷,看看最后谁跑出来了,再加码投资。”
杜宇洋认为“模棱两可”并不是坏事,因为这本质上是公众仍然缺乏对当前语言模型产品的更多了解,意味着还没有形成清晰指向性的舆论,因此也不会普遍存在投资人“被舆论带跑偏”的情况。
节点科技的高泽林觉得没必要担心投资人的信息渠道。“他们的信息来源都是创业者、实验室、高校或者海外一手信息。他们能判断现在真正能做出大模型的其实没有几家。”
这个趋势其实在2个月前就有所报道。2月10日,中国企业家杂志以“ChatGPT”为题策划过一次面向投资人的群访,后来将大家的整体态度描述为“二级市场在喧嚣,一级市场静悄悄”,暗示着资本市场在经历元宇宙、crypto、Web3之后对于“宏大叙事”的疲劳感,也没人知道这种疲劳感什么时候能缓过来。
唯一比较确定的是,这种疲态暂时还很难传递给“二级市场”,因为缺乏“做空机制”——中泰传媒首席分析师康雅雯补充的二级市场从业者的视角大概就是这样:“(二级市场里)没有人会因为你提示看空风险,帮他省了钱而感谢你,只会在意提前下车,会不会错过了这波行情……二级市场里,舆论真的非常容易影响投资人的判断。”
只不过这种“恐惧”的来源就不仅限于媒体和社媒了。“这个圈子里本来就有很多所谓的小道消息。”康雅雯说,“就像前几天盛传某公司拿到了7nm(芯片)技术,传到市场层面这个传闻太容易直接被坐实……讲的人和看的人本来就是两种语义理解环境。”
(网友@元宇宙公主对本文亦有贡献)
本文来自微信公众号:投中网 (ID:China-Venture),作者:蒲凡