扫码打开虎嗅APP
本文来自微信公众号:明亮公司(ID:suchbright),作者:罗宾,嘉宾:周健工(未尽研究创始人),原文标题:《对话未尽研究周健工:通用AI将推动中国垂直模型应用,订阅制模式将更普遍》,题图来自:明亮公司(图为周健工)
ChatGPT在2022年底发布,开启了通用人工智能的时代。大模型在互联网和数字技术的基础之上,成为一种通用技术。今年5月初,未尽研究发布了《通用AI,通用技术,通向何方》报告(下称“报告”);近日,明亮公司对话了未尽研究创始人周健工,他分享了通用AI的未来和大模型的中国之路。
报告指出,中美在AI领域整体的差距本来并不是很大。但自从GPT-3不再开源之后,中国在生成式人工智能和语言大模型领域变成了追随者。而中国科技企业赶超美国的机会,目前并不在通用语言大模型方面,而是在通用大模型的能力边界之外进行创新,如多模态的技术创新,以及中国比美国更大的应用与市场空间。
报告显示,中国目前可用于大模型训练的悟道语料库,包括文本、图文和对话数据集,最大的仅5TB,其中开源的文本部分仅为200GB。另外一个开源的中文本数据集CLUECorps为100G。相比之下,GPT-3的训练数据量,以英语为主,达到了45TB。
中国的数据要素市场逐步形成,定制和加工语料数据的企业大量出现。中国的大模型和AI训练,需要更丰富通用的开源语料库。以汉语为主的通用语料库,同时获取英语的开源和授权使用的数据集,才能建立起立足中国、汇集全人类智慧的大模型。
“人工智能正在吃掉软件。”周健工表示,几乎所有的互联网应用都产生了重新做一遍的机会。特别是移动端的未来,或许变革会比桌面端更激烈,涉及到智能手机的未来由谁定义。在智能手机中部署个性定制化的大模型是未来的一种趋势,这就需要手机从底层芯片、操作系统到应用程序的改变和创新。
周健工还指出,对于中国通用AI企业的商业化方向,投资机构目前更看好将合适的场景、成熟的业务深度和丰富的数据积累和大模型结合起来的应用领域。同时,提供大模型训练和应用中间态服务的公司,包括数据质量与标注、向量化数据库、模型及计算优化等,在中国也将有很高商业价值。
在创办未尽研究之前,周健工曾担任第一财经CEO、福布斯中文版总编辑,还著有《横越未知:从无限劳动力到无限计算力》。
以下系精编整理的对话节选(Q:明亮公司,A:周健工):
一
中国科技企业的投入集中于性价比高的创新阶段,OpenAI的股权投资形式无法在中国复制
Q:报告提到中国企业在通用型AI大模型面临的几项挑战:算力限制、中文语料数据等等,其中一项是资金的投入与“巨头有较大落差”,如何理解这种落差和公司商业模式、核心竞争力之间的关系?除了营利能力之外,对于中国的大公司来说,是否有其他因素限制了对于技术的投入?
A:ChatGPT从1到4所需的累计投入量是巨大的,从以往的数十亿美元到今年初微软的百亿美元,当然其中一些投入是以算力交付的。OpenAI先是以非营利组织的形式而存在,而在这个阶段就能长期大量投入于技术,没有任何一家中国企业可以做到。中国企业不会在一个非常不确定的、信仰级别的技术路线上有这种级别的投入。
OpenAI一边研究ChatGPT这样的模型,一边寻找应用场景,所以微软开始投资联手。我认为这也是微软的一项很精明的投资。微软CEO纳德拉认定未来科技公司都会转向人工智能的竞争,但谷歌一直以来引领了人工智能的变革,且凝聚了AI领域最好的人才。由于微软清晰的战略,它敢于投入大量资金,而且它商业中的精明体现在它投入的很多是算力,它可以借助OpenAI开发大模型而围绕AI所需的高级算力重构微软的云服务。
年初至今,作为万亿市值的上市公司,微软市值涨幅仍有约20~30%,说明它的投入已经被资本市场认可,被给予高估值。GPT-4推出后,微软将其应用在各个产品线中,体现出微软的思路非常清晰。从商业回报看,微软100亿美元的投入对应了千亿美元市值的扩大,回报率也足够高。但是VC、PE们所谓的估值体系、投资逻辑、交易结构等完全不适用于OpenAI的LP。所以第一点,从中国巨头企业到初创公司,都没办法按照OpenAI的股权投资协议模式进行投入。
第二,如果将中国科技巨头和美国巨头对比,我们也在3年间跟踪了全球研发2500强企业,每年的研发支出上,谷歌、亚马逊等美国科技巨头靠前,中国除了华为外,其他公司虽然支出也不少,但与美国还有很大差距。
第三,除了研发支出,还有几点是中国科技企业无法与美国相比的,美国巨头的云做得很强大,很多都有自己的操作系统,另外很多也做了自己的硬件系统,做了芯片和基础软件,垂直整合程度很高。中国巨头主要是在自己的应用里做社交、电商、视频等业务扩展,而围绕技术和生态布局比较欠缺。当一波技术浪潮来的时候,其实一直在做准备的企业才能接得住。
Q:除了是否能长期大量投入、商业模式区别,中国公司相比美国受到更多政策限制,是否导致了中美公司发展空间不同?
A:我认为不完全是政策的原因。相反,在中国的互联网、移动互联网时代,创新环境是比较好的,只是前两年开始的整顿,平台经济仍然在调整适应新常态之中。而且中国科技巨头的崛起,既受益于当时的美元基金,还受益于国内相对有利的保护,谷歌、Facebook当时都退出了中国市场。
Q:中国科技企业的研发投入和创新都是跟随型的,这里有哪些主要原因?
A:中国还是处于应用创新阶段,它的特点就是性价比是最好的,因为引领创新的成本巨大,更别说其中有很多创新的尝试是失败的。对中国来说最大的好处在于它的不确定性和试错成本都大幅降低了。GPT-2公开之后,你能大概知道它是怎么做的,成本多少,而且我们也知道1000亿参数以上就会“涌现”出一些泛化和通用的智能,跟着做就行了。
二
大模型在C端有望开辟新的商业模式,尤其是订阅制付费
Q:平台经济的科技公司这两年处于逆风状态,现在它们也纷纷做了自己的大模型,哪些公司更容易走出来?
A:我认为对这件事看得比较有耐心的是腾讯和字节,除了已经发布了大模型应用的大厂之外,这两家比较值得期待,甚至可以期待做出世界级的应用产品。
Q:腾讯的价值逻辑是什么?
A:大家能想到的一些非常值得期待的应用,都能跟腾讯的产品有联系,比如未来每个人都会有一个定制的模型或机器人去为他提供服务,那么微信就自带这种场景;企业服务方面AI化的空间很大。
第二,在数据量角度看,中国在开源数据上有一个短板,目前仅凭汉语的公开数据,无法训练出GPT-3.5/4这样的大模型。但国内非公开、非开源的数据是不缺的,比如电商、知乎、小红书、B站、微信公众号、QQ生态及腾讯的一些游戏生态数据,这些构成了非常有价值的语料和多模态数据库。
第三,腾讯有自己的云,有十多亿级用户群,有应用场景。而且腾讯非常善于做产品,C端对AI产品目前还有一定的宽容度,所以只要腾讯推出大家能接受的产品,并在争议和反馈中去快速迭代,产品体验就可能会越来越好。
Q:字节除了视频,还有什么优势?
A:首先,它正在获取一流人才,原阿里达摩院大模型M6带头人杨红霞加入了字节,她可能是中国最好的语言生成模型科学家。另外,字节有得天独厚的产品闭环。它的整个产品都建立在算法基础之上,本身就是非常先进的人工智能。
字节已经是国内平台公司中最大的云服务用户,最近TikTok上开始推出抖索机器人;而现在很多人做多模态的文字生成图片或文字生成视频,就是为了放在抖音或TikTok上,字节的产品就是有些多模态生成式AI应用的归宿。相比之下,其他公司花很大成本打磨技术、产品,但并没有弄清楚用在哪里能挣钱。
Q:它们需不需要单独考虑模型的商业模式,还是只是作为入口或免费应用?
A:我觉得这两家公司优先考虑的可能还是把大模型应用有效地集成到平台上。就像谷歌这样的大公司一样,虽然它有技术,而且技术参数不比ChatGPT差,但它还是很慎重。
而且其实有人计算过,大模型的推理和搜索结合起来的成本很高,比如当GPT-4和Bing结合起来,体现为为每个搜索用户提供免费的聊天机器人功能,每个query的成本可能会是提供单一搜索功能的5~10倍,所以谷歌推出了缩小版的聊天机器人Bard。缩小版是因为它也在测试,因为不确定聊天机器人服务带来的成本,对搜索业务会带来多少冲击。
OpenAI已将Bing作为ChatGPT的默认搜索引擎,但Bing的流量增长最近也开始放缓了,所以微软的搜索+聊天机器人的模式是否能颠覆现有搜索市场还需继续观望。现在谷歌的搜索市场份额还不能被撼动。
Q:中国的用户对ChatGPT这样的产品不一定有付费习惯,我们应该把它理解为一个SaaS还是搜索类的免费工具?
A:B端收费提供API调用,大家都理解了。C端会跟免费搜索有不同的模式,免费搜索会面临广告越来越多,带来不好的用户体验。现在ChatGPT作为与搜索并列的应用已经有几个新方式出现了,ChatGPT对C端用户有免费版和Plus版,API也有不少个人用户。如果它再提供多模态功能,或者还有agent平台的功能,能管理更复杂的任务,其实它也构成了一个SaaS订阅模式,可以说是开辟了新的商业模式,我觉得大家也是可以接受的。所以向C端收费的模式,其实也可以做得起来。
Q:在垂直领域出现了像幻方AI这样做大模型和算力储备的公司,它们可能遇到的问题是什么?
A:幻方做得怎么样,细节我们并不清楚,但是金融领域我们分析过一个典型的彭博的例子。彭博有很大的金融类数据量,它可以用自己的数据来训练独有的模型,但彭博又做了一个通用大模型,我们称之为一种防守反击策略。也就是它防止别人基于GPT-4来侵入它的金融模型;同时,它的用户进入其生态,如果希望用通用的大模型,它也可以满足这种需求。彭博现在还在不断优化。与彭博相比,幻方并没有这么大的数据量,如果用自己的算力优势进行高通量的高频交易,它会面临监管问题。
用大模型能做好的主要是提升投研的效率,因为知识密集型的劳动对自动化的要求很高。第二,它还可以建立一些策略,因为它可以用生成式人工智能的方法去做一些预测。但这跟彭博的大模型是有所不同的。独有的数据量是一个关键问题。当然,如果幻方囤卡不少,硬做通用大模型,那是另外一回事。
三
手机移动端的“认知阶段”,移动端的定制化大模型将催生硬件创新
Q:除了数据量,算力会成为挑战吗?
A:中国已经出现了“百模大战”,其实AI算力是很紧张的,北京市政府印发的《促进通用人工智能创新发展的若干措施》,第一条主要内容就是提升算力资源统筹供给能力。从我们遇到的案例看,有大型国有金融机构,要为它的保险经纪业务引入生成式人工智能,比如有场景是每个保险代理配一个虚拟机器人,以提升服务体验和效率。他们找能够训练大模型的科技公司帮助训练模型,但是遇到了算力瓶颈。由此,这种算力瓶颈会从基础大模型延伸到应用领域。
Q:算力缺口还是整体存在的。
A:大模型的训练包含训练和推理两个部分,训练的部分更好解决,它不是低延时高并发的,训练是一个月还是两个月完成的时间问题,不行大家还可以排队。还有一种方式是利用分布式算力训练,通过东数西算等统筹算力方式也可以帮助解决。
但如果你都训练和部署好了,上百个大模型开始大规模应用,这时推理的并发又满足不了。所以在推理阶段,大家的使用量如果上来了,对算力的要求更高。中国的算力虽然整体不缺,但结构上有问题,也就是围绕人工智能的推理的高性能算力比重较小。
Q:相比于算力、算法和数据,中国公司对于具体应用场景的理解能力和技术应用商业化能力都更突出,但对于通用型AI来说,这种“技术+应用”的路径和此前移动互联网时代最大的区别是什么?
A:人工智能和移动互联网的发展并不能割裂来看。因为移动互联网产生的自然语言数据、云计算模式等都是大模型训练的基础。以智能手机来看,虽然它已经实现了很多功能,但手机联网加初步的感知智能,过去其实还处于感知的阶段,而现在我们进入到认知阶段,智能手机要变得真正智能,值得“再做一遍”。
Q:所以硬件整合是通用AI应用于移动端的一个必然选项?
A:我们最近看了些资料,其中一些观点值得探讨:1)手机上所有的应用都可能是一个垂直领域的大模型;2)很多人都希望自己的手机能部署一个定制化的大模型,那就需要硬件来支撑,但现有的硬件是不支持的,我们又需要硬件的创新,这包括手机从底层芯片到操作系统、到应用程序的改变。所以我们说再做一遍是极有可能的。而基于AI的通用技术,手机和电脑上的任务,未来都可以打通应用自动化地完成。
除了手机,在移动端还有物联网将对硬件产生创新。物联网是更典型的感知形式。未来分布在各地的传感器把感知到的物理世界的信息搜集好,在云、边、端的不同层面的大模型去调用,物联网也会进入认知时代。
Q:你看到的中国公司中,哪些商业化方向大家能形成共识、哪些大家存在争议?
A:在我接触到的企业投资机构那里,我感觉越往应用层,大家共识越大。
第一,在有较多共识的创意、电商、企业服务、专业服务等领域,大家已经比较坚定地看好和使用生成式AI。
第二,投资机构比较看重的是有好的场景、成熟的业务深度和丰富的数据积累和大模型结合起来的应用领域。大家都在寻找。“上一代”人工智能公司如语音识别和图像识别的公司有很多并没有杀出来,主要是它们虽然看似在任何一个场景都能通用,但业务深度还不够,所以现在有的公司开始聚焦,譬如医疗健康等场景中的某些环节,或者在语音、视觉等领域用生成式人工智能加持。
第三类是大模型训练和应用的中间态公司,是所谓的“卖铲子”的公司,中国还不多,但我相信未来会有这样的公司浮出水面,它们的价值很大。其中包括数据标注、数据的向量化、模型算法的优化等等,标注更初级一些,而数据向量化公司在美国的估值现在很高,因为大模型训练后,尤其对多模态数据,向量化是必须进行的一步。
基础层的大模型,国内的几家科技巨头自己在做,仍然是跟着美国的几个大模型在走,虽然现在很多产品在接近GPT-3.5的水平,但国内进步的同时国外也在进步,差距依然存在,所以反而有些基础模型,尤其是对C端的应用,引起了不少争议。
备注
在人工智能领域,涌现(Emergence)指的是在计算机系统或人工智能模型中,通过简单的规则或局部交互产生出复杂的整体行为或属性的现象。
在人工智能中,涌现是指在模型或系统中,通过对输入数据进行处理、学习和推理等过程,产生出超出预期的、复杂的、新颖的行为或特征。这些行为或特征并没有被显式地编码或设计,而是通过模型的内部机制自发地涌现出来。
涌现在人工智能中可以表现为以下几个方面:
高级的智能行为:通过大规模的数据训练和模型优化,人工智能系统可以表现出对语言、图像、音频等多种输入数据的理解和处理能力。这包括自然语言处理、图像识别、语音识别等任务,在其中涌现出了复杂的智能行为。
新颖的解决方案:在人工智能系统中,通过学习和优化的过程,模型可以发现新颖的解决方案和方法,超出了传统编程所能预先设定的范围。例如,生成对抗网络(GAN)可以生成逼真的图像和音频,这种能力是通过模型内部的对抗训练过程涌现出来的。
自适应和自学习:人工智能系统具有自适应和自学习的能力,通过与环境的交互和反馈,系统可以调整自身的参数和策略,以适应不断变化的情况。这种自适应和自学习的能力涌现出了系统在新任务和环境中的适应性和智能性。
涌现在人工智能中是一种有益的现象,它展示了模型在处理复杂问题时具有的自发性、创造性和适应性。通过利用涌现现象,人工智能系统可以更好地应对复杂任务和现实世界的挑战。但是对于涌现的科学机制还需要进一步研究。一些专家认为涌现也可能导致大模型应用在对话中产生幻觉。
(备注部分来源:ChatGPT,经过核实编辑)
本文来自微信公众号:明亮公司(ID:suchbright),作者:罗宾,嘉宾:周健工(未尽研究创始人)