扫码打开虎嗅APP
本文来自微信公众号:衣公子的剑(ID:yigongzidejian),作者:衣公子,头图来自:视觉中国
90年代SGI(硅谷图形公司)研发高性能计算机,富得流油。李开复入职那一天,公司正巧发了个常规“小”福利,全公司所有员工,每人一只1500美元的Tag Heuer手表,外加一件昂贵的小羊皮夹克。
李开复在苹果公司待了六年,也没见过这么壕的排场。
但仅过去两年,SGI就从豪奢走向破产。见证这场大起大落的李开复,总结了一个教训:科技创新千万千万不要脱离用户需求。
当李开复决定换工作,Intel和微软都抛出了橄榄枝,工作内容也惊人一致——去中国,建研究院,网罗中国年轻一代、生机勃勃的高材生。
乔布斯也打来了电话。这位前老板刚结束流放,重回苹果,准备大干一番。“开复,你为什么要去微软?为什么要去中国?赶紧给我回苹果!”
李开复拒绝了。在SGI的这段时间,他扮演着公司和中国的桥梁,很明确地注意到中国迅速发展,尤其是互联网的出现,让李开复坚信互联网会改变中国。
1998年,他回中国建微软中国研究院,也就是后来的微软亚洲研究院。这是互联网力量最不可一世的一年,谷歌、搜狐、京东、腾讯、新浪相继诞生。
在美国从事计算机科学的中国人,都被李开复薅了个遍。选中张亚勤,这位天才学霸,先在桑纳福研究院做主管,被通用电气(GE)收购后,张亚勤的工作重心由纯科研,变为将技术转化为产品。这份“市场”的经历让李开复尤其看重。
搞研究,先要建文化,科学面前人人平等。李开复要求不许叫“总”,也不许叫“院长”,必须叫“开复”。张亚勤先使坏,用当时北京城很火的餐厅名字“KFC”叫李开复,因为后者名字简写是KF。李开复还击了,管张亚勤叫“牙签”(YQ)。
初生的微软亚洲研究院风风火火,政府也很支持,入职竟然能解决北京户口。在基础研究、产研结合、培养青年科学家方向,微软亚洲研究院给中国播下了一颗种子。
后来的故事,大家都很熟悉。比研究内容更出名的,是微软亚洲研究院的“人”,张亚勤、沈向洋、王坚、王海峰、林斌、俞栋、邓大付、贾佳亚、孙剑、余凯、汤晓鸥……这一长串的“毕业生”,有的去百度阿里腾讯头条小米,有的下海创业科技小巨头,把科学研究孵化成一个个具体的解决方案,撑起了中国科技商业的半边天。
一
激流澎湃。24年后光景已然大不相同。中国 AI 技术和应用也走到了全球第一梯队。
2022年,李开复对中国媒体谈到,“中国将与美国共同引领全球AI发展,在未来二十年,AI和自动化作为平台技术,与先进计算、生命科学、新能源等更多新技术交叉发展会带来颠覆性的产业变革,中国有望这过程中领跑。
但话音未落,微软一手奶大的ChatGPT横空出世,让一个常见的话题再次热议:美国中国AI差距究竟有多大?担忧之声此起彼伏。
认识差距,也客观丈量差距。
不妨大方承认,科技、商业很多方面,美国依旧领先世界,是我们学习和追赶的榜样。但广阔的市场和丰富的场景是中国AI的跳板。特别是在规模巨大的传统行业,有较深的“行业护城河”。世界工厂正处于数字化、智能化升级转型关键时期,AI、自动化等平台技术轮番上阵,推动其迭代到技术创新驱动的增长新范式。
李开复也预测说,未来,中国和美国的 AI 竞争不一定是零和博弈,尤其中国在大数据和AI的优势,自动化、智能化有望领先美国,保持“世界工厂”的地位。
如果把时间拉长,从微软亚洲研究院到ChatGPT,中美AI两条不同的发展路径,更加清晰。
微软亚洲研究院的何恺明,和他的导师孙剑,研发深度残差网络ResNet。DeepMind的AlphaGo Zero就是利用了ResNet的研究成果。
后来,孙剑离开研究院,加入旷视。而何恺明的另一位导师汤晓鸥,也在离开微软亚洲研究院后,拥抱中国本土AI市场,创业商汤科技。
旷视、商汤,成为中国计算机视觉AI的“四小龙”。CV领域就是一个典型“场景-技术-产品”轮转,再带动下一代技术跃迁的一个代表,同期不仅有四小龙,也有腾讯优图等这样的科技企业布局。我想到更大的方面是,人脸检测的研究几十年前就在实验室里兴起,历经一代又一代研究学者,但是这一代科学家,终于有机会把几代学者的心血从实验室搬出来,通过手机解锁、移动支付,走进每个普通人的生活。
AI顶级人才都是如此,做研究是佼佼者,再跳出去加入中国轰轰烈烈的AI事业,撑起了中国科技行业的半边天。这至少证明了两件事,第一,中国人也会做基础研究,也能做好通用人工智能。第二,做基础研究,和做场景的解决方案,并没有高下之分。恰恰是两者相辅相成,共同推动AI行业的发展。
很多人说,中美两国AI最大的差异在于,美国侧重基础研究,中国侧重解决方案。其实,不仅是人工智能,本世纪所有的科技发展,都在太平洋两岸衍生出不同的路径。
互联网浪潮中,美国对电商相对不那么热衷,线上消费渗透率一直上不去。相比之下,中国几乎所有互联网公司都做过电商,中国电商渗透率冠绝全球,规模一度比第2到第11加总都高。
移动互联网也是如此。美国“移动支付”不积极。但是中国凭借更好的网络环境,更鼓励创新的监管制度,跨越发展,直接跳过信用卡时代,进入数字支付时代。
再比如,无人驾驶。美国侧重车的智能化。而中国的优势是更好的基建、路况、网络和交通规划,于是选择了车路协同的路线。
产业互联网也有很明显的差异。美国经济的产业特点是集中于微笑曲线的最上游和最下游,科技、互联网、金融占比高,加上人力昂贵,企业付费意愿强。而中国的特点是,产业集中在微笑曲线的中段,作为世界工厂,场景丰富,产业链完整,加之政策支持,高校集中,产学研对接十分方便,技术验证更好落地。这样的大背景导致,美国重攻基础研究,多是从技术起步,而中国的优势在于场景多,需求多,场景多,往往是场景倒推技术落地。
二
李开复创办微软中国研究院那年。相反的方向,任正非去美国,对贝尔实验室惊叹不已。美国人搞的这玩意好啊,产研结合,大企业办研究院,商业产品赚利润,长期研究谋创新,两条腿走路才能更稳。
今天来看,任正非的喟叹,折射出另一个维度——对基础研究的态度,不是眼界问题,而是实力问题。
用一个不恰当的比喻,微软来中国建研究院的时候,任正非在美国羡慕贝尔实验室的时候,微软等美国巨头已经是富豪少爷,钱不是问题,钱太多才是问题。要砸钱做基础科学,好处是明显的——既可以抢占科技高点,也需要冲淡垄断者的坏形象。
而中国的民营企业才刚刚走在艰苦奋斗的路上。精打细算的习惯改不了,往往是先从市场需求产品需求开始,再慢慢投入科学家和基础研究,再结合市场需求,带动基础研究落地。
我和很多公司从事AI研究的朋友有过交流,他们的出发点往往很简单、很现实。比如腾讯早期研发的AI技术,是因为QQ空间的产品需求——很多用户用个人电脑自拍QQ头像。QQ团队就想,做个技术可以实现头像居中。
在解决了这个技术难题后,一个小团队逐渐固定出来,跳出产品,专门研究图像技术本身。孵化出了人脸检测、人像表情、智能P图等技术,再用回产品上,孵化出天天P图,人像美容的技术,被应用到国民级产品全民K歌。这个小团队,也就是后来的腾讯优图。
2015年,也是因为需求——金融改革,鼓励小微金融普惠金融。当年微众银行成立,是中国第一家没有线下网点的银行,腾讯积累的图像技术,被用于线上远程开户核身、风险控制。AI的产业技术价值开始显现。
再进入产业互联网,比如用图像AI做质检。制造业不够高大上,但是用AI做质检真的不简单。拿富驰高科为例,它的产品是手机摄像头的支架,形状不规则且只有手指头大小,但上面需要检测的点位却高达七八十个。难度有两个,一是误检率要达标,否则漏检的瑕疵品还需要额外安排人工去检测,那相当于没有提高人效;二是要与时间赛跑,因为手机产品每年都升级换代,所以新一代的质检方案必须在新一代产品开始生产之前做出来,不然就没法落地。
腾讯将混元等大模型的相关能力用在产业场景中,通过腾讯云TI平台对外输出能力,方便客户自己做数据训练,目前已有八个行业超过五十家用户使用了这个能力。富驰高科就算了一笔账,该项目AI的工作效率是原来人工的20倍,在机器持续满载生产的情况下,一年可为公司节省数千万元成本。
马化腾一直讲,要走研究和应用并重的技术研发战略。腾讯的AI实验室后来发展成矩阵,腾讯优图、AI Lab、WechatAI和RoboticsX机器人实验室,既能拿出超大规模(万亿)预训练模型“混元大模型”,也有云和AI结合的腾讯云智能,带着技术扎根工厂,跑出工业质检训练平台TI-AOI。
和美国相比,中国科技有一个明显的特点,从场景需求入手——去底层做技术——再回到产品做创新,从而像轮子一样滚动前进。
在宝武钢铁“1580产线”的透明工厂,蓝领变白领,不用去嘈杂炎热的产线,只要在安静的、开空调的会议室就行。当中用到的数字孪生技术,是从腾讯擅长的游戏场景而来。
和腾讯类似的。阿里的云服务,最早起步于电商,二十年前就在帮助小商家上网卖货。美团的无人机技术已经哼哧哼哧地干到了头部,多年投入无人机就是因为和主业“送外卖”息息相关。京东主推智能供应链,也是来源于京东二十年自建物流的技术底子。
产业互联网是一个比消费互联网大得多的市场。尤其在中国,世界第二大经济体,世界工厂,场景丰富。而且,正在经历从产业布局数据劳动密集向效率提升转型。目前,各家中国科技公司掏出家底往里冲,但是细细分辨,各自拿出的技术成功,都和自己的主业高度相关。
对比之下,美国AI行业上一个爆款是DeepMind的Alpha系列,先把技术做出来,赢人类围棋冠军,足够爆炸。而应用场景、商业化都不迫切,慢慢摸索,好几年后这项技术被用于破解蛋白质折叠结构难题,参与新药的研发,才算英雄有了用武之地。
同样的,ChatGPT目前信息的归纳生成阶段还比较初级,真正走出实验室派上用场仍然需要在应用场景中不断实践,不断打磨,不断迭代。
三
话说,不论25年前办微软中国研究院,还是现在力挺出ChatGPT,微软都有自己的算盘。
明面上是培养中国青年才俊,产融结合,追求创新……但还有些不好意思说的,李开复在自传里分享:当时中国市场管微软叫Micro$oft,因为它太赚钱了,一套软件卖那么贵,而且垄断。但是,创办中国研究院的工作,大大改善了微软的形象。
不得不说,微软真的好“自私”,但是也正是这份“自私”推动了人类技术的进步,市场经济最大的魅力就是鼓励企业自由追求自己的利益,技术追求和商业欲望,带动社会进步。科技创新背后的良性循环,来自于需求——利润——持续投入的循环往复。
ChatGPT的出现也有新的启示,AI对技术、数据、场景要求的突破,需要大企业的持续投入。
OpenAI的天才工程师们固然珍贵,但背后的微软也是功不可没。搞AI大模型是一件极度烧钱的事,数据包含近千亿个参数,1万枚英伟达A100芯片是算力门槛,一次完整的模型训练成本就接近1亿元,而成果又充满不确定性。
微软先投10亿美元,再投100亿美元,一路从内部调资源,给服务器给设备、云计算资源,甚至动了微软内部技术部门的奶酪。
微软贡献的这样几个方面,都来自其平台型企业的属性。ChatGPT用到云资源,如果按照市场价格租赁,OpenAI早破产了,但是微软有云业务,就可以很灵活。而且平台型企业,才有数据给ChatGPT训练,有用户,有业务,有场景,能让AI开发里遇到的技术获得实验机会。
有一件事我想强调。ChatGPT对人类AI事业是绝对的好事,但是对于微软这个商业企业来说,不一定是板上钉钉的好事。
因为创新是不可预见的。ChatGPT模型的核心技术是Transformer。但谁知道下一个打败Transformer的模型会不会明天就会冒出来?
想当年,AlphaGo赢了人类围棋冠军,Google何等风光。但是今天ChatGPT一出来,不也是成了奚落的对象嘛。再往前,人类AI的盛典是IBM的深蓝打败国际象棋冠军。后来IBM过度迷恋技术,反而掉队了。
所以,AI这类技术创新,适合位于社会中间部位的平台型企业去做。往下,创业企业,没钱没资源没场景,做不了。往上,政府产业基金,有钱有资源,但往往和商用场景有距离。说到底,高精尖的技术创新九死一生,要鼓励大企业去冒险,要搭建好产学研的模式,要依靠市场激励。
说到中美AI产业差异,其实中国底子很不错。AI论文数量很早就第一,论文质量也很好。被引用次数居前10%的论文篇数,中国在2019年跃居第一。日本经济新闻在荷兰学术信息大型企业爱思唯尔(Elsevier)的协助下进行了统计分析,2021年受关注论文篇数居前十的企业,前十里有四家中国企业,腾讯、阿里、华为、国家电网分列5、6、7、9位。在人工智能领域,腾讯过去五年专利申请数量为10630项,位居全球互联网行业榜首。
还是那句话吧,面对中美AI差距,既要承认差距,也不要妄自菲薄。找到自己的优势,找到自己的问题。
中国该做的,是用好的自己的特色,丰富的产业链场景、产学研融合、互联网头部企业积极投入,利用好市场的循环。
就像最近科技部部长王志刚最近在谈起ChatGPT时也提到,希望既通过科学研究、技术牵引,也通过场景驱动、用户需求,二者结合起来,让AI为中国经济社会发展、中国科技发展作出贡献。
今年中国的主题是抓经济,高层领导最近多次强调要支持民营经济。的确,科技创新,比拼的是谁有一个更好的商业环境。要鼓励创新,就要宽容试错,有合理的市场激励,平台型企业敢投资,AI这类创新技术才能杀出一条血路。
本文来自微信公众号:衣公子的剑(ID:yigongzidejian),作者:衣公子