扫码打开虎嗅APP
本文来自微信公众号:APPSO (ID:appsolution),作者:刘学文,题图来自:视觉中国
曾经我们这样畅想生产力进步带来的美好未来:因为物质极大丰富,人们不再需要从事太繁重的具体劳动,衣食住行用都变得唾手可得,人类有更多的精力从事写作和绘画等文学艺术创作,物质和精神都变得富足。
然后,代表着生产力进步的这一波AI出现之后,人们骤然发现,之前好想错了:说好AI能帮我们洗衣服做清洁的呢?怎么变成了我还在做家务,AI却在搞创作?
错付AI,AI却报之以“幻觉”。
AI,一种权力的代理
试想一下,如果Google的搜索结果里,每十条就会有一条钓鱼网站,我们是不是会异常愤怒?
以ChatGPT为代表的生成式AI胡说八道的概率还真有点高,但我们似乎对新生事物有着极大宽容,把查证的重担自己揽下来。
按照逻辑来说,如今出现的诸多AI工具,比如ChatGPT,Midjourney,Sora注定是会让不少人失业的,但并非如一键三连的警告“不要回答,不要回答,不要回答”那样,我们对AI的要求却是“早点回答,早点回答,早点回答”。
进步主义者宛如“降临派”那样期待更先进的智慧降世地球,但对技术可能导致的链式反应缺少预案。
在电影《奥本海默》里,原子弹之父奥本海默在原子弹爆炸之后自我忏悔,认为“我成了死神,世界的毁灭者”。
技术的发明者,并非技术的拥有者,核裂变这种技术,最终属于权力,也代表权力。
微软研究院研究员、纽约大学AI Now研究所的联合创始人凯特·克劳福德(Kate Crawford)在《技术之外》里认为,因为AI需要在英伟达的显卡中进行运算,也需要大量电力,还需要海量知识和数据训练学习,若非如此,AI只是虚无。但正因为AI依赖于这种资源密集的实体,AI技术亦是权力的代理。
以此类比,AI就是还没有爆炸的原子弹。或者温和一点说,AI如果是另一种核裂变技术,那么它可以是原子弹,也可以是核电站。
QuestMobile等市场调研机构很喜欢列举的一个数据是:中国网民的上网时间花哪里了?
图表来自QuestMobile
答案是:这些年中国网民把约60%的手机上网时间交给了移动视频和移动社交。
图表来自QuestMobile
考虑到抖音和微信在各自领域的霸主地位,大概可以推论,中国网民手机上网的时间里,估摸着50%的时间交给了抖音和微信,剩下时间去向也很好推算,购物的淘宝、拼多多、京东,长视频里面的腾讯视频、B站、爱奇艺,游戏里的《王者荣耀》和《原神》,新闻里的今日头条,剩下的可能就是美团、饿了么点外卖,高德地图、百度地图导航什么的。可以说,腾讯、字节跳动、阿里、百度等互联网大厂几乎完全掌控了我们的手机上网时间。
在PC互联网时代,有大型互联网公司,但没有什么所谓的互联网巨头,人们的时间被分流到各种各样的网站和游戏,头部集中度还没有这么高。
不过不要忘了,微信是在腾讯内部赛马,以及飞信、米聊等外部竞争中的胜出者;当时行业第一优酷和行业第二土豆合并后成为了行业第三,腾讯视频和B站属于后来居上;美团外卖也是和饿了么以及百度外卖鏖战多年才获得领先地位的;拼多多在无人在意的角落猥琐发育,终于从被看不起到看不懂,最后成了追不上;没有哪一家巨头是天生的。
如前面所言,现阶段的AI依赖于资源密集的实体,小玩家没有参与的机会,比如说中国大模型创业企业有头部6家:月之暗面、Minimax、智谱AI、百川智能、阶跃星辰和零一万物,本来美团联合创始人王慧文创立的光年之外也应该是头部选手,不过最终还是被美团收购。有意思的是,阿里投资了这6家里面的5家;腾讯投资了其中的3家,另外也投资了光年之外;手握光年之外的美团也投资了月之暗面和智谱AI;然后雷军系资本(金山、小米和顺为)则一样投资了光年之外、百川智能、Minimax、智谱AI和月之暗面;红杉和高瓴这些顶流基金也都在多头下注。
看起来百度、腾讯、阿里和美团都有自己的大模型,但他们依旧进行了大规模的外部投资来规避风险,增加赢的概率,因为他们一致认为:输不起。
海外的情形大致相似,要么是微软+OpenAI的模式,要么是Meta自研Llama等大模型的模式,从一开始,这就是巨头的游戏,也是权力的游戏,也是科技和互联网的又一场集权运动。
最近有一张图在海内外的社交网络传得很广,对比的是周鸿祎和黄仁勋对于AI的不同理解和贡献。
比如周鸿祎推销360 AI的路数是它能把正常图片变成色图,并且还有人举报,那张正常的图片还是360 AI偷别人的。黄仁勋聊AI就不多说了,目前全球市值第二的英伟达,成为了这一轮AI浪潮里最大的赢家。
两边的对比,很明白地说明了,掌握AI这种能力的权力,可以决定AI往哪边走。诚然,技术中立论者会说技术无意识,技术无立场,但deepfake,AI拟声等等技术早已经成为诈骗等犯罪行为的助手,而不少科幻电影则也开始设置一种在网络世界无所不能,可发射核弹,让卫星陨落的“超级AI程序”作为电影线索。相对的,这类电影线索在几十年前一般是一颗核弹,一罐超级毒气或者一管灭世病毒。
AI的悖论不仅于此,当PC厂商和手机厂商,纷纷将AI冠之以名,以AI PC或者AI手机的姿态重新出发大加营销的时候,消费者却无动于衷,电脑和手机的出货量没有因为AI功能的加入有所变化。
相反,普通人对于非常High Tech的产品甚至会心生反感,仿佛High Tech和Low Life始终相伴,去年那么多的AI事件被冠以“一觉醒来世界变天”,“AI让人类一败涂地”,“以后的人类分为两种,会用AI的和不会用AI的”之后,很难说,AI这个词在大众心中是富有攻击性的。最起码来说,它也像一匹烈马,需要付出勇气才能驯服。
拥抱变化,接受革新,对多数人来说,都是个艰难的命题。更多的人,在技术浪潮里属于被研究被迫跟随的状态,产品经理、心理学家和精算师仔细算计用户的每一个心理活动,让用户沉醉在短视频不断上划和游戏里失败胜利和氪金的多巴胺怪圈里。再往后,谁敢保证自己不是那个在电影《Her》里爱上AI的西奥多呢?
去年WWDC上苹果发布了Vision Pro,又几乎恰逢GPT-4发布,我当时写了一篇《苹果Vision Pro和GPT-4,开启了“智力盈余”时代》,那个时候的判断是,Vision Pro这种随身设备,是GPT-4这类AI的最佳硬件载体,二者肯定会合流,并且产生变革性的力量,人类将会拥有强大的外部智力,就像人类驾驶车辆,拥有强大的马力一样。
即便我不是一个技术乐观主义者,我确实还是认为“以后的人类分为两种,会用AI的和不会用AI的”,只不过我保守的地方在于,新技术真正划分出一道分水岭的时间会更久,而不是瞬间而至的疾风骤雨。
就好像Sora的惊艳问世背后,也参杂了人工的干预,以及一年时间过去了,大家已经对Vision Pro意兴阑珊,未来总在确定和不确定之间摇摆,唯一的答案就是英伟达股票。
也正是英伟达创始人黄仁勋,手握着AI圈最强大的权力,也发出了最像恐吓的演讲:
不论是为了食物而奔跑,或不被他人当作食物而奔跑。你往往无法知道自己正处在哪一种情况,但无论如何,都要保持奔跑。
Apple Intelligence,把尖锐的技术变温和
在聊苹果玩谐音梗,把Artificial Intelligence改为Apple Intelligence之前,其实我想到的是苹果前不久的一次营销翻车事件。
在发布有史以来最薄的iPad Pro 2024之后,苹果顺势推出一支广告片:一台代表绝对力量的液压机,把书籍、乐器、颜料和玩偶等有趣的东西压得支离破碎,最后重压之下,这些日常生活当中的点缀变成了一款轻薄的iPad Pro 2024。
然后多数观众看完广告片之后,都并未感受到科技的魅力,而是惋惜代表技术力量的液压机,摧毁了那些原始的,有趣的,多彩的日常玩物,使之变成一台冰冷纤薄的平板电脑。
随后苹果删除了这支广告片,并进行了道歉。
AI技术是更容易利用颠覆认知的技术效果来营造一种类似的“威权感”,微软Office Copilot演示自动生成PPT,OpenAI演示Sora自动生成视频,或者GPT-4o表演撩妹技能,都是在塑造这种技术的“威权感”,人类自愧不如甘拜下风俯首称臣。
“卢德运动”是历史书上不起眼的一小段,反先进技术的“卢德分子”往往是阻碍进步的代名词,但技术反思者也有足够的理由来描绘“技术陷阱”。
比如历史学家尤瓦尔·赫拉利在《人类简史》里提出了一个假说:人类从采集社会进入农业社会,驯化了植物和动物,看似是一种社会进步,但可能也是一场骗局,不是人类驯服了小麦,而是小麦驯服了人类。
很久以前小麦不过是一种野草,但它被驯化优化大面积种植之后,人类的食物来源就变得单一,重复机械劳作导致人类患上之前不会有的椎间盘突出、关节炎,并且被迫定居在农田附近,抵抗天灾的能力变得极弱,饥荒往往可以造成百万人的死亡,真正的赢家的小麦、水稻和马铃薯,它们作为生物,其族群获得了空前的壮大。
更近一些的“技术陷阱”也能举出不少例子,比如说人类发明了洗衣机、洗碗机、洗地机等等各种电器,但极少有人说,因为有了这些电器,人生变轻松了,不再996了。如果以城市白领视角来看,这些设备更像是节省了家务时间,增加了工作时间。
AI工具也是如此,之前不少文生文,文生图等AI工具在宣传的时候,会说“之前8个小时的工作现在1个小时完成,剩下7个小时就可以欢乐摸鱼啦”。
很难不认为这种文案,不是在广告人在加班到深夜精疲力竭时想出来的。
再没有职场经验的人也会知道,如果AI工具可以让一个员工在1个小时内完成原来8个小时的工作,那么老板知晓之后的第一个想法肯定是辞退掉7个人,然后把8个人的工作交给剩下的这个人。
所以自由主义哲学家和政治经济学家John Stuart Mill就说:
迄今为止发明的所有节省劳动力的机器没有减轻一个人的辛劳。
对于大多数人而言,AI当然也是类似的“机器”。
铺垫完这么久,以普通人的视角把AI描绘尽量黑暗之后,代表光明的力量自然该出场了。
苹果在WWDC24对于AI的处理,则是尽量消减AI作为一种尖锐技术带来的冰冷感,把用户放在中心位置。所以说,把AI解释成“Apple Intelligence”可以说是谐音梗,也是一种巧合的神来之笔。
毕竟苹果智能,听起来还是比人工智能,要有点儿生气儿,也有点儿温度。
另外就是苹果大书特书的隐私策略。
虽然说隐私安全属于用户可以不在乎,但厂商还是要重视的范畴,但在这个星球上,确实只有苹果表现出来的隐私安全态度是最认真的。
苹果诸多技术更新都是伴随着隐私安全更新而来的,比如说TouchID和FaceID两项技术出现的时候,苹果会一再强调,用户的生物密码数据仅保存在设备芯片里的“安全隔区”,TouchID和FaceID也不会存储图像信息,仅仅依赖数学表示形式。任何人都不可能通过逆向工程从这种储存数据,操作系统、设备上的应用和云端服务器,也都访问不了指纹和面部图像信息。
再比如苹果设备会收集一些用户数据,比如健康信息等等,但苹果也会利用“差分隐私”技术来给数据加入干扰,使服务器获取了数据但不知道数据对应的用户是谁。
在WWDC24上,苹果也花了数分钟的时间来解释Apple Intelligence的隐私策略。
Apple Intelligence架构
简单讲,Apple Intelligence是一个端云混合的智能,最新的iPhone、iPad和Mac产品升级系统之后会内置两个端侧模型,参数量不大,用户有AI需求,或者Apple Intelligence发现需要工作的时候,会优先动用本地的端侧模型来处理工作,比如文生图这种简单的工作。
当用户需要更强力的智能时,比如用户要用Siri了,但Siri此时已经被GPT-4o夺舍了,GPT-4o又是第三方OpenAI的,一向强调封闭生态的苹果面对很Open的AI,以及一直以来的隐私追求,就有了私有云服务器作为数据脱敏的中转站。
此时用户数据流转的逻辑可能是这样的:用户用Siri询问问题,iPhone判断本地端侧模型回答不了,要GPT-4o来搞定,于是带着用户信息的数据就先到苹果的私有云服务器上,这个服务器也可能有个大模型。此时云端大模型能回答就回答,回答不了就加密用户信息或者去掉用户信息发给OpenAI服务器,OpenAI用GPT-4o回答,苹果的私有云服务器再把GPT-4o的回答返还给用户。
虽然马斯克发布的梗图非常损,但大概逻辑表述,还是比较形象。当然,关于Apple Intelligence具体在什么场景下用什么模型,本地模型是自研还是开源魔改,云端大模型是一个还是多个,是只有OpenAI还是另有帮手,以及这个私有云服务器的具体工作流程,我们还知之甚少。
在Apple Intelligence命名消解了技术冰冷感,苹果私有云服务器隐私保护加强安全感之后,在具体的AI应用层面,苹果想突出的是“靠谱感”。
苹果在WWDC24为我们举了这样一个例子:假设我的一个会议被重新安排到下午晚些时候,我想知道这是否会影响到我按时参加我女儿的演出。
此时,Apple Intelligence就能判断:我女儿是谁,她几天前发送的演出详情、我的会议时间和地点,以及我的办公室和剧院之间路程的预计占用时长,最终回答我能否赶上演出。
这就是Apple Intelligence作为系统级能力的具体表现:它真正拥有了理解用户的能力,因为它打通了用户的诸多不同应用数据,且知晓这些数据组合起来有何逻辑,还可以推导出用户的问题和需求,最终给出了解决方案。
这种典型能力不是想让手机的能力代替用户在工作当中的能力,而是像真正的助理,帮助用户整理信息,给出建议和决策。
也正是这种沉入系统底层,打通应用数据的能力,也需要苹果一再强调自己的隐私政策,用户对于AI的要求,很像领导对助理的要求,既要工作能力上靠谱,也需要忠心不二,还不能对自己产生威胁。
至此,苹果很好地收敛了技术的尖锐感,也保持了技术的力量感,以系统级的AI能力,对Android阵营各种零散的AI功能形成了当下的碾压态势。甚至还能隐约看到,苹果自己也在纠结,比如无形的AI能力,如何和有形的图形界面融合,再比如强大的AI能力,和百万数计算的苹果生态开发者造就的App Store生态如何共存?
以此而言,没有“人类一败涂地”和“世界一夜变天”的WWDC24,未必不是暗流涌动,只是苹果的AI初体验需要显得优雅而严谨,而非霸道且粗暴,但AI本质依旧没变。
暗流也好,潮流也罢,很多人劝说一定要学会游泳,才不至于在潮流里下沉,但或许也有另外一种可能。
电影《星际穿越》中,主角小队登陆一颗表面全是水的行星,有队员望着远处似有巍峨高山,但那高约万米的巨物并非高山,而是巨浪。
我们又怎么保证,现在看到远远那似乎是高山般沉静的东西缓缓而来,临近之时却是奔涌的巨浪之姿呢?
本文来自微信公众号:APPSO (ID:appsolution),作者:刘学文