正确的提示信息

扫码打开虎嗅APP

从思考到创造
打开APP
搜索历史
删除
完成
全部删除
热搜词
2024-07-18 18:28

苹果:大模型红利的终极收割者?

本文来自微信公众号:普通人的AI自由(ID:AI_Liberty_Guide),作者:Lian、亦帆,题图来自:视觉中国

文章摘要
本文讨论了苹果在大模型领域的潜力和优势,以及其在硬件、AI助手和隐私方面的发展策略。

• 💡 苹果在大模型领域有独特优势,可以通过AI助手Siri实现新的流量入口

• 🚀 苹果自研芯片技术门槛高,有望在PC领域取得领先地位

• 🔒 苹果在隐私保护方面有一定措施,但仍存在数据垄断和商业利益之间的矛盾

引子:你大爷还是你大爷


在OpenAI、微软、谷歌、Meta等一系列公司疯狂卷大语言模型的时候,世界市值第一的公司——苹果似乎出奇的安静。这难道是因为苹果太懒、大公司病,所以做不出来一流大模型吗?


事实是:英伟达只把“世界市值第一公司”的王冠短暂租借了1天,苹果6月WWDC之后的一轮小小输出就又夺回了第一。


在AGI的大潮中,苹果其实一点都不慌:硬件的粘性、芯片的门槛要远远高于大模型。在大模型逐渐成为谁都能做的commodity的时候,拥有硬件+OS全生态能力的苹果只要节操够低,各个大模型公司(包括OpenAI)、各大APP(包括微抖快淘)都只有跪下的份。


颤抖吧!在“Siri_完全智能体_AI原生OS”的面前。


"Something new is born" by Yifei Gong 2024, with Dall-E


一、新Siri:新主流流量入口


过去的Siri很鸡肋,归根结底是因为它是个智障。它既无法给出灵活有价值的回复,又没法实现我们想要的操作:这也是为什么语音入口一直流量不大的原因。


不过加持了大模型的新Siri会很不一样:大模型将会为Siri注入智能(可能也可以一起注入灵魂)。这时候的Siri不仅可以含情脉脉地陪你聊天,还可以是工作中的小秘书来记笔记、点外卖、订机票……


当然,实现这些能力并不容易。如果要实现上面的功能,不仅仅需要AI可以聊天,还需要AI来拆解任务、调用APP/API接口等一些能力的支持。这些能力正是包括OpenAI在内的业界正在主攻的AI Agent的能力;但从结果上来看,Agent能力的真正实现还需要一些时间,大概要等到一拖再拖的GPT5的面世。


在手机上实现上面的功能会更难。手机的性能限制(能耗>带宽~算力>内存)决定了在未来2-3年内,直到下一代SoC面世前,模型大小都很难超过深度量化压缩的7B/13B,而模型小基本就意味着模型能力差。这也是为什么在相当长一段时间里,手机上的AI能力都只能走“云上为主+端侧为辅”的技术路线。


不过随着技术的进步,在不远的将来确定会发生的是: AI语音助手越来越强,并成为主流流量之一。现在GPT4o的对话演示、Kyotai的语音助手已经展示了雏形。



回头来看现在的数字生态,大多数的钱都被那些占据用户时长的APP通过广告的方式挣去了。而在这块大蛋糕里,其实手机和PC的硬件厂商并没有捞到多少甜头:这是因为流量入口和数据都在APP手里,而硬件厂商既然没有流量分发的权利,也就没有广告收入。而语音助手这一主流流量则自然会由手机厂商把持:博弈的天平也将向这些硬件厂商倾斜。


得入口者得收入。


顺着“入口”的逻辑,另一种自然的交互方式就是AR。虽然当前VisonPro的销量不佳,但我认为AR一定会是下一个颠覆性硬件,因为这代表了更自然的交互方式,更高效率的人机交互。苹果也一定会继续在这个上面投入——产品形态可能会有改变,但AR虚拟世界其实已经近了很多:AI无限生成场景很快就会实现。接下来就要看硬件的创新是否能补上最后的拼图:显示频率-重量-续航。


"Entrance" by Yifei Gong 2024, with Dall-E


二、APP的“去皮化”


语音入口和屏幕视觉入口最大的区别是:语音入口只提供唯一结;而在屏幕上的视觉入口有很多APP选择,到底用哪个是用户自己决定。


试想有一个足够聪明的Siri: 那么当我们和Siri说“帮我订下午饭”的时候,到底是从饿了吗还是美团下单、甚至说点什么菜实际上都是Siri说了算;至少也是背后的大模型过滤过的结果呈现出来的。在这种情况下,Siri-苹果完全可以要求美团和饿了吗竞价付费。叫网约车、买东西、订机票……也是类似的。


如果Siri足够好用,甚至都不用调起原来的APP,而是直接呈现到与Siri的聊天界面当中做选择。这就是APP的“去皮化”。当然,各类APP被影响的程度是不同的


  • 无去皮风险:内容即APP(抖音、微信聊天、手游等)。Siri收到指令之后还是要唤起原来的APP来完成服务。当然,对于“刷刷短视频”这种模糊指令,默认是拉起抖音还是快手就看谁保护费交的多了。


  • 前台被去皮,但后台服务稳定:重线下、重运营、商家众多的平台(外卖、电商、宾馆预订等)。当Siri收到指令之后,可以直接调用后台服务API,呈现在聊天框或者小程序,而不需要用户下载APP。当然,因为运营重,所以硬件厂商并不会下场做。


  • APP彻底失去价值:代理性单一服务APP(如机票预订,售后客服除外)。以机票预订为例,如果手机厂商在短时间内谈完几大航司直接接入,就没有携程什么事了。


苹果相比于其他厂商的更大优势,是对iOS的全方位掌控。理论上iOS甚至可以在拉起App的基础上更进一步,直接获取App内的数据和服务,绕过应用界面直接完成用户的指令。当然受节操和与各APP的博弈制约,Apple并不会随意去使用ROOT权限这种“大杀器”来碰APP里的数据,第三方应用开发者也不会直接交出所有的数据和服务,所以我们就看到了Ferret UI这种读屏方案。


但,读屏方案只是过渡,Apple接下来一定会通过其他方式推动获取APP内部更多数据和权限(如App访问某些硬件\数据的权限、广告收入分成等);以及,最近发布的App Intents框架就是为这个设计的。


"Smashing & re-assembling", by Lian 2024, with Dall-E


三、自研芯片:Apple的王炸


自研芯片技术门槛极高且投入巨大。做个粗略比较:


  • GPT4训练成本=6300万美元

  • 苹果M3芯片流片成本=10亿美元


最近几年苹果发布会讲的最多的就是芯片性能,这是苹果最大的底气。


可能是误打误撞,也可能是有远见。Mac在跑端侧模型上有先天优势:显存-内存一体化设计可以装得下更大模型。而且,这个优势是PC机在下一代专为AI设计的全新架构出现之前都无法追上的。(每代芯片从设计到流片到量产要2-3年时间。)


装了M2 Ultra的顶配Mac(192GB内存)跑Llama3-70B-FP16量化(140GB)的推理任务绰绰有余,甚至可以超越GPT3.5的能力。(llama.cpp的开发者Georgi Gerganov 在M2 Ultra上运行Code Llama-34B-FP16模型,使用投机采样加速后的推理速度23.8 token/s,完全是对话场景下可以接受的速度。)即使是一般配置的Mac也有32-64G的内存,也可以完成很不错的AI任务。而对比来看,顶配Nvidia4090显卡的PC机只有24G的显存,只能跑个7B-FP16的模型,还在半智障状态。


此外,仔细打开苹果的M系列和A系列芯片看,里面都有Apple Neural Engine(NPU),也就是专门为神经网络任务设计的区域。不过,第三方软件开发者当前优化能力还很有限,目前在Mac跑的野生模型用的都是GPU的算力;而苹果的原生AI应用是一定可以更好利用NPU的硬件性能。


现在,包括微软在内的AI-PC们都开始转向ARM架构芯片。这里,苹果仍然至少有2-3年的领先优势:各厂商的ARM芯片性能主要对标基础M4芯片,而预测M4 Max的GPU算力至少是M4的3倍。


苹果的下一代Mac很值得期待。


附录:各家芯片性能对比


*官网没写精度,猜测是INT8;**推测值;数据来源:各厂商官网


“Eraction”, by Yifei Gong 2024, with Dall-E


四、你的隐私 or Apple的专属数据


最近看到Apple满大街的广告都是在宣传自己的隐私做得好……这种“此地无银三百两”、“贼喊捉贼”的做法也确实让我很佩服PR的胆量。当然,并不是说安卓机更好,但至少人家不去PR说他们在保护个人数据……Apple是“五十步笑百步”,更是“既要又要”。


“大数据千人千面营销”——变着花地贩卖个人数据本身就是互联网广告的底层商业模式。对于各路软件硬件大厂,数据=利润。Apple也一直有赚这份钱。


作为一手亲历者,几年前Apple就打着“保护个人隐私”的旗号,取消了IDFA(ID for Advertiser)。但实际目的是:把“广告归因”这个互联网广告的关键环节收到Apple内部,这样从广告的大蛋糕切一块出来给自己。演进到今天,各色设备指纹依旧扮演了原来IDFA的角色,Apple也切到了还算满意的部分……各家博弈之后,从来没有哪家真正关注过个人隐私的问题,Apple也一样。


新Siri/Apple Intellgence当前因为技术限制,只能采用“端侧模型+云上模型”的方式,这样我们和Siri的聊天内容、使用信息都会集中存到Apple服务器上。这会让更多的个人数据积累到Apple。为了让用户更无痛地且免费交出数据,这次的PR叙事和之前完全一样:“Apple非常注重个人隐私,你可以相信Apple,请放心使用Siri”。


但,让我来翻译一下:


“请放心使用Siri而不用担心数据隐私;因为Apple会垄断你的个人数据而不会免费分享给别家;这样Apple才能赚最多的钱。”


从更远的角度来看,我认为“端侧+云上”的模型服务方式会是长期存在:其深层原因是这样可以留下足够大的,难以监管的“灰色地带”,让手机厂商可以最大限度地使用用户隐私数据。因此,即使端侧模型的技术发展到可以独立完成任务,在商业上也一定会想出几个“必须上云”的点子。


以及,请更多的依赖Apple吧,这样以后Apple还可以对于各种“增值服务”向你收费:更多的存储空间、Siri的AI服务……但仔细想一下:一方面你付了硬件的钱,还付了“增值服务”的订阅费,此外你的数据还被拿去广告变现而你却什么都拿不到。这才是高级的“一鱼多吃”!


你在iCloud上的数据从来都不属于你自己,它只属于Apple。不信,你尝试把这些数据下载下来存到其他地方?根本做不到。这些数据存在Apple的服务器中,由Apple控制着权限;如果你胆敢欠费,Apple只需要在自己的服务器里修改一下权限,你的数据就和你无关了。


你并没有一丁点还手之力。


"Omnipotent" by Lian 2024, with Dall-E


五、Apple的调性:全闭环垄断


Apple是一家“原生垄断公司”。


Apple的核心商业模式一直都是:以创造垄断为第一优先级,高投入,全自研,之后收割垄断利益。


在未来Siri的新流量入口加持下,这个垄断的能力会进一步得到加强:原来跪在地上的APP们更加只有趴下的份。以及,参照当年Apple对于GoogleMap的操作手法,短期阶段Apple会使用OpenAI或其他第三方模型服务作为过渡,但最终大模型也会内部自研全栈闭环


因为只有这样才能实现彻底的垄断:不让一丁点数据在收税之前流到别人家。


  • 硬件:iPhone\Mac其实并不真正“属于”用户。用户只是手机的“使用者”,而不是手机的“管理员”。用户的操作权限是低于来自于远程Apple总部的遥控的。但,你还是要为硬件付费,只不过你买到的只是使用权,而非所有权。


  • 数据:Apple硬件内的数据是无法用其他第三方软件读取的,用户也没有处置数据的最高权限;而且,对于数据的处置也完全在Apple的远程监控之下。


  • 外设:Apple单独发明了接口、格式,目的就是让我们不能在某宝某多上买充电线/充电器……而只能去官方商城花10-100倍的价钱。


  • App:Apple的App只能从AppStore中下载,而用户不能按照自己的意志安装。这样做的目的是为了App完全受控,乖乖交苹果税、交数据……当然,App交给Apple的保护费最后也是用户买单。


退一万步,如《Zero to One》的作者,Paypal的联创之一Peter Thiel 所说:“一个充分竞争的市场是没有利润的;只有“垄断”才是好的商业模式。”


以“超级垄断”作为核心竞争力的Apple,是世界上最有价值的公司。


"Your only way" by Lian 2024, with Dall-E


本文来自微信公众号:普通人的AI自由(ID:AI_Liberty_Guide),作者:Lian、亦帆Lian et Zian

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
打开虎嗅APP,查看全文
频道:

大 家 都 在 看

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: