看遍了所有的“AI PC”，原来Mac 一直在这里-虎嗅网

本文来自微信公众号：爱范儿，作者：发现明日产品的，原文标题：《看遍了所有的「AI PC」，原来 Mac 一直在这里｜AI 器物志》

智能手机统治了过去十几年的数字生态，它是注意力的黑洞，是我们最私密的随身之物。但手机从设计之初就是为「人盯着它」而生的——它的全部逻辑，都止于屏幕。

AI的需求却恰恰相反：它需要持续感知物理世界——见你所见，听你所闻，随时在场，而非等你解锁屏幕才醒来。

当AI真正成为一种基础能力，它迟早要从屏幕里破壳而出，寻找属于它自己的形状。这将是一个漫长的探索和演化过程。

「AI器物志」栏目由此而来，爱范儿想和你一起持续观察：AI如何改变硬件设计，如何重塑人机交互，以及更重要的——AI将以怎样的形态进入我们的日常生活？

这是「AI器物志」的第6篇文章。

年初，Mac Mini一度缺货，等待时间甚至长达一个半月。

Mac mini是个好产品，这件事大家一直很清楚。国内渠道价格诚意高，M芯片性能又好，入门配置不到三千人民币就可拿下，很适合作为创作新手的主力机。

然而最近这次Mac mini爆红，跟创作或日常使用没什么关系。

关注科技新闻的朋友们应该知道怎么回事：OpenClaw（前身叫Clawdbot）突然火了。

OpenClaw有多种部署方式：你可以装到自己的电脑上，也可以单给它配一台电脑；把它部署在云端的虚拟机/沙箱环境里也没问题；后来，一些主流AI服务也推出了云端一键部署的替代方案，显著降低小白玩家的门槛。

但在刚开始的那段时间，最主流的部署方案就是单买一台Mac mini。

理由肯定不是因为它便宜，更主要在于：要让OpenClaw有意义，需要给它一个「肉身」，让它访问文件、操作软件。

云服务器能运行OpenClaw，但那仍然不是你的电脑，没有你的文件、软件、浏览器上登录的各种账号，没有所谓的「上下文」。Mac mini放在桌上，7×24小时不用关机，甚至通过聊天机器人远程操控的话都不用单配一台显示器。

给OpenClaw一台自己的电脑工作，唯一可观成本是后端接入的大模型API的token费用，很多早期玩家都在这上面吃过亏。但如果你买一台配置够高的Mac mini，下载一个尺寸足够大的模型到本地来运行，可以说除了电费和网费之外，简直就像获得了一个免费的劳动力……

MacBook也行，但是……

据Tom's Hardware和TechRadar等媒体报道，OpenClaw走红后，Mac mini 24GB和32GB配置的等待期延至6天到6周不等；更强大的Mac Studio，交货时间也从两周涨到了近两个月。

这些等待时间，是OpenClaw的早期玩家们，用真实购买投出来的票。

（注：部分机型的缺货也和苹果近期推出新款Mac台式机电脑有关系，以往每次推出临近新机发布时，老机型都会进入售罄状态。OpenClaw的爆红并非唯一原因。）

冥冥之中，Mac成为了2026年首选的「AIPC」；反倒是鼓吹了「AI PC」好几年的Windows PC行业，一点热乎的都没吃上。

英特尔、AMD、高通等芯片商，以及主流PC品牌们，从2023年就开始贩卖「AI PC」的概念了。这些最新的Windows电脑当中，认证过Copilot+PC的比比皆是，GPU、NPU性能并不差，有的整机价格比Mac对等产品要便宜的多。

但问题是，为什么大家还是一窝蜂地冲向Mac？

为什么是Mac？

Windows PC和Mac谁更好的争论，永远没有绝对答案。但如果限定在AI开发上，Mac成为了心照不宣的选择。

虽然大模型的「大脑」都在云端服务器，开发者的手却都在Mac上。这跟Mac电脑的外形和操作体验关系不大：macOS流着UNIX的血液，才是关键。

AI Agent的核心工作是操作文件、调用命令行工具、调度API甚至控制图形界面等。说的更直白一点，Agent就是一个智能且自动化的「脚本工程师」，只是脚本由大语言模型实时生成。而macOS属于类UNIX系统，bash、zsh命令原生支持优秀。

这解决了AI开发中最基础的环境搭建。在Windows上，你可能得先安装WSL2虚拟机。但在Mac上，从Python环境到复杂的C++编译工具链，基本都是开箱即用。Homebrew等包管理器，让安装各种工具和依赖通过一行命令就能搞定。

另外，macOS符合POSIX标准，处理文件路径、多线程任务和网络协议时可靠性稍高。Agent往往需要频繁读写数据、调用API，系统级的高效调度让agent在Mac上的节奏更快。

这种原生感和稳定性，让开发者、尝鲜用户可以更快完成入门，把更多时间花在真正的agent编排工作上。

Windows有WSL、PowerShell，功能上大部分也都能覆盖。但WSL是叠加在Windows上的兼容层，存在路径约定、注册表机制、权限模型等历史遗留问题。AI模型和agent项目在Windows上运行的摩擦，确实会更多一些。

以Ollama和LM Studio为例，这两个工具让端侧推理大模型变得像「下载、安装、运行」一样简单。Ollama的Windows版比macOS晚了半年；LM Studio虽然从一开始就支持两个平台，但在社区里Mac的体验口碑始终更好；OpenClaw也是如此。

往硬件层面继续深入，内存是大语言模型推理运行的命脉。

还是以OpenClaw举例，用户可以通过token付费的方式来接入云端模型，但它更擅长的能力是在端侧模型推理驱动。经过普遍调研，想要让OpenClaw像个智商合格的人一样工作，后端的模型参数量的底线在70亿左右，往往要上到至少320亿参数量才能比较稳定地工作。

这么大的模型即便在4-bit量化之后，仍然需要大约20GB内存（还要留一些给上下文窗口）。

此时，Windows PC的架构会显得捉襟见肘。CPU内存和显存之间存在物理隔离，数据经由PCIe总线传输，受到带宽瓶颈的影响。频繁的数据搬运，会对推理过程带来速率的影响。

更别提，大模型普遍依赖GPU加速推理，显存得足够装得下模型。在英伟达消费级显卡线中，只有90后缀的24GB显存达到了配置要求，但配出整机（只考虑新机）的话合计成本至少在万元人民币以上，用新卡的话会飙到4、5万不等。

而苹果的统一内存架构(Unified Memory Architecture)，让M系芯片的Mac在端侧推理更大规模的模型时游刃有余。

简单来说，统一内存架构的效果，是CPU、GPU、神经计算引擎能够共享同一个内存池，不再有物理总线搬运的损耗，让Mac可以获得极高的内存带宽，并且对于多机串联的扩展性能更好。

以Mac mini为例，选择性能更高的M4 Pro处理器，搭配48GB内存，其它选基础配置，整机价格在1.3万元上下，即可达到OpenClaw社区普遍推荐的320亿参数量模型的配置水平。

当然这还只是对token吞吐速度有要求的专业配置。如果你属于爱好者、尝鲜玩一下OpenClaw，配置下降到常规M4芯片和32GB内存也是能跑起来的。

当然，这个成本对比还是有前提：专用于端侧推理/跑OpenClaw，而不是当做主力机。同等价位的Windows PC还能打游戏、剪视频，通用性更强。

另外，Mac的统一内存和PC平台独显的显存也不是一回事。统一内存由系统和模型共享，一台32GB内存的Mac mini，macOS系统和其他软件仍需占据几个GB。而RTX 3090的显存独立，模型可以全部占用，甚至配合CPU内存跑更大的量化模型。

如果你只用云端API做OpenClaw的大脑，不考虑端侧部署，那Mac的易用性优势依然在。

另外，CUDA虽然提供了统一内存编程接口，但物理上CPU内存和GPU显存依然分离，数据搬运和带宽瓶颈并未消除。

再来看功耗。

Agent的工作方式是持续循环的：任务触发、思考推理、执行、等待、再触发。前述配置的Windows PC会跑到300-400W左右（本地部署），散热噪音和电费都不是小数目。

Mac mini通常稳定功耗在10-40W左右，峰值功率65W（M4）或155W（M4 Pro），散热可控，几乎没有风扇噪音，运行更安静。这种低延迟、低功耗的持续工作方式，会产生潜移默化的体验差异。

网友3D打印的套件「Clawy MacOpenClawface」

当然我们更多还是围绕OpenClaw这个以推理为主的场景进行讨论。如果工作涉及本地微调，并且对于效率有追求的话，那么在macOS平台要往往要到Mac Studio，或至少顶配的MacBook Pro，才能算摸到门槛。

与此同时，Mac不支持CUDA也是个可能永远都无法改变的事实。不过，CUDA的真正战场是模型训练，推理场景对它的依赖小得多，毕竟苹果在推理上有MLX这张王牌（后面会详述）。

再回到OpenClaw：它的创造者Peter Steinberger曾经公开表示，自己很喜欢Windows，觉得它的功能更强。他在Lex Fridman播客中说，Mac mini不是唯一的「肉身」选择，通过WSL2方式运行OpenClaw已经非常成熟了；他甚至公开吐槽苹果在AI领域「搞砸了」，并且对苹果生态的封闭性感到不满。

但客观来讲，对于技术小白型用户的部署门槛，Mac mini确实是最省心、最容易上手的方案。主要原因就是它的功耗、静音、尺寸足够小，像是一个可以插在墙角、24小时待机且不需要维护的「服务器节点」。

还有一个和功耗有关的例证：前几天有一位工程师Manjeet Singh成功实现了对M4处理器上「神经引擎」(Neural Engine，简称ANE）的逆向工程，发现ANE的功耗效率极高：算力跑满时的效率高达6.6 TOPS/W。

对比苹果的M4 GPU，约合1TOPS/W；英伟达H100大约0.13，A100是0.08 TOPS/W。

折算一下，A100单卡的吞吐性能是M4 ANE的50倍，但M4 ANE的功耗性能却是A100的80倍。原作者在文章里写道：对于端侧推理，ANE的性能是非常出色的。

由神经引擎说开

2011年，苹果在A5处理器的图像处理单元(ISP)中首次通过硬写入的方式，实现了人脸实时检测等后来被视为AI任务的功能。

2014年，苹果收购了PrimeSense公司，并开始研发一种全新的、专门用于神经网络计算的协处理器。这方面的工作在三年后的iPhone X上问世：A11 Bionic处理器当中加入了前面提到的神经引擎ANE，算力只有区区0.6 TOPS，用来驱动Face ID和拍照人像模式。

那时AI还没到大模型时代，跑的主要是各种机器学习算法。市场对苹果这块协处理器的推出并没什么特别的反应。但苹果从未放弃过，持续加码。

三年后，M1发布，统一内存架构同时到位，ANE也进驻了Mac。桌面平台的功率预算更充足，也让ANE的算力跳到11 TOPS。此后每代更新：M2是15.8 TOPS，M3是18 TOPS，M4是38 TOPS，到了2025年底的M5，达到了57 TOPS。从M1到M5，苹果的ANE算力涨了超过5倍。

这个增长背后的逻辑，其它PC厂商不能说不羡慕。苹果为Mac加入AI加速硬件之前，已经有数千万甚至上亿台iPhone在跑同一套ANE架构了。功耗表现、稳定性、极端情况下的边缘案例，在市售机型上已经得到验证，再搬到Mac上来。

英特尔和AMD在移动端几乎没有消费级规模；高通虽然同样把Snapdragon芯片放进了数亿台Android手机，但它只是芯片供应商。Android上的AI是谷歌(Gemini)以及各大手机厂商联合第三方AI实验室做的；Windows的AI(Copilot)是微软做的。

苹果的不同在于，它实现了垂直整合，同时掌控硬件和软件。其他芯片厂商没有这种统一控制权。

当然，在Mac上推理大语言模型，其实跟ANE没什么关系，它更擅长处理Face ID、人像识别这类固定模式的AI任务。真正承担主要计算量的是GPU。

（注：最近情况发生了细微的变化。首先，M系列芯片上的ANE已经承担提示词注入prefill阶段的工作了；以及刚才提过的M4 ANE逆向工程：该工程师还实现了跳过CoreML直接调用ANE，吞吐量显著提升。通过这种思路，或许可以找到直接利用ANE，来加速推理甚至训练的通用方法。）

2023年底，苹果开源了MLX，把专门针对M系列芯片优化的模型推理框架直接给了开发者。去年，基础模型框架随Apple智能发布，App开发者可以在iPhone和Mac上调用系统内置的基础模型，无需联网，数据不离开设备。

Apple智能一再跳票，这件事确实没什么好辩护的。不过，苹果远在10年前就开始试水，在多年以前就为桌面级AI开发打下了基础，是不争的事实。

而在Windows那边，「AIPC」这个词开始出现在英特尔、AMD和PC厂商的新闻稿和ppt里，要到2023年底了。

2024年5月，微软发布Copilot+PC认证体系，旗舰功能名叫「Recall」，大概的逻辑是系统持续对屏幕内容截图，然后Windows的系统级AI能够帮你回忆过去看到过的东西。

先不说这个功能在发布当时的实际意义是什么，它的安全性首先被发现有严重问题：仅在发布一个月后，研究人员就发现Recall功能会把所有截图存在一个未加密的本地明文数据库里。

微软紧急撤下了Recall功能。过了半年微软再次推出测试版，结果再次因为新的安全问题而延迟。直到2025年4月，Recall才正式上线，但改成了默认关闭，启动后数据改为加密存储。

从发布会宣传到真正能用，将近一年，可以说整个Windows生态AI PC的旗舰功能，经历了一整次从头重新设计，尴尬程度其实不亚于Apple智能/新版Siri的一跳再跳，但可能因为Windows生态的声量实在太低，AI PC没多少人关注，很多人都没听说过这回事。

在Copilot+PC这个体系的认证标准方面，微软主要针对的是神经处理引擎NPU，要求是40TOPS。不过，这个算力的用途是实时字幕、背景虚化、照片增强，诸如此类的消费端窄任务，大语言模型推理从来不在它的射程里（和苹果ANE同理）。

当开发者尝试去做端侧大语言模型推理时，会发现虽然这些电脑名为AI PC，但并没针对AI推理用途做什么优化。微软Copilot本身的核心算力来自Azure云端，和端侧自身的算力几乎无关。买了一台Windows AI PC的用户，最能感知到的AI提升，大概是实时字幕和照片自动分类。

说到端侧推理，还有一个关键因素：Windows AI生态的优化路径是分散的。

NVIDIA GPU用CUDA和TensorRT，Intel NPU用OpenVINO，高通NPU用QNN SDK，AMD NPU用自家驱动栈。模型存储格式也较为碎片化，有CPU+GPU推理的通用格式（GGUF，准确来说是CPU推理+GPU分层卸载），也有GPU-only的格式（EXL2）。

这意味着想让模型以及模型驱动的功能运行在Windows AI PC上，在推理后端方面的工作会更加复杂。微软有ONNX Runtime和DirectML（已进入续命状态）作为统一抽象层，但统一的代价是牺牲各厂商的峰值性能。苹果是目前唯一一家为自家PC硬件专门开发并持续维护LLM推理框架的PC厂商，这个框架就是MLX。

在Hugging Face等开源模型平台上，你会很容易找到大量采用MLX框架的模型，只要带有MLX后缀，并且内存/处理器允许，可以直接「开箱即用」。

不过，这几天MLX的主要贡献者之一Awni Hannun刚从苹果离职，为该项目的后续发展增添了些许变数。Hannun也表示MLX团队仍有许多优秀员工，可以放心。

我们自己的体验

过去一年，爱范儿自己做了不少端侧部署AI模型的测试，也采访过一些相关的外部开发者。有两次值得一提。

去年春节，DeepSeek横空出世，新款Mac Studio也在节后不久面市。我们用一台售价快到10万元人民币的M3 Ultra Mac Studio（512GB+16TB）跑了DeepSeek R1 671B模型（注：实际上只需要内存，硬盘不用那么大，1TB SSD售价七万多的型号就够了），以及蒸馏过的70B版本。

我们当时得出结论：对于端侧部署对话，日常用70B足矣，花大几万买台机器只为了跟AI聊天，实在是有钱烧的慌。当时的模型能力确实也就不太行，后来才有新的多模态模型和agent能力出来。

但671B模型的天量参数模型能够在一台桌面机上端侧推理，仍然是一种奇观。512GB的统一内存上，671B模型占用了400GB，加上上下文、macOS系统本身以及其他任务占用，基本接近满载，但机器全程运行安静，噪音在正常范围，也没有过热。

这个参数规模，在传统AI基础设施逻辑里，属于数据中心级别，消费级硬件理论上不该出现在这个场景里。但那台M3 Ultra Mac Studio，真就硬生生也静悄悄地出现了。

后来，我们采访过一个英国牛津大学的创业团队Exo Labs。他们用4台512GB统一内存的Mac Studio，通过串联的方式组成了一个128核CPU、320核GPU、2TB统一内存、总内存带宽超过3TB/s的算力集群。

团队为这个Mac集群开发了调度平台Exo V2，可以同时加载2个DeepSeek模型（V3+R1，8-bit量化）。不但两个模型并行推理，研究人员甚至可以通过QLoRA技术来做一些本地微调工作，显著缩短了训练任务的用时。整套系统功耗控制在400W以内，运行时同样几乎没有风扇噪音。

同等算力的传统方案，需要大约20张NVIDIA A100，当时的成本超过200万人民币；相比之下，Exo Labs这套方案的总成本才不过40万人民币（同理SSD严重溢出，其实可以30万内就够）。

Exo Labs创始人当时告诉我们，牛津有自己的GPU集群，但申请需要提前几个月排队，而且一次只能申请一张卡。这些桎梏，逼迫他们创新，而他们又正好遇到了趁手的工具：统一内存架构、MLX，以及Mac电脑。

我们在当时的文章里写道：「如果说英伟达的H系显卡是AI开发的金字塔尖，那么Mac Studio正在成为中小团队手中的瑞士军刀。」

这件事，苹果其实早就知道。

真正的AI PC是什么？

去年苹果发布的基础模型框架，让iOS和macOS开发者可以调用系统内置的基础模型，零网络延迟，零API费用，数据不离开设备。

尽管后来苹果基模团队几近分崩离析，但在迭代方面苹果没有停在原地。它其实一直知道开发者在哪里、想要什么。它的回应，就是将大模型驱动的AI能力变成操作系统的基础设施，让开发者更方便调用。

上周，苹果开源了python-apple-fm-sdk。以往苹果基模的完整测试和调优，需要Swift环境完成；现在这套SDK让路变宽了，习惯Python工作流的开发者也能参与进来。

苹果的隐私设计哲学贯穿始终：python-apple-fm-sdk调用的基础模型完全在本地运行，数据不离开设备。苹果整套AI体系在必须上云的场景里，走的是Private Cloud Compute，数据处理完即删除，苹果无法访问。

反过来看Recall，同样是让AI访问用户的私人数据，第一版存的是未加密的明文数据库。一个在架构上阻断泄密，一个是出事了再打补丁。

但话说回来，Mac作为AI开发和部署工具的优势，严格来讲更像是一种「适配度优势」，也可以说是后天意外获得的。

意思是：苹果做神经引擎，最初是为了服务Face ID和人像模式；做统一内存架构，是摆脱对Intel长久依赖的一部分必要工作；开源MLX，是响应开发者对高效推理工具的需求——AI Agent场景爆发，Mac正好赶上，是上述这些以及更多没提到的工程决策的意外收益。

Mac一开始并没有为AI而设计，它始终的产品定位都更接近「创作者工具」。苹果长久以来的目标用户，是视频剪辑师、艺术家、软件工程师。他们需要的是低噪声、持续性能、高内存容量、可以全天候运行的机器。

AI模型推理，以及时下最火的Agent部署，只是恰好需要一模一样的东西。

回头看，十多年前苹果在机器学习上加大投入时，大概率是不会预见到2025年OpenClaw的爆红的。甚至你可以说，如果放在十年前，苹果大概率是不会喜欢OpenClaw这样一个「回报高风向更高」，一旦出现幻觉就把用户隐私、数据安全抛在脑后，无视各种软件工程方面的规章制度的东西的……

但怎么说呢，如今就算苹果不喜欢它，也由不得了。就像墨菲定律那样，或许冥冥之中有些东西早已注定。多年以来苹果打下的每一张牌，无论有意为之还是出于意外，这些牌在今年这个Agent元年（希望这次是真的），成了一套很难不赢的牌组。

2023年开始力推AI PC的Windows阵营，其实一直在追赶苹果在2020年M1推出时就已经定下来的架构优势。当然，25年苹果在AI方面坏消息不断，这个差距是有追上的可能的。但苹果不会停下来等。

就在本周，苹果推出了M5 Pro和M5 Max，芯片采用双芯融合架构(Fusion Architecture)，还在新闻稿中上点名LM Studio作为LLM性能基准。

苹果过去的硬件新品发布里，不怎么说「大语言模型」，特别是在端侧推理的语境下——现在不一样了。

说在最后

吹了苹果一整篇文章了，我们冷静一下，反问一下文章的标题：今天的Mac，就是真正的AI PC吗？

爱范儿倒觉得，苹果做的还不够。在今天，我们还没有看到一款个人计算产品，可以称之为AIPC，抑或真正「原生的AI硬件」。

还是回到OpenClaw，从今天的端侧部署agent身上，真正的AI PC应该长什么样子，其实已经隐约可见。

在应用层面，面向人类的「应用」概念，可能会部分退化回并无图形界面的状态。毕竟人才需要图形界面，agent不需要。而且你会发现，最近越来越多人开始习惯基于对话和命令行的互动方式了。

今天agent的尝鲜者们，去找工具和技能塞给agent；未来，agent会自己去公开代码库拉取新工具和插件来补强自己。

在系统层面，权限体系将为agent的工作原理重构，agent能直接操控各种接口。在底层，会有一套模型的编排调度机制，根据任务随时切换。

本地推理和隐私云端推理也会形成完整、安全、隐私的闭环。数据无论传到哪里，都经过向量化、加密存储，即用即焚……

换句话说，真正意义上的AIPC，应该是从底层开始，从设计之初，就把AI当作「一等公民」的系统。

按照这样的衡量标准，Mac和Windows目前都处于过渡阶段。Mac更接近，因为Unix环境、硬件统一、生态成熟，这些条件在AI agent的时代到来之前已经达成了。Windows的历史包袱更重，改起来更难，还在补课。

但我们绕了一大圈，其实还没问到最本质的问题：真正的AIPC，真的需要是一台「PC」吗？

如果换个思路，所有的agent部署和运行全都在云上；与用户有关的数据，也即「上下文」也在云端安全和隐私存储；人类只需要一个终端的设备作为「对话器」(communicator)，以及传感器(sensor)，拍照和录音来上传所需要的数据给agent，这台设备甚至不需要太多端侧算力。

Mac是今天最好的AI PC，但未来的「AI PC」，却可能更像……iPhone？

本内容来源于网络原文链接，观点仅代表作者本人，不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com，我们将及时核实并处理。

看遍了所有的“AI PC”，原来Mac 一直在这里

为什么是Mac？

由神经引擎说开

我们自己的体验

真正的AI PC是什么？

说在最后

大 家 都 在 搜

大家都在搜