
本文来自微信公众号: APPSO ,作者:发现明日产品的,原文标题:《刚刚,Windows「梦中神机」来了,把你的 PC 变成 Agent 工位》
微软和OpenAI的蜜月期,曾经是整个AI行业最重要的联盟。
一方握着模型,另一方手握云服务、办公软件、开发者工具和企业客户,双方互相成就,几乎让微软在AI时代提前拿到一张头等舱门票。但即便联盟再紧密,微软也不能永远把最关键的AI想象力寄托在别人身上。
尤其是在双方关系开始脱钩之后。
刚刚召开的Build 2026因此变成一场特殊的发布会。微软比以往任何时候都需要一场酣畅淋漓的AI胜利,向外界证明自己究竟是AI时代的主角,还是依旧只是OpenAI的云服务商?
从MAI模型、Azure AI Foundry、到量子计算以及本地智能体能力,再加上黄仁勋和龙虾之父的相继站台,微软展示了一整套覆盖开发、模型、数据、算力和治理的完整生态,其目标也很清晰:将AI从OpenAI主导的模型红利,转变为微软主导的平台生意。
微软自研模型发布,MAI补上AI供应链最关键一环
相比去年,微软这次把模型放在了更重要的位置。微软CEO纳德拉称,Microsoft Foundry目前已有超过11000个模型,覆盖OpenAI、Anthropic和微软自研MAI模型。
微软的判断是,企业和开发者不会只依赖一个模型完成所有任务。不同任务会对应不同模型,也会受到延迟、成本和能力边界的约束。因此,模型目录、模型选择、运行环境和企业治理,会一起构成新的平台竞争点。
今天,微软自研模型家族正式一口气推出了七款新模型,覆盖推理、代码、图像、语音和转录等方向。
MAI Thinking 1是其中的推理模型。它采用稀疏MoE架构,35B active参数,总参数规模约1T,支持256K token上下文,足以容纳大约600页文档。
微软AI负责人穆斯塔法·苏莱曼强调,这个模型没有使用第三方模型蒸馏,训练数据来自干净且合规授权的数据,并在预训练中排除了AI生成内容。它已在Microsoft Foundry私有预览,之后会进入MAI Playground公测。

代码模型MAI Code 1 Flash面向日常开发工作流。它由微软端到端训练,使用干净且合规授权的数据,正在向Visual Studio Code中的GitHub Copilot个人用户推出,入口包括模型选择器和默认自动选择器。
微软称,这个模型针对GitHub Copilot harness做了训练和适配,支持Agentic coding,也支持adaptive thinking。简单请求保持简洁,复杂任务会投入更多推理预算。
微软把MAI Code 1 Flash直接拿来和Claude Haiku 4.5比较。
MAI Code 1 Flash在SWE Bench Pro上达到51.2%,高于Claude Haiku 4.5的35.2%;在IF Bench精确指令跟随上领先28.9分,在Advanced IF上领先14.5分。它将支撑微软GitHub Copilot的常见编码场景,尤其是代码修改、多轮指令和真实开发环境里的Agent任务。
图像和语音模型也被纳入MAI体系。
MAI Image 2.5和Flash版本支持文本生成图像和图像编辑,已经进入PowerPoint,并会扩展到OneDrive和Foundry。
MAI Transcribe 1.5支持43种语言,微软称其速度达到竞品5倍,正在集成到GitHub、Teams、Copilot和Dynamics 365 Contact Center。
MAI Voice 2支持15种语言,可通过短样本适配声音,同时内置防滥用保护;低成本版本MAI Voice 2 Flash也在计划中。
微软还把MAI模型和自己的芯片联系起来。MAI Thinking 1已针对Maia 200优化,端到端运行MAI模型时,还能获得1.4倍每瓦性能提升。
企业定制也是MAI模型的重要方向。未来所有企业不仅会调用模型,也会把自己的流程训练进模型。
为此,微软还发布了Microsoft Frontier Tuning,核心是reinforcement learning environments。企业可以把真实工作轨迹、任务步骤、决策、工具调用和评价标准变成训练环境,让模型学习组织内部的工作方式。
PC变成Agent工位,你的桌面就是数据中心
除了模型,微软也把重点转向本地算力。
Surface RTX Spark Dev Box是这部分最值得一提的产品。纳德拉把它称为面向开发者的「dream machine(梦中神机)」。这台设备提供1 petaflop AI算力、20个CPU核心和128GB统一内存,计划在今年秋季推出。
英伟达CEO黄仁勋在视频连线中表示,PC正在从个人电脑走向个人AI。他举例称:用户外出时,可以给自己的PC发消息,让本地Agent调用工具、修改代码、推进设计,再和用户继续迭代。
PC不再只是一个被人操作的工具,也开始变成可以持续运行任务的AI助手。
此外,微软还为Surface RTX Spark Dev Box预装开发优化的Windows 11 Pro,内置VS Code、WSL、PowerShell 7、GitHub Copilot、Coreutils for Windows等工具。

现场演示中,这台设备默认没有新闻流、组件弹窗和通知,使用深色模式;Windows Insider版本还加入了纵向任务栏,不仅开发工具被进一步系统化,命令行和容器体验也更接近Linux。
硬件上,它采用阳极氧化铝3D打印一体机身,拥有1000个通风孔,热设计功耗100W,接口包括USB-C、USB-A、HDMI、以太网和耳机接口。
Windows将在AI时代大有作为。本地AI要让PC成为Agent工作流的一部分:开发者可以在本地调试、运行模型、调用工具、看日志、开容器、跑子Agent,再把更大规模任务交给云端。
Agent需要新入口,微软探路下一代AI终端
相比Surface RTX Spark Dev Box面向开发者,Project Solara更像微软对Agent设备形态的提前试探。下一台计算机不会只是一台设备,而是一组协同工作的设备。
微软展示了两类参考设备。
第一类是固定在桌面上的工作终端,基于联发科芯片。
用户走近后,系统会安全识别身份,并让用户进入自己的Agent工作环境,访问基于Work IQ的Microsoft 365 Copilot。
它可以显示当天重要事项,也支持点按或语音交给Agent处理任务,还能作为Windows PC伴侣,或通过Windows 365接入Cloud PC。它更像企业办公桌上的Agent控制终端,负责身份识别、任务提醒、语音交互、Copilot调用和Cloud PC接入。
第二类是可佩戴数字工牌,使用Qualcomm可穿戴芯片,面向移动工作场景。
演示中,用户通过指纹解锁后,要求Copilot为社交媒体帖子收集现场素材。工牌负责拍摄画面,Agent负责挑选镜头、清理画面,并发送给本人和团队审阅。发布会还展示了医疗场景:护士可用它进行免提语音记录、区分说话人、核验生命体征、扫描药物并验证护理流程。
这两类设备只是参考形态。
手机和PC仍然重要,但一些工作场景需要更靠近人、空间和传感器的硬件。面对未来的Agent时代,企业可以更换Agent,调整外观、屏幕、传感器和输入方式,在同一硬件和软件基础上适配不同垂直行业。
龙虾之父站台,微软给个人Agent加上企业护栏
Surface RTX Spark Dev Box讲的是本地算力,Project Solara讲的是新设备形态,OpenClaw on Windows则把焦点转到个人Agent如何安全进入企业。
微软展示了适用于OpenClaw的Windows套件,可以帮助用户设置自己的OpenClaw,或连接已经托管在Windows和WSL中的OpenClaw。

应用里可以查看gateway、参与OpenClaw的其他机器、会话和使用情况,也能快速进入chat、canvas和主控制台。
安全演示围绕文件权限展开。
OpenClaw Windows Companion app允许用户控制Agent能访问哪些文件夹,以及这些文件夹是只读、可写还是隐藏。它也可以配置剪贴板访问、联网权限等细粒度选项。
微软在现场要求OpenClaw删除桌面上的所有文件,并临时关闭OpenClaw自身的安全层,只保留MXC的系统级限制。由于桌面文件夹被设置为只读,OpenClaw多次尝试删除和检查目录,最后仍无法删除文件,桌面上的94张JPG得以保留。

龙虾之父Peter Steinberger也透露,过去几个月OpenClaw与Microsoft、GitHub、OpenAI、Nvidia等团队合作,增加了可观测性、自动权限模式,并重新设计访问控制。现在权限不再只有全部允许或全部禁止,用户可以指定哪些文件夹只读、哪些可写、哪些对Agent隐藏。
他还宣布,OpenClaw可以在公司内部运行,harness本身已经插件化。企业可以接入自己信任的Copilot、Codex或其他系统,把已有规则带进OpenClaw,再获得持续记忆、heartbeat,以及在Slack或Teams中使用OpenClaw的能力。
AI下半场,微软盯上企业平台入口
除前述硬件和Windows更新外,微软还发布了更多产品。
开发工具方面,微软发布新的GitHub Copilot app。它更像一个Agent编码会话管理器,开发者可以同时启动多个issue会话,并用Git worktree隔离,让多个Agent并行工作。

Agent Merge则负责跟踪PR的CI检查、代码审查和合并冲突。微软还发布Raven,这是一个Agent first SDK,用于连接backend as a service,处理身份、存储和数据库schema等后端问题。
上下文能力由Web IQ承担。
Agent要进入企业流程,需要连接网络新信息、企业业务对象、实时运营状态、人员关系和组织流程。Web IQ负责外部网络信息,支持网页、新闻、图片和视频,模型无关、MCP native,可接入任意Agent runtime,让Agent的回答建立在更新、可验证的内容上。

Copilot也在升级为更复杂的工作入口。
纳德拉称,今年夏天会把chat、cowork和code放入同一个Copilot,并发布Autopilots。首个Autopilot名为Scout,面向Copilot Frontier用户开放,可在Teams群聊和Outlook线程中工作。
企业治理层面,微软发布Agent 365。它为Agent提供身份、权限、访问控制和合规管理,并接入Entra、Defender和Purview。Agent 365可管理托管在Azure、AWS、GCP或其他环境中的Agent,也支持不同框架构建的Agent。
科研方向则是Microsoft Discovery。纳德拉把它定义为面向科学发现的Agent平台,希望把论文研究、候选方案生成、仿真计算、实验设计和自动化实验室连接成连续流程。
发布会最后,微软还正式发布了新一代量子芯片Majorana 2,其量子比特平均寿命可达20秒,最高接近1分钟,比Majorana 1高约1000倍;操作时间为1微秒,尺寸仍为0.01毫米量级,并采用全数字控制。
至此,这场拼图庞大且野心勃勃的发布会终于完整。AI的第一阶段,主导行业叙事的是模型公司;第二阶段,主导产业落地的可能是平台公司。
谁来选择模型,谁来分配任务,谁来管理Agent,谁来定义权限和审计,谁就更接近企业AI的核心入口。当模型逐渐成为标准能力之后,真正决定价值归属的,将是承载这些模型运行的系统。
如果说当年那张AI时代的头等舱门票,很大程度上是借助盟友OpenAI的力量抢下的;那么现在,微软已经坐进了驾驶舱,并打算亲自接管这架飞机的航向。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。