扫码打开虎嗅APP

搜索历史
删除
完成
全部删除
热搜词
2025-12-05 21:06

豆包不必这么匆匆忙忙

本文来自微信公众号:最话 FunTalk,作者:林书,编辑:杨磊,题图来自:视觉中国


豆包决定还是往回收一收。


12 月 5 日,豆包手机助手团队发布《关于调整AI操作手机能力的说明》表示:豆包手机助手将限制AI在刷分、刷激励场景的使用;暂时下线AI操作银行、互联网支付等金融类App的能力,并计划与相关厂商沟通共建安全操作准则;部分涉及竞技排名的游戏场景,AI操作能力也将暂时下线。


豆包手机助手团队表示,这“为在技术发展、行业接受度和用户体验之间做好良性适配”,算是对这两天的争议做了调整。


不得不说这款由字节旗下豆包团队与中兴通讯联手推出的nubia M153工程样机,是近期机圈热度最高的手机,官方售价3499元,二级市场被炒到了上万,其搭载的豆包手机助手技术预览版,嵌入底层操作系统,可实现与系统的深度交互


这不就是iPhone 搭载的Siri 梦想中的自己嘛,Siri 没做成的事,让豆包尝鲜了。


其实最开始,我是有些疑虑的,毕竟之前字节做硬件,都让人有种虎头蛇尾的感觉:坚果手机想做抖音入口,TikTok Lite手机是为了预装TikTok,Pico VR是为押注元宇宙所有硬件,在字节这里似乎都是“手段”,不是“目的”。一旦战略重心转移(比如元宇宙凉了,AI热了),那些硬件立马边缘化。


用户能感受到这种“工具感”——你不是真心想做好一台个硬件你只是想让我用你的服务。所以现在推出AI手机,我一开始觉得又是为了推豆包大模型、抢系统入口。


但当我深入了解了豆包手机助手的技术细节和战略意图后,我意识到,这可能并不是又一次“机会主义”的尝试,而是字节真的想另起一套规则”。


如果真的成功,字节就能走向“任务执行”的深水区,从“内容帝国”变成智能服务的一个环节,从而真正摆脱对流量曝光的依赖,在实体经济站稳脚跟,成为中国互联网真正的一极。


只是这次尝试注定会引起种种争议,豆包往回收一收是必然的,甚至可以说,豆包本可以不必这么匆匆忙忙。


一场豪赌:“AI原生手机”野心


从技术层面看,豆包手机助手的核心创新在于让AI“住进”了手机操作系统的底层,而不是简单地作为一个应用层的工具。这种“像人类一样操作手机”的能力,意味着它可以真正跨越不同应用之间的壁垒,自动完成从订餐、比价到发消息的各种复杂任务。


值得注意的是,这是首个豆包和手机厂商在操作系统层面合作的手机AI助手,其核心在于让AI直接控制系统、跨App执行任务、与硬件按键深度联动。


豆包手机助手能够在豆包App的基础上,和手机厂商在操作系统层面深度整合,具备视觉感知、长期记忆和操作能力,代表了AI原生手机的实际形态。


关键的是,豆包这次选择与中兴通讯合作,推出nubia M153工程样机,而不是自主开发硬件。官方明确表示,豆包并无自主开发手机的计划,目前正与多家手机厂商推进合作。


在测试视频中,我们可以看到豆包手机助手能够自动比价下单、调用优惠券、完成跨平台支付等操作。然而,这些看似酷炫的功能背后,是对用户操作习惯和敏感信息的深度监测


豆包手机助手目前很大程度上依赖于“读屏”技术——也就是让AI盯着用户手机屏幕,观察用户在微信聊什么、支付宝余额多少,然后模拟用户点击操作。这种方式确实能实现跨App的功能整合,但其中蕴含的隐私风险,却让相当一部分用户心生忐忑。



有用户直接评论道:“各种敏感信息不光手机厂商知道了、字节也知道了,比如微信的通信录,吓不吓人?”


尽管其他手机厂商,也在推动自动化的手机Agent技术,但这里的一个关键在于:由于小米、荣耀、vivo的核心版图在硬件方向,不像字节那样重度依赖广告和跨平台数据变现,因此没有“原罪感”,让用户觉得自己的行为数据会被用于广告推荐等。


所以当豆包“我要做一个为你服务的AI”,大家第一反应不是相信,而是怀疑:“这背后是不是又一个更高级的收割机制


毕竟从整个字节的商业模式来看,一个能跨App自动帮你订机票、买手机、订餐厅的AI Agent,最有可能的盈利模式,就是在比价和推荐环节嵌入自己的商业利益。比如你让AI“找个便宜又靠谱的笔记本”。


而在用户看来,传统硬件厂商没有这种动机,用户对它们的想象边界就是“做一台好手机”,不会觉得它要监测自己的数字生活。


在这样热议中,人们对豆包手机AI的评价,也呈现了两极分化的态度:一方面认为其是打破了“APP孤岛”的技术先锋、开启AI OS时代的革命者,另一方面则认为,豆包这是“以AI犯禁”,表现出了对隐私的强烈担忧。


生态孤岛:当巨头们不愿开放城门


如果说技术层面的挑战还可以通过产品迭代来解决,那么生态层面的壁垒,则是字节面临的真正难题。


微信、淘宝、美团会乖乖开放接口,让豆包AI随便调用吗?


答案大概率是否定的。


就在豆包发布AI手机后不久,网上就传出了用豆包操作微信时,微信会强制退出登录的现象。


随后,淘宝、中国农业银行、中国建设银行等 APP 陆续出台针对性风控措施,出现豆包 AI 助手无法登录、无法完成支付等情况,外界普遍认为,这是上述 APP 针对豆包 AI 助手跨应用操作的反制


尽管事后豆包发文声称,豆包手机助手是经过用户授权,才能完成操作手机的任务,支付环节、身份验证等,任务会暂停,并由用户人工接管完成相关授权,然而,豆包AI犯禁”的讨论已然开始发酵,腾讯不能忍受微信被管道化,多半会以安全为名来处理。



从技术角度深入分析豆包的这种”系统性”,这个“系统级”AI的核心,其实就一个词:INJECT_EVENTS权限。


INJECT_EVENTS是Android系统里最顶级的权限之一,相当于给了AI一把“万能钥匙”。 普通App(比如抖音、微信)根本拿不到这个权限,因为它能模拟真实的手指点击、滑动、输入——就像有个看不见的人在替你操作手机。


这个权限有个硬规矩:必须用手机厂商的系统私钥签名才能启用。


简单说,就是中兴作为手机厂商,在系统底层给豆包开了张“路条”,用自己的“官方印章”给豆包APP盖章认证,让它获得了超越普通APP的权限。


事实上,除了努比亚这种市场份额较低的厂商,有可能会与豆包进行这样深度的,让渡系统权限的合作外,大部分手机厂商都有自己AI战略,不太可能与豆包做出这种系统级的让步。


例如,华为在2025年全面升级了小艺助手,推出端侧大模型+云端大模型的双引擎架构。小米的小爱同学升级到了6.0版本,能够实现跨应用操作和自动化任务执行。


OPPO的小布助手获得系统级权限,支持语音控制拍照等核心功能。vivo的Jovi发布了智能体2.0版本,具备了记忆用户习惯和主动服务能力。


虽然从技术上说,荣耀的YOYO,以及智谱推出的AutoGLM,也做到了系统级整合,以及相应的自动化操作,例如自动点咖啡、在微信发红包等等,但其中的关键区别在于厂商做AI” vs “互联网巨头造手机”,故事性质完全不同。


荣耀是手机厂商,推AI Agent,用户觉得就像特斯拉推自动驾驶——天经地义,是本职工作,但字节作为中国最成功的注意力经济公司它的算法、推荐、广告模式,已经被无数友商研究、提防


一旦字节声称我要做一个为你服务的AI”,哪怕只是试水3万台,也被友商作对现有互联网秩序的一次试探性进攻。


这种”城门失火,殃及池鱼”的担忧,使得字节的开放生态战略面临着巨大的阻力。


破局机会:用户痛点与技术的东风


然而,绝境中也并非没有机会。豆包的这次尝试最大的价值在于,它敏锐地捕捉到了当前移动生态中用户最大的痛点。


现在的手机使用体验中,各种开屏、植入广告对人们造成极大干扰,点个APP要跳过5秒开屏广告,各种APP间的跳转,用户体验非常差


而且某些广告、优惠的关闭图标(就是那个小”X”),有时候真的很小,很难点,想关闭却一不小心就点开了。


正是这种“割裂+骚扰”的体验,构成了豆包AI手机最可能撬动用户需求的缝隙。


如果豆包手机AI真能做到自动下单、比价,使用户跳过开屏广告;自动填写砍价链接而不强迫你分享;甚至把多个平台的优惠自动聚合——那它就是在减掉噪音、减掉数字生活里的琐碎摩擦。


这种“省心又省眼”的体验,恰恰是当前安卓/iOS生态最缺的,就连 Siri 也做不到。


在我看来,ANP(Agent Network Protocol)协议可能是字节跳出当前生态困局的关键破局点。


2024年,ANP协议开源技术社区提出了这个概念,目标是为数十亿智能体建立统一的连接方式。ANP的愿景是构建一个开放、安全、高效的智能体网络,允许任意两个智能体进行无缝通信和协作。



ANP协议的技术原理,类似于互联网的HTTP协议,它定义了智能体之间的通信标准和数据格式。


举例来说,如果每个AI应用都有一个独特的“智能体ID”,那么当豆包手机助手想要调用微信功能时,不需要直接读取微信的界面,而是向微信的智能体发送标准化请求指令,避免了隐私窥探,让不同智能体之间实现”标准化合作”。


这样一来,即使腾讯、阿里以及其他大厂,都在自己的生态内建立了专属的Agent,大家也不会再次陷入“APP孤岛”的状态,而是可以通过标准的ANP协议互相调用对方的功能。


如果ANP协议真的能够成为行业通用标准,那么所有App按规矩开放接口,字节这步棋就真的活了。 


但现阶段,豆包还是别太急,与其单兵冒进,不如全行业坐下来,好好研究确立标准,达成互联互通的协议


在这场“AI原生系统”竞赛的开始,在技术快速迭代的同时,豆包仍更需要仔细打磨和做好隐私保护。在技术、用户体验和生态之间找到平衡点,同时思考怎样在巨头们的严密防守中撬开一道裂缝,才不至于会犯众怒”。


毕竟,技术是冰冷的,但社会是有血有肉的。当代码撞上人心、算法碰上信任,摩擦在所难免——而真正的创新,不在于跑得多快,而在于能否在摩擦中走出一条被接纳的路。


本文来自微信公众号:最话 FunTalk,作者:林书,编辑:杨磊

本内容由作者授权发布,观点仅代表作者本人,不代表虎嗅立场。
如对本稿件有异议或投诉,请联系 tougao@huxiu.com。
频道: 3C数码

支持一下

赞赏

0人已赞赏

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: