扫码打开虎嗅APP
本文来自微信公众号: 第一新声 ,作者:竹心
2月25日,谷歌正式宣布对其安卓操作系统上的Gemini人工智能功能进行一系列重磅更新,其中最引人注目的是新增了利用AI处理多步骤任务的能力。
这意味着Gemini不再只是回答问题的“语音助手”,而是开始向能够自主执行任务的“私人助理”演进。从叫Uber到订餐,从管理待办事项到实时监控进度,Gemini试图重新定义人与手机的交互方式。
但这场被谷歌称为“突破”的更新,在中国市场看来却有些姗姗来迟。当谷歌还在为Pixel 10和三星Galaxy S26用户测试“帮我订一份披萨并叫车”的多步骤任务自动化时,中国数亿用户早已习惯了“一句话点外卖”的日常。
更耐人寻味的是,谷歌谨慎地将这项功能限定在部分设备和地区——最初仅支持Pixel 10、Pixel 10 Pro和三星Galaxy S26系列,且只在美国和韩国推出。这种小心翼翼的背后,既是对AI自动化安全风险的审慎态度,也可能隐含着对市场接受度的不确定。
01
有限场景下的无限可能
谷歌官方对这项自动化功能的描述简洁而克制:允许用户将待办事项清单交给Gemini处理。
但实际上,这一句话背后是复杂的技术架构和精心设计的应用场景。
目前处于测试阶段的功能,最初将支持食品、杂货和共享出行三大类别中的部分应用程序。这意味着你可以告诉Gemini“帮我订一份披萨并叫车去公司”,AI会自动完成打开外卖应用、选择餐厅、下单支付,然后调用打车软件、设定目的地、确认叫车这一系列操作。

更值得关注的是谷歌为这项功能设置的安全保护机制。
在AI自动化可能引发隐私和安全担忧的当下,谷歌采取了多重防护措施:首先,没有设备所有者的明确指令,自动化操作无法启动;其次,在运行过程中,用户可以实时查看任务进度,并在出现错误或卡住时随时停止任务;第三,这些自动化操作在手机上的一个安全虚拟窗口中运行,只能访问有限的应用程序,而无法触及设备上的其他敏感数据。
这种“有限开放”的策略体现了谷歌在AI创新与用户安全之间的平衡智慧,但也折射出西方科技公司在AI应用落地上的保守态度。谷歌并非在创造一个能够完全自主行动的AI,而是在构建一个在严格框架内高效协作的智能工具。相比之下,中国AI企业更倾向于“先跑起来,再优化”的实践哲学。
除了多步骤任务自动化,Gemini的此次更新还包括两项重要改进:扩展的电话检测功能将在美国三星Galaxy S26系列设备上推出;谷歌也正在使用其Gemini设备端模型检测不良短信。
同时,“圈选搜索”功能现在可以搜索手机屏幕上显示的所有内容,而不仅仅是单个物体,这体现了Gemini在多模态理解能力上的进化。

02
中国“日常化”与西方“实验室化”
Gemini的此次更新是整个AI行业向任务自动化纵深发展的一个缩影。
但仔细观察全球布局,会发现一个有趣的分野:当OpenAI的ChatGPT还在让用户创建“可按计划运行的任务”,Anthropic的Cowork还在专注于“非编码任务自动化”时,中国的AI应用已经跑出了实验室,进入了数亿用户的日常生活。
在中国市场,AI自动化不是“未来趋势”,而是“当下日常”。
字节跳动推出的豆包手机直接将大模型深度集成到手机操作系统,用户可以通过一句“帮我订餐、打车、购物”完成多步骤操作。阿里云的通义千问通过与外卖平台、电商平台深度合作,实现了真正的“一句话点外卖”——用户只需说“帮我点一杯奶茶”,AI就会自动确认你的位置、匹配最优惠的券、推荐合适的店铺和产品,用户只需完成支付,AI就会将预计送达时间精准推送到用户手机,省去了大量时间。
更值得注意的是,这种“日常化”不仅体现在消费场景。百度文心一言在智能家居控制上的应用已经覆盖数万家庭,腾讯混元在办公流程优化上服务了多家企业。中国AI企业探索的是一条从生活场景到生产场景的完整自动化路径。
相比之下,西方AI自动化更多还停留在“实验室化”阶段。
OpenAI的ChatGPT任务创建需要复杂设置,Anthropic的Cowork主要面向开发者群体,谷歌Gemini的更新则被严格限定在特定设备和地区。
这种差异背后,是发展路径的根本不同:中国AI追求“快速落地、快速迭代”,西方AI更注重“安全可控、技术完善”。
这些案例共同指向一个明确趋势:AI正在从“信息处理器”向“任务执行者”转型,从解决“是什么”的问题转向解决“怎么做”的问题。但转型的速度和深度,中国市场明显领先一个身位。
与此同时,苹果的AI布局显得更加滞后。尽管一直在努力推出更全面的AI功能集,其中包括AI驱动的Siri,但该功能的发布日期最近再次推迟到今年晚些时候。这种时间差不仅给谷歌在移动AI领域创造了宝贵窗口期,更让中国AI企业有机会从“追赶者”转变为“定义者”。
03
生态竞赛与用户习惯的全球分化
Gemini的这次更新将加剧全球AI市场的生态竞赛,但不同市场的竞争态势已经出现明显分化。
在西方市场,谷歌通过将最先进的AI功能优先提供给Pixel和三星旗舰机型,正在构建一个以AI能力为核心的设备分级体系。未来,用户选择手机时,“AI助理能做什么”可能成为与“摄像头像素多少”同等重要的考量因素。这种策略有望在高端市场建立护城河,但可能加剧数字鸿沟。
相比之下,中国市场已经形成了更加普惠的AI生态。从高端旗舰机到千元入门机,各类设备都能提供基础的AI自动化服务。这种普惠策略不仅加速了AI技术的普及,也让“一句话订餐”成为了全民级的日常体验。
在应用生态层面,当谷歌还在思考“传统应用如何为AI提供标准化接口”时,中国的应用生态已经完成了第一轮重构。外卖平台、电商应用、出行服务都深度集成了AI能力,形成了“AI原生”的应用体验。这种深度集成不仅提升了效率,更创造了新的商业模式——例如,AI可以根据用户的消费习惯主动推荐优惠组合,实现平台、商家、用户的三方共赢。
用户习惯的改变更加深刻。在中国,过去三年间,用户使用“打开应用-点击操作”模式的比例大幅下降,而使用“语音指令-AI执行”模式的比例则显著上升。这种转变不仅重新定义了“效率”的含义——从操作速度的快慢转向从意图到结果的距离长短——更重塑了人机交互的底层逻辑。
展望未来,Gemini的这次更新可能只是AI自动化浪潮的一个节点。
随着技术成熟和用户接受度提高,我们有理由相信,AI将逐渐承担更多日常生活中的重复性任务,让人类更专注于创造性和决策性工作。但这条道路需要技术创新者、政策制定者、社会公众的共同努力,确保技术进步真正服务于人,而非替代于人。
谷歌Gemini的这次更新,与其说是“开创者”,不如说是“追赶者”。它追赶的不仅是中国AI的技术应用速度,更是中国在AI与生活场景深度融合上的创新实践。在比拼AI实际应用能力这条赛道上,中国AI企业凭借对本地市场的深度理解和快速迭代能力,已经建立了显著优势。
未来的人机关系演进,将不再由单一巨头定义,而是由全球不同市场的创新实践共同塑造。而中国,正在这个历史进程中,从追随者转变为定义者。