2026-02-26 13:37

Gemini在安卓端学会“自主行动”，中国已跑出“一句话订餐”日常

第一新声

速览

本文来自微信公众号：第一新声，作者：竹心

2月25日，谷歌正式宣布对其安卓操作系统上的Gemini人工智能功能进行一系列重磅更新，其中最引人注目的是新增了利用AI处理多步骤任务的能力。

这意味着Gemini不再只是回答问题的“语音助手”，而是开始向能够自主执行任务的“私人助理”演进。从叫Uber到订餐，从管理待办事项到实时监控进度，Gemini试图重新定义人与手机的交互方式。

但这场被谷歌称为“突破”的更新，在中国市场看来却有些姗姗来迟。当谷歌还在为Pixel 10和三星Galaxy S26用户测试“帮我订一份披萨并叫车”的多步骤任务自动化时，中国数亿用户早已习惯了“一句话点外卖”的日常。

更耐人寻味的是，谷歌谨慎地将这项功能限定在部分设备和地区——最初仅支持Pixel 10、Pixel 10 Pro和三星Galaxy S26系列，且只在美国和韩国推出。这种小心翼翼的背后，既是对AI自动化安全风险的审慎态度，也可能隐含着对市场接受度的不确定。

01 有限场景下的无限可能

谷歌官方对这项自动化功能的描述简洁而克制：允许用户将待办事项清单交给Gemini处理。

但实际上，这一句话背后是复杂的技术架构和精心设计的应用场景。

目前处于测试阶段的功能，最初将支持食品、杂货和共享出行三大类别中的部分应用程序。这意味着你可以告诉Gemini“帮我订一份披萨并叫车去公司”，AI会自动完成打开外卖应用、选择餐厅、下单支付，然后调用打车软件、设定目的地、确认叫车这一系列操作。

更值得关注的是谷歌为这项功能设置的安全保护机制。

在AI自动化可能引发隐私和安全担忧的当下，谷歌采取了多重防护措施：首先，没有设备所有者的明确指令，自动化操作无法启动；其次，在运行过程中，用户可以实时查看任务进度，并在出现错误或卡住时随时停止任务；第三，这些自动化操作在手机上的一个安全虚拟窗口中运行，只能访问有限的应用程序，而无法触及设备上的其他敏感数据。

这种“有限开放”的策略体现了谷歌在AI创新与用户安全之间的平衡智慧，但也折射出西方科技公司在AI应用落地上的保守态度。谷歌并非在创造一个能够完全自主行动的AI，而是在构建一个在严格框架内高效协作的智能工具。相比之下，中国AI企业更倾向于“先跑起来，再优化”的实践哲学。

除了多步骤任务自动化，Gemini的此次更新还包括两项重要改进：扩展的电话检测功能将在美国三星Galaxy S26系列设备上推出；谷歌也正在使用其Gemini设备端模型检测不良短信。

同时，“圈选搜索”功能现在可以搜索手机屏幕上显示的所有内容，而不仅仅是单个物体，这体现了Gemini在多模态理解能力上的进化。

02 中国“日常化”与西方“实验室化”

Gemini的此次更新是整个AI行业向任务自动化纵深发展的一个缩影。

但仔细观察全球布局，会发现一个有趣的分野：当OpenAI的ChatGPT还在让用户创建“可按计划运行的任务”，Anthropic的Cowork还在专注于“非编码任务自动化”时，中国的AI应用已经跑出了实验室，进入了数亿用户的日常生活。

在中国市场，AI自动化不是“未来趋势”，而是“当下日常”。

字节跳动推出的豆包手机直接将大模型深度集成到手机操作系统，用户可以通过一句“帮我订餐、打车、购物”完成多步骤操作。阿里云的通义千问通过与外卖平台、电商平台深度合作，实现了真正的“一句话点外卖”——用户只需说“帮我点一杯奶茶”，AI就会自动确认你的位置、匹配最优惠的券、推荐合适的店铺和产品，用户只需完成支付，AI就会将预计送达时间精准推送到用户手机，省去了大量时间。

更值得注意的是，这种“日常化”不仅体现在消费场景。百度文心一言在智能家居控制上的应用已经覆盖数万家庭，腾讯混元在办公流程优化上服务了多家企业。中国AI企业探索的是一条从生活场景到生产场景的完整自动化路径。

相比之下，西方AI自动化更多还停留在“实验室化”阶段。

OpenAI的ChatGPT任务创建需要复杂设置，Anthropic的Cowork主要面向开发者群体，谷歌Gemini的更新则被严格限定在特定设备和地区。

这种差异背后，是发展路径的根本不同：中国AI追求“快速落地、快速迭代”，西方AI更注重“安全可控、技术完善”。

这些案例共同指向一个明确趋势：AI正在从“信息处理器”向“任务执行者”转型，从解决“是什么”的问题转向解决“怎么做”的问题。但转型的速度和深度，中国市场明显领先一个身位。

与此同时，苹果的AI布局显得更加滞后。尽管一直在努力推出更全面的AI功能集，其中包括AI驱动的Siri，但该功能的发布日期最近再次推迟到今年晚些时候。这种时间差不仅给谷歌在移动AI领域创造了宝贵窗口期，更让中国AI企业有机会从“追赶者”转变为“定义者”。

03 生态竞赛与用户习惯的全球分化

Gemini的这次更新将加剧全球AI市场的生态竞赛，但不同市场的竞争态势已经出现明显分化。

在西方市场，谷歌通过将最先进的AI功能优先提供给Pixel和三星旗舰机型，正在构建一个以AI能力为核心的设备分级体系。未来，用户选择手机时，“AI助理能做什么”可能成为与“摄像头像素多少”同等重要的考量因素。这种策略有望在高端市场建立护城河，但可能加剧数字鸿沟。

相比之下，中国市场已经形成了更加普惠的AI生态。从高端旗舰机到千元入门机，各类设备都能提供基础的AI自动化服务。这种普惠策略不仅加速了AI技术的普及，也让“一句话订餐”成为了全民级的日常体验。

在应用生态层面，当谷歌还在思考“传统应用如何为AI提供标准化接口”时，中国的应用生态已经完成了第一轮重构。外卖平台、电商应用、出行服务都深度集成了AI能力，形成了“AI原生”的应用体验。这种深度集成不仅提升了效率，更创造了新的商业模式——例如，AI可以根据用户的消费习惯主动推荐优惠组合，实现平台、商家、用户的三方共赢。

用户习惯的改变更加深刻。在中国，过去三年间，用户使用“打开应用-点击操作”模式的比例大幅下降，而使用“语音指令-AI执行”模式的比例则显著上升。这种转变不仅重新定义了“效率”的含义——从操作速度的快慢转向从意图到结果的距离长短——更重塑了人机交互的底层逻辑。

展望未来，Gemini的这次更新可能只是AI自动化浪潮的一个节点。

随着技术成熟和用户接受度提高，我们有理由相信，AI将逐渐承担更多日常生活中的重复性任务，让人类更专注于创造性和决策性工作。但这条道路需要技术创新者、政策制定者、社会公众的共同努力，确保技术进步真正服务于人，而非替代于人。

谷歌Gemini的这次更新，与其说是“开创者”，不如说是“追赶者”。它追赶的不仅是中国AI的技术应用速度，更是中国在AI与生活场景深度融合上的创新实践。在比拼AI实际应用能力这条赛道上，中国AI企业凭借对本地市场的深度理解和快速迭代能力，已经建立了显著优势。

未来的人机关系演进，将不再由单一巨头定义，而是由全球不同市场的创新实践共同塑造。而中国，正在这个历史进程中，从追随者转变为定义者。

本内容来源于网络原文链接，观点仅代表作者本人，不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com，我们将及时核实并处理。

AI原生产品日报

频道：前沿科技