扫码打开虎嗅APP
本文来自微信公众号:硅星人Pro (ID:gh_c0bb185caa8d),作者:Jessica,题图来自:视觉中国
今天凌晨,谷歌在硅谷山景城总部举办了“Made by Google 2024”发布会。这场本该按惯例发生在10月的年度活动,据说是为了避开苹果9月推出新iPhone,特意被挪至夏天提前与公众见面。
正如传言那样,发布会上,谷歌新一代安卓旗舰手机Pixel 9、Pixel 9 Pro、Pixel 9 Pro XL和折叠屏版本Pixel 9 Pro Fold,连同Pixel Buds Pro 2无线耳机和Pixel Watch 3手表悉数亮相。
但除了硬件新品,谷歌的醉翁之意和全场最大主角仍然是无处不在的AI。
两个月前苹果官宣Apple Intelligence,iPhone 16系列作为即将完全适配并运行苹果AI的关键设备来势汹汹。OpenAI一天一个烟雾弹,从“Q项目”到“草莓”表情弄得人心惶惶。谷歌深知不能再等:一股脑推出安卓端全新升级的Gemini助手和十几个AI新功能,并且是即刻使用,绝非期货。
领导谷歌平台与设备团队的Rick Osterloh在演讲开场时似乎也背刺了一下某对手:
“有关AI的承诺太多了,‘即将推出’的口号也听得太多。今天我们要展示真实的进展,你将看到大量现场演示,包括全新Pixel产品、安卓功能和AI体验,而Gemini是这一切的核心——我们完全进入了Gemini时代。”
一、Gemini全新升级:可与更多应用交互,Gemini Live让你终于能体验“Her”了
谷歌设备端AI由其轻量级多模态模型Gemini Nano驱动,且已引进更灵活的Gemini 1.5 Flash。目前支持45种语言,覆盖200多个国家和地区,并能在数百种手机型号上运行。用户可以通过图片、视频或语音指令触发它来执行任务。
现在,智能助手Gemini能够与日历、任务、Google Keep、YouTube Music等更多应用联动。
例如碰巧看到Sabrina Carpenter演唱会海报,就可以打开Gemini拍张照片,询问“今年她来旧金山时我是否有空”。Gemini会从图片中提取相关信息,连接到日历并给出答案。
这里有一个好玩的小插曲,工作人员在展示这个示例时连遭两次失败,第三次提问Gemini才成功响应。不过也恰恰证明了一切都是现场真实测试而非作弊。Gemini在一片屏息凝神中终于回答出来后,全场掌声雷动。小哥也长舒一口气说“感谢demo之神”。
Gemini还可以理解屏幕上显示的内容。当对着美食探店vlog流口水时,直接指示Gemini“创建一个视频中博主吃的食物清单”,它就会连接到YouTube视频,从字幕中抓取出需要的信息,下次你也能照原样打卡了。
诸如此类的例子还有很多,像是设置定时提醒同步到“任务”、创建音乐播放列表、起草个性化邮件并用Gmail发送等。随着Gemini在更多日常应用之间协调工作,用户的生产生活效率也得到进一步提升。
而让这些体验变得更加流畅和智能的,就是谷歌正式推出的全新语音功能Gemini Live。
作为正面硬刚GPT-4o的语音选手,Gemini Live允许用户与Gemini进行最自然的实时互动。从陪伴模拟面试、练习口语、头脑风暴到任何沟通需求,Gemini Live都能提供真人般的聊天体验。你可以在对话过程中随时暂停、打断或改变主题,并且能在10种不同性别和个性的语音中根据喜好选择。
更令人兴奋的是,谷歌这回可比OpenAI痛快得多。
就在GPT-4o还藏着掖着仅给一小撮用户试用beta版时,谷歌大方宣布:从今天起就向所有付费用户开放Gemini Live英文安卓版访问权限,并将在未来几周内扩展到iOS和更多语言。
你别说,你还真别说!
二、超10项AI更新:自动通话摘要、截屏搜索、图像编辑、实时翻译
以Gemini模型为核心,谷歌还为Pixel设备更新了一大波独有的实用AI功能。
1. 新版天气应用:利用人工智能技术提升天气预报的精准度。能准确预测降雨的开始和结束时间,并生成个性化的天气报告,省去逐一查看各项数据的麻烦。
2. Call Notes:这个新推出的“通话笔记”功能会在通话结束后自动生成一份私密的对话摘要和详细记录。在遇到需要记录时间、地址等重要信息手边却没有纸笔时,只需开启Call Notes,所有文字记录就会保存在通话日志中。(为了保护隐私,该功能完全在本地设备运行,且开启时通话双方都会收到通知。)
3. Pixel Screenshots:大家都习惯手机截屏来保存信息,但需要时返回成百上千张截图里翻找也是个难题。这个新应用能帮助轻松保存、整理和查找截屏的信息。假设你有一张即将入住民宿的门禁密码截图,到达时却想不起来。打开Pixel Screenshots简单询问,它就能迅速帮你找到对应截屏,并提取图中文字信息。
4. Pixel Studio:一款新增的AI做图应用,由运行在Tensor G4芯片上的本地扩散模型和云端Imagen 3文本到图像模型共同驱动。能通过自然语言提示进行创意生成、风格调整和个人贴纸等功能。
Pixel手机的拍照和视频方面,也新增了两个AI驱动的亮眼新特性:
1. Add Me:这个“添加我”的功能很有意思!顾名思义,就是能把你包含到照片中。演示现场两名工作人员请出了NBA球星Jimmy Butler,打开相机滑到Add Me模式下,先是工作人员A跟Jimmy合照,然后在增强现实叠加指导下,再轮到工作人员B入画。结果就得到一张清晰的三人全身合影,而无需额外的摄影师了。
2. Magic Editor:利用生成式AI技术,用户可以在魔法编辑器里重新构想和编辑照片。比如扩大画幅、移动物体、更改背景,甚至圈选一小块区域要求“添加一个热气球”。
外加一个很可爱的Made You Look功能:家长们都知道给小娃娃拍照摆造型有多难,因此Pixel 9折叠机新增了一个“逗你笑”选项,允许他们在外屏上播放有趣的动画片段,吸引孩子的注意力。
继续围绕相机镜头,谷歌做了四项针对有特殊需求人群和场景的AI改进:
1. Guided Frame:专为视障人士或低视力人士设计,通过语音指导帮助用户拍摄出色的照片和自拍。最新更新提升了物体识别、群体照片中的智能面部过滤和复杂场景中的聚焦能力,并可以直接从相机设置中启用。
2. Magnifier:这是Pixel手机的独有应用,利用AI帮助低视力用户放大周围的世界。新功能包括在环境中搜索特定词汇、使用画中画模式查看场景细节、选择最佳镜头进行放大,以及启用自拍照光照功能作为镜子使用。
利用Magnifier识别菜单及机场信息牌
3. 实时转录双屏模式:专门针对可折叠手机推出的双屏模式,允许用户将手机置于桌面上,便于多人同时查看对话的实时转录。这对于会议或多人聚餐时的对话非常有帮助。
4. 实时字幕翻译:多语言支持,新增韩语、中文等七种语言翻译,扩大了实时字幕和实时转录的可用性,即使在没有网络连接的情况下也可以使用。
另外,在Pixel智能手表上,也添加了自动检测睡眠并启用睡眠模式、帮助用户规划跑步、反映跑步进度和提供每日跑步建议的新功能。并首创AI脉搏检测,结合Pixel Watch 3传感器、AI和信号处理算法,可检测心脏骤停、呼吸衰竭、服药过量等引发的脉搏消失事件。
最后,谷歌也透露了几项正在进行中,并将于不久后面世的项目:
一个是此前I/O大会上介绍过的Project Astra,通过摄像头展现周围环境与Gemini互动。它的实际应用将会首先在Gemini Live中落地,成为一个更具代理性质的全能AI助手。
另一个是Gemini Research。这项功能旨在帮助人们进行更高级的推理、规划和记忆,通过创建多步骤研究计划、整合来自网络的复杂信息,自动生成结构良好的研究报告。预计几个月内向高级用户推出,将大大提高研究效率,节省时间和精力。
三、四款Pixel 9手机、Buds Pro 2耳机、智能手表,谷歌凑齐AI硬件全家桶
以上所有AI功能,包括升级版Gemini助手和各种新鲜出炉的AI应用,都将集成到此次谷歌推出的AI硬件新产品中与消费者见面。
全系列特性和价格总结如下:
Pixel 9系列手机
谷歌发布了四款Pixel 9系列手机:Pixel 9、Pixel 9 Pro、Pixel 9 Pro XL和Pixel 9 Pro Fold。均搭载最新的Google Tensor G4芯片,支持各项AI性能增强。
图源:Sam Rutherford/Engadget
Pixel 9:6.3英寸Actua显示屏,12GB内存,后置50MP主摄像头和48MP超广角摄像头,前置10.5MP摄像头。起售价799美元,提供曜石黑、瓷白、冬青绿和牡丹粉四种颜色。
Pixel 9 Pro:6.3英寸Super Actua显示屏,16GB内存,前置42MP摄像头,后置三摄(50MP主摄、48MP超广角和48MP长焦)。起售价为999美元,提供曜石黑、瓷白、榛子色和玫瑰色。
Pixel 9 Pro XL:配备6.8英寸Super Actua显示屏,起售价1099美元,内存、设想配置和颜色选择都与Pro相同。
Pixel 9 Pro Fold:折叠版手机,拥有谷歌史上最大的手机显示屏,并且是最薄的可折叠手机。16GB内存,类似去年的Pixel Fold摄像配置。起售价1799美元。
四款手机都提供长达7年的操作系统和安全更新,增强了耐用性和用户体验。
Pixel Buds Pro 2无线耳机
谷歌推出新一代无线耳机,在音质和连接性方面有所提升,用户佩戴Pixel Buds Pro 2就可以无需手机与Gemini交谈。
Pixel Watch 3智能手表
提供两种尺寸(41毫米和45毫米),屏幕更大,集成了更多谷歌生态系统功能,如Nest摄像头和门铃视频流、Google TV遥控功能、离线Google Maps等。手表还提供AI驱动的锻炼建议,电池续航时间可达24小时,开启省电模式可延长至36小时。
总的来说,谷歌这次发布还是相当有诚意。
早在几天前,官方推特就在回复网友期待时说:“我们只是不想再藏了!”
今天不仅带来全新Pixel 9系列硬件产品,更重要的是展示了自家生成式AI技术的实际落地应用。从更智能的Gemini助手到各类提升日常便利的AI功能,谷歌显然想用行动打脸一些“期货选手”:AI不该只是口号,而是要深入到生活的方方面面,真正让用户在日常使用中享受到更高效、更智能的体验。
而抢在苹果秋季发布会前揭面,既能为自己争取更多新闻周期,同时也给Gemini助手改进提供更多时间窗。后续真实表现如何,就要看推向市场后的用户反馈了。
随着OpenAI近期人才流失、风评走低,谷歌或许真的已经准备好,全线加强安卓市场布局,和苹果打一场硬碰硬的翻身仗。