扫码打开虎嗅APP
本文来自微信公众号:APPSO (ID:appsolution),作者:莫崇宇,原文标题:《全球首款集成 GPT-4o 的智能眼镜来了,这会是下一个爆款吗?》,题图来自:视觉中国
在AI硬件频频翻车后,内置Llama大模型的智能眼镜Ray-Ban Meta,成了为数不多广受好评的一款产品,销量已经突破百万。
几乎没有意外,这个产品品类也迎来了更多玩家。最近,Solos发布了号称全球首款集成GPT-4o的智能眼镜AirGo Vision。
AirGo Vision预计将在今年晚些时候推出,除了同样内置当下最顶尖的AI大模型,它的基本素养更是有着与Ray-Ban Meta一较高下的潜力,我们从目前的演示中也找到了这款产品一些有趣的细节。
一、GPT-4o加持,AirGo Vision正式发布
1. GPT-4o集成
Solos公司在AI智能眼镜领域的探索并非始于AirGo Vision。早在CES 2024上,该公司就推出了嵌入ChatGPT的Solos AirGo 3智能眼镜。
而现在得益于GPT-4o的加持,AirGo Vision可以说是在它的前身基础上,增添了一双能够识别用户视野中物体并提供相关信息的“眼睛”。
设想一下,当你在旅游胜地漫步时,AirGo Vision能够即时识别出你眼前的地标,向你讲述它的历史背景;又或者当你迷路时,它能够给出具体的行走路线等等。
并且,AirGo Vision的多任务处理能力,让其在应对“这是啥?”“贵不贵”“哪里买更便宜”等灵魂三连问上游刃有余。
2. AI实时搜索功能上新
Solos的联合创始人Kenneth Fan曾表示,AirGo Vision的开发初衷是将尖端的AI技术带给每一位用户。
他强调,“我们最近还增加了实时搜索功能,以进一步提升AI的性能。我们相信,我们为消费者提供的是一个独特的、市场上没有其他产品可以比拟的全方位可穿戴AI平台。”
实时搜索功能的加入也预计让AirGo Vision如虎添翼。
用户只需长按眼镜框右侧镜腿上的虚拟按钮或在Solos的配套软件上敲入文字,即可连接ChatGPT等第三方服务获取天气、新闻、股票信息等实时信息。
此外,实时搜索功能还集成了上下文记忆功能,为你省去重复提问的尴尬,方便进一步深入查询。在货比三家的购物场景中,这项功能显得尤为有用。
例如,我们可以问它最好的吸尘器是什么,接着继续追问评价最好的吸尘器有哪些,以及最合适的价格是多少等。
就在两周前,Solos在另一款智能眼镜AirGo 3也上线了这一功能。根据外媒wifihifi的实测,该功能的响应速度很快,仅需几秒钟就能给出回复,并会贴心地提示“正在寻找答案中,请稍候”,仿佛有一个私人秘书随时待命,准备为你提供服务。
不过,说到虚拟按钮,那也得吐槽一下。用户需要在使用实时搜索功能的过程中,需要长按虚拟按钮,听到提示音后说出请求。
也就是说,明明说好的高科技,但AirGo 3并没有完全解放你的双手。因此,我们不妨期待后续能够添加一个物理按钮,以提供更加直观和便捷的操作体验。
还有,启用ChatGPT服务前,用户还得先在配套应用程序中手动启用SolosChat。但既然都掏出手机,直接搜一搜不香吗?倘若持续开启SolosChat,那更是堪称电量杀手。
3. AI实时翻译,主打无障碍翻译
Solos AirGo 3智能眼镜的实时翻译功能,也是靠ChatGPT的“东风”来实现的。
在接入GPT-4o后,AirGo Vision的实时翻译功能预计将支持超过50种不同的语言,覆盖全球大部分的语言群体,主打一个地球村无障碍翻译。
实时翻译功能捕捉眼镜所拾取的声音,并通过ChatGPT翻译成用户首选的语言,翻译后的语音会通过智能眼镜的内置扬声器播放。
Solos AirGo 3目前仅支持25种语言,但Mashable编辑在体验过后却赞不绝口,形容该功能为“金子般”的存在。
此外,除了GPT-4o,诸如Google Gemini和Anthropic的Claude等多模态AI模型也都在AirGo Vision考虑的范围之内。
这倒是与Apple Intelligence上的ChatGPT服务有些相似。AirGo Vision依然集成多模态AI,但具体选哪个,反而不太重要。
二、没有AI,AirGo Vision还值得期待吗?
1. 模块化设计
除了AI,AirGo Vision的设计同样有些细节值得关注。
它采用模块化设计,从休闲款式,到一体式运动型镜架,再到太阳镜,用户可以根据个人喜好和场合需求来更换不同样式的镜框。
考虑到隐私问题,用户可以自行决定是否拆卸装有摄像头的镜框。这种镜框的价格则定在了89美元至129美元之间,届时将在官网推出三款供消费者自由选购。
这也和Rabbit R1的兔子形象塑造如出一辙,以时尚、亲民的姿态融入到产品中,让AI技术变得更平易近人,更贴近用户的生活。
2. 能看也能说
即使在没有摄像头的情况下,AirGo Vision依然能够通过音频输入发挥AI功能。
在AirGo Vision尚未发布之前,AirGo 3一直被定义为一款由ChatGPT提供支持的音频智能眼镜。通过内置扬声器,用户可以使用智能眼镜来打电话,播放音乐等。
音量调节也很简单,你可以通过触摸传感器,向上或者向下滑动来调节音量,以适应听觉需求。
更重要的是,Solos AirGo 3提供高质量的空间音频,有三种声音模式可供选择(平衡、动态和放松),适用于不同类型的音乐。
在Mashable编辑看来,平衡声音模式听起来更悦耳,动态声音模式可能更适用于Hip-Hop,而放松声音模式则针对爵士乐和古典音乐进行了优化。
外媒XDA编辑使用Solos AirGo 3听完音乐时给出的评价是“很震惊”。
3. 无声胜有声的LED通知灯
在嘈杂环境下,佩戴AirGo Vision的用户极有可能错过通知。鉴于此,AirGo Vision还内置了LED通知灯,通过轻微的闪光提示新通知,当然用户也可以选择声音或震动提醒。
只不过,对于听力有障碍的用户来说,这种视觉提醒也通知到位,无声胜有声,这份关怀也足够温暖人心。
作为参考,我们还可以从Solos AirGo 3身上预测到AirGo Vision一些基础配置的影子。
约为34克(不含镜片),支持USB-C充电
支持10小时的音乐播放或7小时的通话时间
IP67防水等级,能在雨中或运动时佩戴
支持处方镜片,适用于时尚、运动和日常佩戴
AirGo Vision智能眼镜预计将在今年晚些时候发售,具体售价尚未公布,但参考现款Solos AirGo 3智能眼镜售价为249.99美元,新款预计不会低于该价格。
三、智能眼镜凭什么在AI硬件中脱颖而出
在当下生成式AI硬件市场中,Ray-Ban Meta已经提前掀起了一股热潮。
第三方数据显示,Ray-Ban Meta在发布两年后,销量已经突破百万大关,而在The Verge等外媒的渲染下,AirGo Vision智能眼镜更是被视为Ray-Ban Meta的最大竞争对手。
在多模态AI的集成上,AirGo Vision搭载了OpenAI最新的GPT-4o,并且还有望支持Gemini以及Claude等模型,这种生态开放的灵活性也是仅限于单一Llama模型所难以企及的。
然而,技术的进步往往伴随着成本的考量。依赖于Meta自家技术的Ray-Ban Meta智能眼镜能够有效控制成本。
相较之下,AirGo Vision是否会像Ai Pin一样收取额外的订阅费用,目前官方尚未明确表态,这也无疑再添一笔悬念。
在产品定位上,AirGo Vision瞄准了Ray-Ban Meta。参考Solos AirGo 3售价249.99美元,预计AirGo Vision只会更高,至少不会比这数字更低。
Ray-Ban Meta智能眼镜的起售价为299美元,定位中高端市场。这也意味着两者在价格上的竞争将异常激烈。
Meta在智能眼镜领域已经建立了一定的市场基础,并且,Ray-Ban Meta最近上新的三分钟录制视频功能狠狠秀了波“肌肉”。而缺乏视频录制功能的AirGo Vision能否在这方面迎头赶上,还有待检验。
就在不久前,Meta创始人马克·扎克伯格在接受采访时曾放言:
如果我们只采用今天最好的眼镜形式因素,我们能在不影响形式因素、重量等方面的情况下,塞进多少技术。这就是我们得到的Ray-Ban Meta。
尽管扎克伯格的这番话不免带有一丝自吹自擂的色彩,但不可否认的是,Ray-Ban Meta确实把软硬件整得严丝合缝,实力也摆在那儿。
因此,我们更加期待AirGo Vision能够超越简单的拿来主义,不仅仅是将GPT-4o草率地嵌入到眼镜之中,而是以一种更加深入和创新的方式,将技术与设计完美融合,打造出真正与众不同的产品。
如果说这两者的鹿死谁手尚且是个未知数,但消费者对智能眼镜直线飙升的兴趣却是板上钉钉。
知名市场研究机构IDC预测,全球智能眼镜出货量到2025年将增长到700万台,年均增长率超过30%,足够反映出消费者挡不住的热情。
不过Ray-Ban Meta也并非一款革命性的产品,它仅有的几个与大模型结合的功能在其他设备上也已经不新鲜,但正是这些小功能让智能眼镜有了高频的实用场景,且建立在几乎不用牺牲佩戴体验和增加学习成本的基础上。
用户并非天然抗拒新鲜事物,而是在乎这个产品能不能满足我的需求,或者提升原有产品的体验,并衡量这个体验的增值和随之增加的成本是否匹配。
由此来看,之前多款AI硬件折戟沉沙就不难理解,因为其本身还有很强的实验性质,适合尝鲜而非常用。而像Vision Pro这样的产品带来的体验增值非常明显,但在成本匹配上显然没有形成共识。
大模型加持的智能眼镜则是一个取得较好平衡的品类,AirGo Vision也是奔着这个方向来设计的。
论实用性,AirGo Vision并非意欲颠覆手机的地位,而是在于如何以更优雅的姿态,通过优化操作流程,为用户提供更加便捷的体验。
对于视障人士而言,AirGo Vision甚至可以成为他们识别周围环境,“观察”整个世界的刚需工具,其便捷性和准确性远超手机。
论便携性,无需额外在裤兜塞多一块AI硬件,或者让原本的眼镜增加很多的重量,这与一副眼镜的佩戴体感没太大区别。
而在与ChatGPT的集成上,AirGo Vision整体的效果预计谈不上好,甚至有些草台班子的“潦草”,但作为全球首款搭载GPT-4o的AI智能眼镜,其意义或许更多在于为AI智能眼镜的后来者铺路。
回想十年前,入局的Google Glass虽然最终并未在市场上取得成功,但上至科技发烧友,下至普通路人,直到现在也都坚信着这副已经失败的Google Glass真的很酷,包括Google也传出有计划结合AI重新开发Google Glass。
AirGo Vision也是在相同的憧憬中诞生,即搭载大模型的AI智能眼镜将会戴在更多人的脸上。
本文来自微信公众号:APPSO (ID:appsolution),作者:莫崇宇