正确的提示信息

扫码打开虎嗅APP

从思考到创造
打开APP
搜索历史
删除
完成
全部删除
热搜词
2024-06-04 17:08

分体式AR“主机”接连推出,苹果会跟进吗?

数学家 Grothendieck 有句话, “构成一个研究者创造力和想象力的本质是他们聆听事物内部声音的能力”。


本文来自微信公众号:“AR研究媛”(ID:ar-supergirl),作者:研究媛,原文标题:《Rokid 和 XREAL 接连推出AR「主机」,苹果或跟进?》,题图来自:视觉中国

文章摘要
本文介绍了Rokid和XREAL接连推出的分体式AR“主机”,并探讨了苹果可能跟进的可能性。

• 💡 AR产品发展历史回顾,从索尼到苹果的技术演进和市场反馈

• 🔍 OST分体式设备与VST全程头显的不同之处和优势探讨

• 🚀 Rokid和XREAL的AR主机产品特点及其在消费级AR市场上的定位和挑战

一个有着30年开发历史的“新产品”,一代代推进关键技术,经历过充分的产品验证和选型试错,如果预想中的大规模使用场景迟迟未能实现,那证明这条路线可能存在某些根本性的障碍。


VST沉浸式头显,也许一开始就是错的。

 

一、先驱索尼

 

早在32年前的1992年,索尼就研发出了Sony Visortron,作为一种头戴式显示器(HMD),它搭载了早期的液晶显示器(LCD),图像质量在当时也算出类拔萃。 Sony Visortron可以作为电视“接收器”使用,它也强调“大屏”,拥有沉浸式观看体验,等效画幅约为在1.2米远处观看“33英寸电视”。 


Sony Visortron的产品定位和预想使用场景,与今天的VST头显类似,在当时就有日本航空公司采购,设想以“头戴私人影院”方式让乘客们消磨枯燥的长途旅行时光。 


Sony Visortron为萌芽中的“虚拟现实”概念提供了一个现实范例。随后开发者开始瞄准家庭场景,并且与今天的VR头显一样,在最具有商业潜力的游戏应用上尝试,甚至开始研发体感运动游戏所必需的全身追踪技术。然而,这些都是徒劳,厂商再怎么努力也无法让消费者对这类产品产生真正兴趣。 


比如著名的游戏机厂商SEGA在1993年研发的“Sega VR”最终流产。作为在20世纪90年代初开发的一款最终未发布的虚拟现实头戴设备,Sega VR仅在一些贸易展览和博览会上进行了公开展示,先是发布被推迟,在遇到开发问题后被彻底取消。在取消之前,至少有四款使用该硬件的游戏正在开发中。



从上世纪90年代开始,索尼就不断在HMD设备上推陈出新,比如1996年发布的Sony Glasstron系列,首款产品PLM-50拥有更加沉浸和便携的视频观看体验。


1998年,索尼又推出了第二代产品Sony Glasstron Lite系列,产品外观更加时尚小巧,升级到等效52英寸屏幕的画幅,还可以与当时索尼最新的DVD播放器和家用游戏机连接使用。


1999年,索尼推出了LDI-100B,该设备开始被应用于医疗可视化以及设计和建筑等领域,并且与虚拟现实可视化场景中的基本追踪技术结合使用。与当时昂贵的商业头戴式显示器相比,索尼提供了一种更具成本效益且更加轻便的HMD解决方案。 


随后,索尼又在3D显示和“摄像头透视”等产品特性上寻得灵感。经过持续不断的方案改进,2012年,索尼推出了HMZ-T1系列,达到了等效150英寸屏幕的画幅效果,紧接着又推出了第二代产品HMZ-T2,开始了早期的透视技术的研发。Sony HMZ-T2 Prototype-SR的正面中央有一个凸出摄像头,能够将所拍摄的现实世界的视频传输到头戴式显示器中,达成了现实意义上的混合现实体验。



二、VST头显的极致演绎和边缘物种OST分体式设备

 

VST路线的虚拟现实,30多年来的迭代有一条清晰的路径:


  • 超密集像素的OLED屏幕取代了LCD,空间分辨率越来越高


  • 光学透镜模组趋向复杂精密,近眼显示综合效果更加“干净”和“舒适”


  • 混合现实所必需的摄像头透视VST,关键的传感和画面延迟、畸变矫正算法、实时处理算力不断突破极限。



然而,塞进去的东西越多,追求的性能越极致,体积、重量、成本就越难平衡。


苹果的Vision Pro几乎触及了VST头显的光学、显示、传感器、算法算力、人机交互几乎所有关键特性的天花板,它的市场表现却让人失望。依靠摄像头来透视现实世界的混合现实在市场中遇冷,究竟是技术发展还不到位,硬件极限还远远未被挖掘,还是要归因于内容生态迟缓且碎片化,没有像PC那样形成标准体系? 


经历30年的发展和试错,强如苹果Vision Pro在全球刷屏,内容和应用生态还无法支持,销售也没有后劲。你很难不反思,VST产品路线的底层困难并未被完全洞察,或者,索尼、苹果这些大公司的产品路线,根本就是错的?


跟索尼在上世纪90年代时最初的设想类似,理想状态下,都认为机舱环境几乎是Apple Vision Pro这类VST头显的最佳使用场景,与在小桌板或者腿上打开电脑敲键盘,还要操心屏幕内容被邻座看见的体验相比,Apple Vision Pro提供的视线隔绝以及本身的超高清显示简直是革命性体验。Apple Vision Pro穿透视频超过人体可感知阈值的超低时延,也基本最小化了由此带来的眩晕和不适。


现实情况是,Apple Vision Pro并没有被看到在飞机旅行等场景中,得到大规模的普遍使用,因为只要使用频度和时间上来了,VST的摄像头透视不可避免就会令人晕动症发作,加之视觉辐辏冲突、高分辨率的超大FOV显示,很快就会让你感到眼睛不适,大脑疲劳。尝鲜几次很震撼,但基本不可能变成司空见惯的那种高频使用。


即使是最死忠的苹果粉,在家庭和其他消费场景的应用中,Vision Pro也很难避免“买回来不久就吃灰”的情况。


关键原因,可能就是之前研究文章《关于Apple Vision Pro的一些启发》所阐述的:


“ Apple Vision Pro 能否成为“空间显示器”,关键不在你采用了哪种先进面板,不在显示质量、分辨率,也不在刷新率,而是一个人体工学的问题,在于人类视觉的底层机制变成了阻碍。Vision Pro的R1再怎么强大,video数据流处理过程再怎么先进,画面延迟再低,用VST也无法解决运动状态下凝视画面,产生的耳蜗-前庭-眼球协调的问题。


只要看到的画面运动刷新和内耳检测到的旋转速度不一致,晕动症就或多或少会发生。解决方案似乎只有发展出真正的光学透视,天然的OST过程,光子打到视网膜转化为视觉神经信号传输到大脑,才能真正消灭延迟。  ”


面向未来的竞争高度不确定性,正确的产品形态是从试错得来的,而不是一开始就有标准答案。


VST一体式头显和OST的分体式设备,索尼和苹果持续几十年在不遗余力推进,后者是几乎被大公司过滤的简陋形态,但如果你仔细观察,充分体验过两种产品,不难发现,OST分体式设备有破坏性技术产品的种种征兆:


(1)一出现就带有明显的品质缺陷,无法被现有市场的主流产品客户认同,具有典型的灰天鹅特质。OST分体式设备的传感和人机交互处于“低维”,技术保守,并没有达到完全“混合现实”的那种高水准的虚实融合体验。


(2)由于无法被市场认同,所以很难在现有市场成功销售。其所应用的市场不可知,需要开发。消费级AR确实是目前被大公司看不上的边缘物种,中国只有Rokid、XREAL、雷鸟等几家在笨拙试错,市场规模也是肉眼可见的小,特别是相比VST一体机头显。


(3)开发出的市场初期规模不大,与现有的市场并不重合。


(4)产品利润率并不高,竞争可能还很激烈,企业创业失败的几率比较大。


Rokid AR Lite空间计算套装和XREAL最新发布的Beam Pro。两家都是采用BirdBath原理,只有20%左右透光的轻便AR眼镜被用作沉浸式大屏幕,进行3D显示。两家都是在空间中虚拟出一块“大屏”,做最基础的虚实融合,再搭配各自的AR“算力主机”,继承来自PC和手机的应用生态。


Rokid和XREAL的OST分体式设备,跟Apple Vision Pro在软硬件上完全不是一个档次的产物。Vision Pro豪华至极——4K分辨率的OLED硅基微显示屏,复杂的多模态传感器,分离传感器数据压缩延迟的专用芯片R1、桌面级的强大中央处理器M2、超级Pancake的定制光学模组,多年开发的画面矫正算法,推倒重来的全新体系的人机交互……


Vision Pro的硬件堆料做到了什么程度?仅传感器就配置了十几个,包括用于眼球追踪的红外相机,进行LiDAR SLAM的dToF雷达和深度相机,不同位置用于VST、超大范围精准手势识别或视觉SLAM(未确定)的高清摄像头。 


在Vision Pro身上,VST路线进行了彻底的硬件“暴力演绎”,未来的技术潜力几乎被榨干。但这真是用户想要的?索尼有几十年沉淀,苹果更表演出了极致,市场的反馈依然不乐观。


部分透光BirdBath原理的消费级AR眼镜和集成了传感sensor、算力芯片、电池的AR主机,组合在一起成为OST分体式设备。该思路是在当下技术条件下进行虚实融合时,在显示效果、成本、应用场景上进行的最大化妥协。


这样的“空间计算套装”,在移动轻办公和移动娱乐上是可以部分取代笔记本电脑、平板电脑、手机,如果硬件配置更高,功能还能进一步增强。以及,Rokid AR Lite和XREAL Beam Pro的“空间大屏”带来了场景、位置、身体姿态完全自由的虚拟3D大屏,几乎在任何场景都能获得巨幕观影、网页浏览、游戏娱乐的无碍畅快体验。


Rokid 和XREAL两家的不一样之处在于,Rokid AR Lite是用AR眼镜搭配一个可以进行“空间触控”交互操作的算力主机,重点在具备空间操作系统、人机交互上的低门槛和能够快速上手的特性,以及针对虚拟大屏的优化,比如简单拖拽就可当作“多联屏”使用,虚拟屏幕大小可调,还有巨幅画面显示运动防抖的特性。


XREAL跟Rokid一样,这一代AR眼镜基本不做硬件迭代,前几天发布的AR主机Beam Pro,重点在空间影像拍摄+3D显示中形成体验闭环,将有深度信息的空间影像的用户价值发挥到淋漓尽致。


XREAL Beam Pro相比Rokid AR Lite套装的Station 2主机,体积更大、更重,增加了一对间距较大的摄像头模拟双眼立体视觉,并且主机保留了实体显示屏,售价却出人意料地便宜。


XREAL Beam Pro针对空间操作系统的优化,人机交互体验在发布会上并未提及,乍一看就是一部不能打电话的“红米手机”。 


现在的消费级AR市场,在售价2万~3万重量600多克的一体机Vision Pro之外,还有售价三四千、AR眼镜只有70多克的OST分体式设备。空间计算除了走耗费人力物力铺就的大道,还有羊肠小径可以探索。 


从行业专家的口中得知,像Rokid和XREAL这样选择做AR主机,更多是出于现实考虑无奈的选择,手机大厂不开放硬件和系统权限,空间计算的整体系统、应用调用、跨设备人机交互是割裂且处处受限的,很难做针对性地深度优化。


但有趣的是,供应链和行业专家也在传,苹果或将推出光学透视的消费级AR眼镜,它可以连接自家iPhone充当“AR主机”,可能进行OST分体式设备形态的“试错”。 


OST路线的好处就是“穿透”,与外界的“连接”和“交流”是无延迟、信息充分透明的。相比VST全程以一个焦点凝视虚像,OST可以随意切换不同景深的自然景物,眼睛和大脑的疲劳能大大减轻。归根结底,消费者几乎不可能适应”以放大镜或者潜望镜为主要方式“去观察世界,VST的根本性障碍一直在那里。 


老调重弹也是预警:充满活力的技术驱动创业公司,在切换赛道时,是具备以小搏大的能力的。大公司傲慢、迟缓,不愿意左手搏右手,放弃已有巨大市场份额和利润的产品形态。在全新的产品形态还未体现出完全压倒性的竞争力时,会被内部掣肘、打击、否定,被不合适的流程和企业文化拖累。这时候创业公司的机会就来了。


就像《创新者的窘境》所描述的:


“ 就算经营最好的公司,尽管他们十分注意顾客需求和不断开发新技术,但都可能被破坏性创新所影响而导致失败,而覆灭的种子恰好是在领先企业全盛时埋下的。企业把自己的优点极大化后,没留余地让自己冒险。就是说他们仍然在追求“正确地做事”,而全然未意识到——它做的事可能已不正确了!最后在遇到破坏性技术变革和市场结构变化时,都成为一百分的输家。 ”


本文来自微信公众号:“AR研究媛”(ID:ar-supergirl),作者:研究媛

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
打开虎嗅APP,查看全文
频道:

支持一下

赞赏

0人已赞赏

大 家 都 在 看

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: