扫码打开虎嗅APP
本文来自微信公众号: 决明子 ,作者:决明子,原文标题:《如何评价荣耀 MWC 发布的机器人手机 Robot Phone,它为手机行业带来了哪些实质性革新?》
大疆的Pocket3全生命周期大概卖了1000多万台。(大概是半年前的数据,现在估计1500万台都有可能)
这个成绩可以说超越了所有的国产旗舰手机的销量。
为什么?
画质很好吗?不是,你就是一个等效20 mm,1英寸的主摄,在此之前,手机通常也可以实现1英寸,甚至使用更好的CMOS。
另外一个佐证的点就是,当时我们认为那个有很多问题的的Pocket一代,它的销量也超过了千万。
是因为防抖码?也不是,现在的智能手机,怎么说呢?只要你不是剧烈运动,它的防抖处理都是特别优秀的。

它的最大意义在于解放生产力,他帮你省了一个人。
有时候会做视频,需要一些第三视角拍摄我操作的视频。必须得反复确认机位,或者还得请一个人帮我拍,而现在这个焦虑是不存在的。
所以你问我,我手头这么多相机,佳能、索尼、富士都有,哪一个相机的使用频率最高?除了手机之外,就是Pocket。
它彻底终结了那种『为了让别人看见我,我必须傻站着不动』的局面。
咱就说最常见的场景,你在家一边刷碗或者揉面,一边给对象打视频电话。
以前你得先找个老干妈罐子或者酱油瓶把手机靠住,还得小心翼翼调个角度,生怕手机滑了。结果你稍微往水池旁边挪两步,对方就只能看见你的半边肩膀或者家里的抽油烟机。
有了这个会转头的镜头,情况就变了。
你满屋子溜达着找抹布,这手机镜头就跟家里养的猫一样,眼珠子滴溜溜转着盯着你。你不用再迁就手机的摆放位置,而是手机在迁就你的位移。
这就是所谓的具身智能在现实里的样子,它头一回让手机有了空间感。
再比如你一个人录个开箱视频,或者录一段健身操。
以前你得反复确认自己是不是出圈了,得在地上贴胶带标记位置。
现在这机器摆在那,它能自己识别你这个主体。你做深蹲的时候它往下压,你跳起来它往上抬。它其实是把『摄影师』这个角色给裁员了,直接塞进了一个几毫米的电机里。
把这个东西夹在手机上,叫做什么?叫做主观能动性。
除了拍摄之外,在协作上也有一个应用。
你跟同事开视频会,想给对方展示一下桌上的图纸或者是产品样机。以前你得费劲巴拉地把整个手机反过来。
现在倒好,你只要下个指令,镜头自己翻转过来往下看,甚至能顺着你手指的方向聚焦。它让手机从一个只能看脸的镜子,变成了一个能共享视角的第三只眼。
我觉得荣耀这次其实是在试探一种新的人机边界。
它不再满足于让你盯着屏幕看,而是想让手机像个跟屁虫一样盯着你瞧。这种实质性的革新,就在于它把手机从一个『接收信息的盒子』变成了一个『有反应的实体』。
可能有人又问了,那我买个Pocket再加个手机的事情,除了可以减少一个设备之外,还有什么优点?
这事儿最核心的区别,根本不在那个云台电机上,而在那颗顶级的手机芯片。
也就是算力。
说白了,Pocket这种产品,它的脑子很小。它所谓的『跟踪』,其实是极其原始的视觉对比,就是盯着一块色块在挪动。你穿个跟背景差不多的衣服,或者稍微跑快点,它的云台就容易『丢人』,在那儿空转。
手机就不一样了。荣耀这次是把几十个T的算力直接怼到了镜头转轴上。
你试想一个细节,你在厨房里一边看菜谱一边切菜。
要是Pocket,它只会死死地把你的脸对着屏幕中心,像个呆头呆脑的监视器。但Robot Phone加了算力之后,它能『看懂』你在干嘛。
当它通过视觉模型发现你拿起了菜刀,镜头会自动往下压,聚焦在砧板上。当你把锅端起来,它知道你要倒菜了,它会自动拉个远景,甚至帮你把火光的动态范围给调好。这不再是简单的物理跟随,而是一种基于语义理解的『运镜』。

这就好比Pocket是个只会听指令转头的保镖,而Robot Phone变成了一个带脑子的摄影师。
这种算力上的代差,直接导致了两者的生存逻辑完全不同。
Pocket只能在那儿干录像这一件事。但手机是有NPU的,它能一边转头盯着你,一边把你的语音实时翻译成字幕,甚至还能顺便给你磨个皮。
或者我们还可以再大胆地考虑一下,如果这个结构可以做成热插拔的,不再局限于摄像头,把它换成一个小型的机械臂或者别的什么东西,是不是会有更大的想象空间呢?这也就是荣耀给它起名为Robot的那个名字的原因。
更重要的是,如果由手机厂商来介入,那么竞争一定会变得更加激烈。所以之后我们应该会看到更多有趣的产品出现,毫无疑问,荣耀开了一个好头。