扫码打开虎嗅APP

搜索历史
删除
完成
全部删除
热搜词
2026-01-11 13:57

求求你们别用手了,直接塞进去不好吗?

本文来自微信公众号: 决明子 ,作者:决明子


标题党了,别想歪,今天我们讨论具身智能


假如现在我们的具身智能特别成熟,我让一个人形机器人去洗衣服。


它可以怎么做?它可以把洗衣粉撒在衣服上,然后蘸水,然后用它的机械臂以及5个手指去揉搓。


它还可以拿起衣服扔进洗衣机里边,然后按下洗衣机的开关。


配图由AI生成。


如果洗衣机在机器人之后发明,那么第一种状况是有可能出现的,如果洗衣如果相反,就是第二种。


第一种和第二种哪个好呢,或者说更有效率?


答案不言而喻。


就使得我们不得不思考我们一些司空见惯的行为,我们必须把它得分离开。


这里的分离,并不是说我离开你,核心在于把「目的」、「决策」和「执行」彻底拆开;


模仿人类动作去揉搓衣服的机器人,太蠢了。本质上这是一个名为「拟人化」的技术陷阱。


我们造机器人是为了解决问题,从来都不是为了造一个铁皮人来扮演自己。人类的手指是进化的奇迹,能弹钢琴也能穿针引线,但拿来洗衣服,效率绝对比不上滚筒洗衣机。


如果非要让机器人用手洗,我称之为有病。


但这里必须先说清楚一件事:分离并不是万能钥匙。


在某些场景下,『拟人』并非低效,而是必须。


陪伴、护理、安抚——在这些场景里,结果并非唯一目标,过程本身就是价值的一部分。


再比如灾难救援。那里没有提前铺设好的接口,没有标准化的执行端,环境是不可预期的。在这种情况下,一个能临时像人一样翻越废墟、拧开阀门的通用形态,反而是一种现实妥协。


拟人不是终极形态,而是接口尚未被重构完成之前,不得不走的一条路。


我们现在的智能家居就走在第二条路上,只是很多人没意识到,你不需要一个管家模样的机器人走来帮你关灯,智能音箱接收指令,电流直接切断,这就是分离。


指令的发出者是那个无处不在的AI大脑,而执行者是墙里那个不起眼的网关。


事实上,真正起作用的分离,并不只发生在这一层,至少三层。


第一层,是目的与手段的分离。


洗衣的目的是清洁,而不是搓揉;


飞行的目的是升力与位移,而不是振动翅膀。


第二层,是智能与载体的分离。


我们总认为智能必须住在一个身体里。仿佛没有脸、没有手的系统,就不配被称为智能。但事实上,真正高效的决策,往往并不需要任何形态。毕竟金刚经里都说了:


凡所有相,皆是虚妄。若见诸相非相,即见如来


第三层,也是最困难的一层,是最优解与可理解性的分离。


人类习惯把『我能理解』当成『这是对的』,却忽略了理解本身,理解是什么?只是我们算力有限、感官有限的一种错觉。


举个例子,很多人不理解微积分,不是说微积分是错的,而是他太蠢了,但你无可否认的是,微积分是最有效的解决问题的工具。


这种分离带来的好处是颠覆性的。


如果把洗衣服这件事彻底分离,未来的机器人根本不需要长手。


它只需拥有一个超级大脑,连接着家里的洗衣机、洗碗机、扫地机。当它判定衣服该洗了,便直接向洗衣机下达预洗指令,整个过程,没有一只『手』参与其中。


这时你再看,那个站在水池边搓衣服的机器人,就显得格外滑稽。


它用着最昂贵的算力,用这动着最精密的伺服电机,却干着几百块钱电机就能胜任的粗活。


我们对人形机器人的迷恋,某种程度上扼杀了想象力。这背后,其实就是自恋:我们总下意识地认为,人类的行为模式是宇宙的真理标准,机器模仿得越像人,技术就越高级。


人类的进化史,本质上是一部在生存压力下缝缝补补的「屎山代码」。


我们的身体结构、行为逻辑,大多是为了适应数万年前在非洲草原的生存而形成的临时方案,绝非解决现代问题的最优解。


你看鸟飞得好,人类最初想上天,也是学鸟,做个翅膀绑在手臂上扑腾,结果摔得稀巴烂,直到莱特兄弟想明白了,把「飞行」这个目的,和「像鸟一样扑腾」这个形式彻底分离。固定翼加螺旋桨,这东西一点也不像鸟,但它飞得比任何鸟都高都快都远。


如果坚持以生物逻辑定义飞行,我们至今还在悬崖边练习拍胳膊。摔死的没有1000,也有800了。


既然如此,为什么现在马斯克、波士顿动力这些顶级玩家,还在砸钱死磕人形机器人?难道他们不懂效率吗?


这就引出了分离理论中必须面对的现实博弈:「存量世界」。


我们的世界,楼梯的宽度、门把手的高度、全都是基于「人类肉体」这个标准制定的。如果我们要改造当前这个世界,不说存量的人类能不能答应,这个基建成本高到无法想象。


所以在过渡期,人形机器人不是为了模仿人,而是为了适配这个充满人类痕迹的旧世界吗,它是一个万能转接头。


反正我现在越来越理解为什么电影反派有一个美好的梦想,但是他要做的第一步就是灭绝人类了,因为这是最快也最有效的办法。


但请记住,适配器永远只是过渡。如果你是00后,那么你大概率不知道万能充这种东西。


历史的巧合,往往被我们误认为真理。


键盘上的QWERTY布局,本是为了降低老式打字机的打字速度、防止卡键的『减速补丁』。


到了没有任何机械连杆的触屏时代,我们竟将这个布局原封不动地搬了上去,仅仅因为『习惯』。


航天飞机的轨道宽度竟然是罗马时期两匹马屁股之间的宽度。


历史留下来的接口,并不只是习惯,它们更像一笔长期滚存、却从未结算的技术债。每一次让AI学习人类的旧流程,都是在把这笔债务重新打包、再融资、再延长。


人类为了弥补身体缺陷而发明的工具,在被机器无差别继承之后,反而成了新的枷锁。


比如开车,人类需要三面后视镜,只因眼睛长在前面,脖子转动角度有限。为了弥补缺陷,我们发明了后视镜。


而有些自动驾驶研发,他们所做的事情,像是在在拼命训练AI『看』后视镜——这简直是把人类的缺陷,当成了智能开发的圣经。


真正的智能逻辑,应是360度的感知覆盖,本就不存在『后方盲区』,何需『看后视镜』这个动作?


或者说,当所有的载具都介入系统之后,感知这个行为也是不需要存在的。


将人类因肉体限制而养成的习惯,强行灌输给没有实体束缚的AI,这不叫智能,这叫把进化的弯路,用硅基生命重走一遍。


再往深处挖掘,甚至连我们引以为傲的思维逻辑本身,都可能是一个需要被分离的『补丁』。


还记得AlphaGo对战李世石时,那震惊世界的『第37手』么?


那步棋在人类数千年的围棋理论中,堪称『臭棋』,完全违背人类的『棋理』。结果,正是这反直觉的一步,击穿了人类智慧的堡垒。


这说明,人类所谓的逻辑与经验,往往是算力不足下总结出的简化版攻略。


当我们要求AI的每一个决策都必须『可解释』时,需要警惕一个问题:


我们究竟是在追求理解,还是在拒绝让渡权力?


很多时候,可解释性的真实功能,并不是为了学习,而是为了追责,我们真正恐惧的,并不是AI做错决定,而是它做出了一个我们无法裁决对错的决定。


这是一种极其人类中心的恐惧。


将人类的认知上限,强行设定为智能的边界,本身就是一种自我设限。


因此,真正的分离,需要勇气承认并拥抱一种『非人』的智能形式。


我们要敢于把「目的」从「人类习惯的过程」中彻底剥离。


洗碗的目的是清洁,不必非用抹布擦洗;


移动的目的是抵达,不必非迈动双腿行走;


计算的目的是求解,不必非模拟拨动算盘;


决策的目的是全局最优,不必非符合人类的直觉与情感。


在这里,我们甚至能重新定义人类的位置。如果「过程」都可以被高效分离,那人类留着做什么?


答案恰恰相反。


我们将第一次拥有一种极其奢侈的权利:选择低效的权利。


我们把洗碗、通勤、计算这些追求效率的事分离给机器,是为了腾出手来,去享受那些本质上低效却充满意义的事——比如手冲一杯咖啡、在雨中漫步、或者在棋盘上下出一手明知会输却构图优美的臭棋。


机器负责生存的最优解,人类负责生活的非最优解。


分离的终极意义,是把生存的逻辑交给机器,把生活的逻辑还给人类。


当我们不再执着于教会机器人像人一样拿抹布、像人一样踩刹车、像人一样敲键盘,甚至像人一样思考时,技术才会迎来真正的解放。


但那或许,


才是智能真正开始自主思考的声音。


END

本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。

支持一下

赞赏

0人已赞赏

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: