扫码打开虎嗅APP
本文来自微信公众号:APPSO (ID:appsolution),作者:APPSO,原文标题:《OpenAI 地表最强人形机器人发布!每天能打工 20 小时,“终结者”要造出来了?》,题图来自:视觉中国
还记得三月份刷屏全网的Figure 01机器人吗?
接入GPT后,能说会看还能做家务的它,让不少网友感叹人形机器人的时代将在AI大模型的加持下向我们大步走来。
Figure 01背后的公司也凭借英伟达、OpenAI等联合投资,一度成为人形机器人赛道上最靓的崽。
暂且忘记第一代的赞誉,就在昨晚,号称“世界上最先进的AI硬件”——Figure 02正式亮相世人。
世界上最先进的AI硬件名副其实吗?
让我们先来感受一下Figure 02素质过硬的躯体。
拥有16个自由度的手部,能够灵活自如地转动手指和手腕,Figure 02起码在卖家秀的官方demo里是到位的。
Figure 02行走间虽有颠簸,但速度也算得上中规中矩,与背景里拿着工厂零部件的同类机器人相映成趣。
经过宝马工厂的“集训”,Figure 02已经不再是那个只会泡咖啡的机器人了,而是成长为了熟稔的流水线工人。
虽然拿起零部件的速度还有待提升,但胜在一个字——稳。
据创始人Brett介绍,从零开始设计的Figure 02集成了多项创新技术,在智能交互和物理操作方面上都有了长足的进步。
Figure 02的头部、前躯干和后躯干各配备六个RGB摄像头,能够通过其由AI驱动的视觉系统来感知和理解物理世界。在官方的描述中,Figure 02“具有超人的视觉”。
得益于与OpenAI合作训练的定制AI模型,Figure 02具备与人类进行语音对话的能力,而其搭载的视觉语言模型(VLM),更是让其能够通过摄像头进行语义理解和快速视觉推理。
在电池方面,Figure 02机器人躯干中内置的2.25千瓦时电池组提供了比前代更持久的续航时间,按照设想,Figure 02能够每天实现超过20小时的有效工作时间。
集成线路布局一直都是人形机器人面临的难题。
Figure 02的集成线路着重提高了电力和线路布局的可靠性,也实现了电线的隐藏和紧凑包装设计,并且定制的线缆端子和连接器也进一步提升了耐用性。
类似于飞机的设计,Figure 02的外骨骼结构设计增强了结构刚度和承受碰撞载荷的能力。
与前代相比,Figure 02的机载计算和AI推理能力提升了两倍,使其能够自主地执行现实世界中的AI任务。
AI数据引擎是Figure 02智能活动的心脏。
它能不断地从云端获取、更新和优化最新的AI模型。并且,这些模型在机器人的GPU上运行,确保了Figure 02在执行任务时的智能性和适应性。
对于Figure 02的发布,Brett兴奋地表示,“Figure 02为人形机器人在工作场所和家庭中的应用铺平了道路”。并且,其也在X上发布了招聘渠道(附上招聘官网地址,感兴趣的朋友不妨去试试:https://www.figure.ai/careers)。
2024年的当下,除了大模型加持所带来的智商,硬件也是不可或缺的重要一环,这也是今天发布Figure 02的意义所在。
经过宝马工厂长时间的集训后,Figure 02在硬件方面比起前代有了不少长进,与工厂场景的结合也更得心应手了。
高盛在今年初发布的《人形机器人专题报告》中预测,人形机器人有望在未来十年内迎来爆炸性增长。
倘若技术再进一步,让机器人具有接近于人的运动性能的躯体,配合大模型等技术的智能支持,人形机器人走进千家万户的愿景,或许不再是画饼式的憧憬。
回顾历史,早稻田大学的加藤一郎教授历时5年时间,才研发出人形机器人的雏形WABOT-1,而从Figure AI入局到当下也不过2年时间,在加速发展的当下,谁也看不透Figure AI这类人形机器人的潜力。
“具身智能”成新风口,人形机器人真有必要吗?
有的人形机器人在泥里爬,但更多的人形机器人却在天上飞。
1950年,图灵在他的论文《Computing Machinery and Intelligence》中首次提出了具身智能的概念,却没有给出一个明确的定义。
他在论文中展望了人工智能两条可能的发展路径,一条是聚焦抽象计算所需的智能,如下棋;另一条则是为机器人配备最好的传感器,使其可以与人类交流、像婴儿一样地进行学习。
前者为非具身智能,典型案例表现为李世石以1:4负于AlphaGo。
后者往近了说,世界人工智能大会上的18台国产人形机器人成了热门打卡点,往远了说,英伟达掌舵人黄仁勋今年GTC大会背后的那排人形机器人也都是具身智能的重要表征。
黄仁勋曾预言道,具身智能将引领下一波人工智能浪潮。
他说,100年后大街上将到处都是人形机器人,或将成为人类历史上产量最大的机器系统,马斯克则大胆地认为,它们的普及程度将是汽车的10倍。
实际上,得益于大模型的加持,人形机器人一些实际的落地应用场景已经初现端倪。
以往只会后空翻、跑酷的机器人不再满足于赢得围观者的吆喝声,而是放下了手艺活,不约而同地集体进厂,当起了生产流水线上的打工人。
一个典型应用场景是货物的分拣和码垛。
前有Agility Robotics旗下的Digit机器人在亚马逊的物流仓库里分拣和搬运货物,后有特斯拉二代Optimus机器人给大家表演了一波电池分拣,并且走路的速度也大幅提升了。
正如李飞飞所说,自然界花费了数百万年时间才进化出空间智能,随着空间智能的加速发展,一个催化机器人进化的良性循环正在我们面前展开。
借助大模型的泛化能力,这位名为Digit的机器人“同事”,已经达到人类75%的工作效率,拥有高达97%的任务完成成功率。
而人形机器人率先“长”在工厂里也并非偶然。
目前AI与机器人的结合还处于初级阶段,尚未达到技术融合的临界点。尽管我们见证了一些惊艳的demo,但却不怎么看到完全跑通的技术方案。
因此,如同婴儿学会走路一样,机器人沿着一条符合逻辑的发展轨迹前进,在掌握基础技能后,才能逐步拓展到更广泛的应用场景。
这与自动驾驶技术的发展颇为相似,总是先在规范和可控的高速公路环境中进行测试和应用。
宇树科技创始人王兴兴曾在谈及人形机器人的终极形态时指出,人形并非是必然的选择。当前人形机器人的发展更多是为了适应社会共识。
他强调,智能的核心不在于外观形态,而在于其功能。无论在视觉识别还是任务执行方面,智能机器人都应该能够完成甚至超越人类的工作。
在人形机器人的发展还远未成熟之际,轰鸣工厂车间里的工业机器人也提前证明了机器人的未来存在感。其中汽车行业尤为突出。
比亚迪的现代化生产车间里,冲压、焊装等环节都有工业机器人的身影。
甚至一些无人驾驶L4+本身就是特殊的机器人,并且已经率先成为具身智能的最大应用之一。
前一段时间,百度无人驾驶萝卜快跑在湖北武汉的订单量激增,让不少网友感叹中年失业后的生计也岌岌可危。然而割裂的是,用户却对萝卜快跑给予了高度评价。
比起人类司机,情绪稳定的无人驾驶在安全性已经可以说是遥遥领先。
它不会超速、也不会压线,更懂交通法,顶多就是太守规矩,急着上班的武汉市民免不了要吐槽它慢吞吞的行驶速度。
所以你看,实际场景下的机器人其实也可以很安全。而且就跟机器人都往人形机器人赛道内卷一样,无人驾驶也还是传统汽车的模样。机器人的外形越来越像人了,但能力好像也越来越碾压人了。
本文来自微信公众号:APPSO (ID:appsolution),作者:APPSO