扫码打开虎嗅APP

搜索历史
删除
完成
全部删除
热搜词
本文介绍了首个击败人类高水平乒乓球选手的索尼AI机器人Ace,证明AI已可实现物理世界高速实时感知决策,具备广泛应用潜力。 ## 1. 首个实现标准比赛对战人类高水平选手的乒乓球机器人Ace 索尼AI开发的机械臂乒乓球机器人Ace,是首个在标准场地、真实规则下击败人类高水平选手的乒乓球机器人,相关成果已登上《Nature》。此前乒乓球机器人仅能在高度简化条件下比赛,Ace做到了真实标准对抗。 ## 2. 乒乓球机器人研发的核心难点 乒乓球对机器人而言难度极高,叠加了机器人最难应对的四大挑战:高水平比赛球速超100km/h,来回时间不到半秒;不同旋转会改变飞行与反弹轨迹,对判断要求极高;对手会实时针对性调整策略,博弈复杂度远高于预设场景;机械臂存在惯性、活动范围等物理约束,理想动作不一定能落地。它要求感知、决策、控制全链路在极短时间内无缝配合。 ## 3. Ace实现高速对抗的三层技术逻辑 Ace通过“看-想-动”三层架构完成对抗:用普通相机定位球的三维位置,搭配事件相机捕捉球面亮度变化推算旋转,比普通相机延迟低、无运动模糊,时间分辨率高几个数量级;通过强化学习在仿真环境中完成千万次试错训练,学成后将策略迁移到真实机械臂,规避了真实试错的高成本;AI输出大致方向后,由轨迹优化和安全模块生成符合机械臂物理限制的可执行动作,整套流程压缩在不到半秒内完成。 ## 4. Ace的对战表现与现存短板 Ace对战5位10年球龄以上的人类精英选手赢下3场,对战2位职业选手拿到1局,可稳定回击高速高旋转来球,得分并非靠运气。Ace优势在于稳定性,不体力不支动作变形,但无法像人类一样设计战术,目前也还打不过顶尖职业选手。未来改进方向为人类对手建模、在线实时学习。 ## 5. Ace研发的行业价值 Ace标志着AI进入新阶段:不再仅局限于数字空间推理,可在物理世界以接近人类极限的反应速度完成互动对抗。成熟后应用场景远不止乒乓球,可推广到服务机器人等需要高速感知-决策-动作闭环的领域,打开了AI在物理世界互动应用的新大门。
2026-05-12 20:20

首次战胜高水平人类选手,打乒乓球的机器人来了

本文来自微信公众号: 果壳 ,作者:脑子通电,编辑:Luna,原文标题:《首次战胜高水平人类选手!打乒乓球的机器人来了》


一个机械臂,对面站着人类高手,中间隔着一张标准乒乓球台。球飞过来,速度快到肉眼只能看见一道白影。0.3秒,机械臂动了,球被稳稳打回去。对面的人类选手接球、回击、再接球,几个回合下来,球落地了。机械臂赢了这一分。


这个看起来有点简陋却速度飞快的家伙叫Ace,来自索尼AI。Ace是第一个能赢了高水平选手的乒乓球机器人,刚刚登上了Nature。


过去,乒乓球机器人打的是高度简化的“模拟赛”,比如使用发球机代替人类发球、缩小球台面积,甚至不许对手打旋转球。而Ace是实打实地进行了标准比赛:标准的场地,真实的比赛规则,对战人类精英选手。


Ace VS人类


这件事的意义,远不止“机器人会打乒乓球”这么简单。


乒乓球比赛很难吗?


如果你觉得AI下棋厉害、打游戏厉害,所以打乒乓球厉害就理所当然,那就是高看它了。棋盘和游戏画面再复杂,本质上都还是数字世界里的事情。屏幕里的棋子不会因为你手抖而掉到地上,游戏角色也不用担心关节会不会撞到桌子。


真正难的,是让AI走进现实世界。


乒乓球几乎把机器人最怕的几件事叠在了一起。第一件是快。高水平比赛里,球速可以超过每小时100公里,来回之间不到半秒,也就是眨眼的功夫。第二件是旋转。一个球带不带上旋、下旋、侧旋,会直接改变飞行轨迹和落台后的反弹方式;同样的挥拍动作,面对不同旋转的来球,结果可能完全不一样。


第三件是对抗。对手不是按照固定程序出牌,而是在不断试探你的弱点。回球总是落在左边,他下一板就会盯着你的右边打。这种实时的、有针对性的博弈,比任何预设的训练场景都要复杂。


第四件是物理约束。机械臂有惯性,有速度极限,有关节活动范围的限制,还得时刻避免撞到桌子甚至自己。哪怕AI已经算出了“完美动作”,也得确保这个动作在现实中做得到。


把这四件事放在一起,你就明白为什么乒乓球机器人这么难做了。它需要的是感知、决策、控制这一整条链路在极短时间内无缝配合。


Ace是怎么做到的


Ace的思路可以粗略理解成三层:看、想、动。



Ace用多台普通相机来定位球在三维空间中的位置,同时用一种特殊的相机“事件相机”来估计球的旋转。


事件相机和常见的摄像头不太一样。普通摄像头是一帧一帧拍的,就像每秒钟截图60次。但对于高速运动的物体来说,这种拍摄方式有两个问题:一是延迟,从拍下这一帧到处理完这一帧,中间总有时间差;二是运动模糊,球动得太快,一帧画面里球已经拖出一条影子,很难看清楚。


事件相机的工作方式完全不同。它不是定时拍照,而是让每个像素点独立工作,哪里的亮度变了,哪里就立刻上报一个“事件”。你可以把它想象成一群时刻值班的哨兵,不是每隔一段时间统一汇报一次,而是一有动静就马上喊出来。这种机制的时间分辨率比普通相机快了好几个数量级。


事件相机捕捉球面亮度变化的细微模式,再通过算法反推出旋转方向和速度,让Ace能“看清”高速的来球是怎么转的。


“想”


工程师不可能穷举所有来球情况,再给每种情况写死一套动作规则,因为来球的速度、旋转、落点组合起来有无数种可能。取而代之的是强化学习,就是让Ace在仿真环境里反复练习,用试错的方式去学“面对这样的来球,如果我想把球打成某种落点和旋转,应该怎么挥拍”。


整个学习过程完全在仿真环境里完成,这可以让机器人“死”无数次——撞桌子了,重来;球没接住,重来;动作太慢了,重来。在真实世界里这么试错,机器人早就撞坏了,时间成本更是承受不起。等在仿真里学得差不多了,再把策略迁移到真实的机械臂上即可。


乒乓球机器人的”超级大脑“丨Sony AI



哪怕策略网络已经决定了“要这么打”,也不能直接把一个理想动作硬塞给机械臂。因为理想动作可能要求机械臂在0.1秒内完成一个大幅度的挥拍,但机械臂的电机和关节做不到;或者理想轨迹会让机械臂的某个关节撞到桌子边缘,那就更不行了。


Ace的做法是,把策略输出先映射成一个短时间窗口里的目标,再交给轨迹优化和安全模块,生成真正可执行的连续运动。换句话说,AI负责给方向,控制系统负责现实中的实现。


这三层配合起来,从看见球到打出球,整个流程被压缩在不到半秒的时间里。而且这不是一次性的动作,而是要在一场比赛中连续执行几十次、上百次,每次都不能出大错。


它到底打得怎么样


Ace和5位超过10年球龄的精英级选手打了比赛,赢下了3场。与2位职业选手时对决时都输了,拿到了1局。不过,它能稳定回击高速和高旋转来球,说明它不是靠运气或者偶然性得分。


Ace今年4月对战了5位精英选手和2位职业选手。在更早的比赛中,曾与日本排名前10、世界排名64的吉村和弘切磋(并输了)。


有意思的是,Ace的球风和人类不太一样。比如面对极速来球时,人类的本能是后撤以争取反应时间,但Ace可以在不退台的情况下守住原位。


人类高手更常靠很猛的上旋和速度直接压死对手,一板球又快又转,对方接不住就直接得分。Ace的优势更多来自稳定性——它能稳定回球,不会体力不支动作变形,在高速条件下能维持比较高的成功率。你很难用一板爆冲直接打死它,但它也很难用一板爆冲直接打死你。


这反映了机器人和人类各自的优势。人类的优势在于爆发力和创造力,能在关键时刻打出一板质量极高的球。机器人的优势在于一致性和反应速度。


但Ace也还有明显的短板。很明显,它还打不过真正顶尖的职业球员。另外人类高手不仅是在回球,更是在读对手、设陷阱、做节奏变化,Ace现在无法完成战术。


论文作者自己也提到,未来的重要方向包括更强的人类对手建模,以及能从真实互动中持续改进的在线学习。


让机器人打乒乓球,重要吗?


如果你关心的只是“机器人会不会抢走人类的体育冠军”,那这篇论文可能没那么激动人心,毕竟Ace现在连世排64的选手都还打不过。


但它让我们看到一种新阶段的AI:不再只在数字空间里推理,而是在物理世界里,以接近人类极限反应速度的节奏,与人互动、对抗、调整。这类能力一旦成熟,影响不会停在球桌边。


想象一下服务机器人的场景。你在厨房里做饭,机器人在旁边帮忙。你说“把那个碗递给我”,机器人需要理解你指的是哪个碗,判断你现在的姿势和位置,然后用合适的速度和角度把碗递到你手边,既不能太慢让你等,也不能太快吓你一跳,更不能撞到你的手。这需要高速的感知-决策-动作闭环。


乒乓球只是第一个足够好看、也足够难的舞台。下一个舞台会是什么,现在还不知道。但可以确定的是,这扇门已经被推开了。

本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。

支持一下

赞赏

0人已赞赏

大 家 都 在 搜

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账号

    自定义
    支付: