2026-05-12 20:20

首次战胜高水平人类选手，打乒乓球的机器人来了

速览

本文来自微信公众号：果壳，作者：脑子通电，编辑：Luna，原文标题：《首次战胜高水平人类选手！打乒乓球的机器人来了》

一个机械臂，对面站着人类高手，中间隔着一张标准乒乓球台。球飞过来，速度快到肉眼只能看见一道白影。0.3秒，机械臂动了，球被稳稳打回去。对面的人类选手接球、回击、再接球，几个回合下来，球落地了。机械臂赢了这一分。

这个看起来有点简陋却速度飞快的家伙叫Ace，来自索尼AI。Ace是第一个能赢了高水平选手的乒乓球机器人，刚刚登上了Nature。

过去，乒乓球机器人打的是高度简化的“模拟赛”，比如使用发球机代替人类发球、缩小球台面积，甚至不许对手打旋转球。而Ace是实打实地进行了标准比赛：标准的场地，真实的比赛规则，对战人类精英选手。

Ace VS人类

这件事的意义，远不止“机器人会打乒乓球”这么简单。

乒乓球比赛很难吗？

如果你觉得AI下棋厉害、打游戏厉害，所以打乒乓球厉害就理所当然，那就是高看它了。棋盘和游戏画面再复杂，本质上都还是数字世界里的事情。屏幕里的棋子不会因为你手抖而掉到地上，游戏角色也不用担心关节会不会撞到桌子。

真正难的，是让AI走进现实世界。

乒乓球几乎把机器人最怕的几件事叠在了一起。第一件是快。高水平比赛里，球速可以超过每小时100公里，来回之间不到半秒，也就是眨眼的功夫。第二件是旋转。一个球带不带上旋、下旋、侧旋，会直接改变飞行轨迹和落台后的反弹方式；同样的挥拍动作，面对不同旋转的来球，结果可能完全不一样。

第三件是对抗。对手不是按照固定程序出牌，而是在不断试探你的弱点。回球总是落在左边，他下一板就会盯着你的右边打。这种实时的、有针对性的博弈，比任何预设的训练场景都要复杂。

第四件是物理约束。机械臂有惯性，有速度极限，有关节活动范围的限制，还得时刻避免撞到桌子甚至自己。哪怕AI已经算出了“完美动作”，也得确保这个动作在现实中做得到。

把这四件事放在一起，你就明白为什么乒乓球机器人这么难做了。它需要的是感知、决策、控制这一整条链路在极短时间内无缝配合。

Ace的思路可以粗略理解成三层：看、想、动。

Ace用多台普通相机来定位球在三维空间中的位置，同时用一种特殊的相机“事件相机”来估计球的旋转。

事件相机和常见的摄像头不太一样。普通摄像头是一帧一帧拍的，就像每秒钟截图60次。但对于高速运动的物体来说，这种拍摄方式有两个问题：一是延迟，从拍下这一帧到处理完这一帧，中间总有时间差；二是运动模糊，球动得太快，一帧画面里球已经拖出一条影子，很难看清楚。

事件相机的工作方式完全不同。它不是定时拍照，而是让每个像素点独立工作，哪里的亮度变了，哪里就立刻上报一个“事件”。你可以把它想象成一群时刻值班的哨兵，不是每隔一段时间统一汇报一次，而是一有动静就马上喊出来。这种机制的时间分辨率比普通相机快了好几个数量级。

事件相机捕捉球面亮度变化的细微模式，再通过算法反推出旋转方向和速度，让Ace能“看清”高速的来球是怎么转的。

工程师不可能穷举所有来球情况，再给每种情况写死一套动作规则，因为来球的速度、旋转、落点组合起来有无数种可能。取而代之的是强化学习，就是让Ace在仿真环境里反复练习，用试错的方式去学“面对这样的来球，如果我想把球打成某种落点和旋转，应该怎么挥拍”。

整个学习过程完全在仿真环境里完成，这可以让机器人“死”无数次——撞桌子了，重来；球没接住，重来；动作太慢了，重来。在真实世界里这么试错，机器人早就撞坏了，时间成本更是承受不起。等在仿真里学得差不多了，再把策略迁移到真实的机械臂上即可。

乒乓球机器人的”超级大脑“丨Sony AI

哪怕策略网络已经决定了“要这么打”，也不能直接把一个理想动作硬塞给机械臂。因为理想动作可能要求机械臂在0.1秒内完成一个大幅度的挥拍，但机械臂的电机和关节做不到；或者理想轨迹会让机械臂的某个关节撞到桌子边缘，那就更不行了。

Ace的做法是，把策略输出先映射成一个短时间窗口里的目标，再交给轨迹优化和安全模块，生成真正可执行的连续运动。换句话说，AI负责给方向，控制系统负责现实中的实现。

这三层配合起来，从看见球到打出球，整个流程被压缩在不到半秒的时间里。而且这不是一次性的动作，而是要在一场比赛中连续执行几十次、上百次，每次都不能出大错。

Ace和5位超过10年球龄的精英级选手打了比赛，赢下了3场。与2位职业选手时对决时都输了，拿到了1局。不过，它能稳定回击高速和高旋转来球，说明它不是靠运气或者偶然性得分。

Ace今年4月对战了5位精英选手和2位职业选手。在更早的比赛中，曾与日本排名前10、世界排名64的吉村和弘切磋（并输了）。

有意思的是，Ace的球风和人类不太一样。比如面对极速来球时，人类的本能是后撤以争取反应时间，但Ace可以在不退台的情况下守住原位。

人类高手更常靠很猛的上旋和速度直接压死对手，一板球又快又转，对方接不住就直接得分。Ace的优势更多来自稳定性——它能稳定回球，不会体力不支动作变形，在高速条件下能维持比较高的成功率。你很难用一板爆冲直接打死它，但它也很难用一板爆冲直接打死你。

这反映了机器人和人类各自的优势。人类的优势在于爆发力和创造力，能在关键时刻打出一板质量极高的球。机器人的优势在于一致性和反应速度。

但Ace也还有明显的短板。很明显，它还打不过真正顶尖的职业球员。另外人类高手不仅是在回球，更是在读对手、设陷阱、做节奏变化，Ace现在无法完成战术。

论文作者自己也提到，未来的重要方向包括更强的人类对手建模，以及能从真实互动中持续改进的在线学习。

如果你关心的只是“机器人会不会抢走人类的体育冠军”，那这篇论文可能没那么激动人心，毕竟Ace现在连世排64的选手都还打不过。

但它让我们看到一种新阶段的AI：不再只在数字空间里推理，而是在物理世界里，以接近人类极限反应速度的节奏，与人互动、对抗、调整。这类能力一旦成熟，影响不会停在球桌边。

想象一下服务机器人的场景。你在厨房里做饭，机器人在旁边帮忙。你说“把那个碗递给我”，机器人需要理解你指的是哪个碗，判断你现在的姿势和位置，然后用合适的速度和角度把碗递到你手边，既不能太慢让你等，也不能太快吓你一跳，更不能撞到你的手。这需要高速的感知-决策-动作闭环。

乒乓球只是第一个足够好看、也足够难的舞台。下一个舞台会是什么，现在还不知道。但可以确定的是，这扇门已经被推开了。

本内容来源于网络原文链接，观点仅代表作者本人，不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com，我们将及时核实并处理。