扫码打开虎嗅APP
本文来自微信公众号: APPSO ,作者:发现明日产品的,原文标题:《十年前的今天,AI 用「神之一手」给人类上了一课》
今天,距离改变世界的李世石大战阿尔法狗(AlphaGo),已经整整过去了十年。
多年后,李世石在接受外界采访时,仍难以忘怀当时的感受:「输给AI,有种感觉是,我整个世界都塌了。」
他当初在接受邀请时,觉得那会是一次「好玩」的经历:「好玩的前提是我觉得会赢。我从未想过自己会输。」
这份自信并非傲慢。围棋长期被视为AI难以攻克的最后堡垒——棋盘上可能的局面数量高达10的170次方,远超宇宙中原子的总数,传统算法根本无从穷举。
正因如此,许多专家当时预测,AI要赢过人类顶尖棋手,至少还需要十年。然而,AlphaGo提前了十年。

这场比赛中,有一个细节后来被反复提起:第二局的第37手。AlphaGo将棋子落在了一个人类职业棋手几乎不会考虑的位置。
现场解说员一度认为这是失误,观众席上的棋手们面面相觑。但一百多手之后,那颗棋子恰恰处于制胜的关键位置——它的价值,在百步之后才得以显现。
这就是著名的「第37步」。

今天,DeepMind创始人Demis Hassabis在X平台发文称:
十年前,AlphaGo在首尔的那场传奇比赛开启了人工智能现代时代的大幕。著名的「第37步」向我们表明,AI技术已准备好应对科学等领域中的现实世界问题——而这些方法所激发的新思路对于构建通用人工智能(AGI)至关重要。
「第37步」也成了一个流传至今的隐喻:它代表那些看起来不合理、却最终被证明正确的决策;代表超出人类直觉边界的创新;也代表在某个系统或竞争中,突然改变局面的关键一步。
击败人类后,更强的AI在进一步去「人味」
「我没有办法再去享受围棋,所以我就退役了。」
与AlphaGo对战的三年后,李世石正式宣布退役。对于5岁就开始学围棋的他而言,围棋不仅是竞赛,更是一种艺术,是棋手个性与风格的延伸。但在AI时代,它却沦为效率的游戏。
让他更难释怀的,是AI还在继续进化,且越来越「去人化」。
2017年,DeepMind发布了AlphaGo Zero。AlphaGo的诞生,依赖神经网络对人类高手3000多万手棋谱的学习;而AlphaGo Zero从一开始就彻底抛弃人类经验,训练期间不接触任何棋谱,单纯靠自我对弈从零生长。仅仅三天后,它便以100:0击败了AlphaGo。
《大西洋月刊》称其为「不需要从人类身上学习任何东西的AI」。

DeepMind并未止步。此后推出的AlphaZero,在不具备任何先验知识的前提下,仅凭规则便在数小时内自学掌握了国际象棋,不仅击败了人类顶尖棋手,更超越了当时最强的专业象棋程序Stockfish。
而象棋已被人类和计算机研究分析了数十年。连在这样一个被反复「穷举」过的领域,AlphaZero依然走出了人类从未尝试过的新策略。
AlphaGo和AlphaGo Zero的棋谱,难以理解到被棋手们直接称为「外星文明投下的一本神秘指南」。
美国职业棋手Michael Redmond于2017年表示,人类学习围棋的重要方式是搭建一个故事:「那是我们沟通的方式,它是一件非常人性的事。」面对「AI味」棋路,他说,人类棋手往往很难真正投入其中:「AlphaGo下棋的方式,总让人觉得很非人性。」
这也正是李世石痛苦所在。围棋对他而言从来不只是胜负,而是表达自我的语言。而「第37步」恰恰说明,这门语言里,AI已经有了人类读不懂的章节。
退役后,李世石开始执迷于AI,开设围棋学院、出书、推出桌游之余,还开始在各地做关于AI的演讲:「我算是很早开始面对AI的问题,其他人也将会经历。那未必会有开心大团圆结局。」
对他来说,AI最让人担忧的地方,在于它可能改变人类的价值观:「过去,人们会对创造力、原创性和创新充满敬畏,但自从AI出现以来,这些很多都已经消失了。」
人机共创时代
并不是所有人都同意这个讲法。
「AI毁灭了围棋圈所有存在的秩序,然后开始重建。」康奈尔大学研究AI的围棋爱好者Jiuheng He如此描述。
在香港一家围棋学院里,老师Ng Chee Man会为学生提供iPad来辅助学习——每次落子,AI都会实时给出「最佳走法」建议,并记录下哪些步下得好,哪些不好。这种训练方式,正在成为全球围棋学院的标配。
数据也印证了这一转变。2023年,《美国国家科学院院刊》发表了一项以1950至2021年共580万手棋谱为基础的研究,结论令人振奋:在AlphaGo击败李世石之前,人类棋手的判断质量在66年间几乎没有变化;但从2016、2017年起,这一数字开始明显攀升。
换言之,人类赢不了AI,但因为AI,人类变得更强了。
DeepMind首席研究科学家、AlphaGo项目负责人David Silver评论道:
「看到人类棋手能如此快速地适应,将这些新走法融入自己的方法中,正是让人非常振奋的事。这些结果表明,人类将在AI发现的基础上,大大提升自身潜力。」
事实上,早在AlphaGo公开亮相前,这一规律就已有迹可循。曾在不公开测试中对决AlphaGo的法国棋手樊麾,虽然落败,却说AlphaGo让他以全新方式审视围棋,技术因此飞速提升,世界排名随之跃升。
2017年被AlphaGo击败的柯洁,在2023年也坦言,自己除了正式比赛外,已经很少与真人练习。在他看来,AI已经成为围棋创造力的新源头:
创造性必须投入实战并得到检验。现在围棋创新的大部分是AI来完成,我们想下一些和以前不一样的棋,大概率会输,因为AI通过大量实战,得出了和之前不同的思维——这才是创造力。
这种人机协作的思维,在新生代棋手身上体现得最为彻底。韩国棋手申真谞,首位夺得世界冠军的00后棋手,棋迷称他「申工智能」,正是以长时间的AI训练著称。
他曾于第25届农心杯实现跨赛季16连胜,超越前辈李昌镐的历史纪录。谈及与AI的关系,他说:「我觉得我和AI现在是朋友关系。AI和人类的思路完全不同,它通过数学算法解决问题,借鉴AI的思路使我受益良多。」
从李世石的崩塌,到申真谞的崛起,恰好是同一枚硬币的两面:前者是第一代直面冲击的人,后者是第一代将冲击化为养分的人。「第37步」对他们的意义,截然不同。
十年前,「第37步」告诉世界:AI能走出人类从未想到的路。十年后,围棋这面镜子告诉我们:真正的问题从来不是人类能否赢过AI,而是人类如何与它一起,走向那些连AI也尚未到达的地方。