扫码打开虎嗅APP
本文来自微信公众号:糖总总,作者:糖总总,文中配图来自纪录片《阿尔法围棋(AlphaGo)》,题图来自:视觉中国
公元前 4 世纪,苏格拉底的名言“我知道我一无所知”揭示了人类认知的局限性。
2024 年,以神经网络为主的人工智能研究分别斩获了诺贝尔物理学奖和化学奖,体现了人工智能拓展人类认知边界所得到的认可。
这一年接近尾声,全球因为 ChatGPT 带来的狂热已经相对冷静。这也是在我伦敦 AI 行业工作的第三年。来自媒体背景,进入这个行业也不久,我常常跟朋友自嘲是传媒老编辑,AI 小学生。可就连我,三年内时不时会觉得特别激动,因为总发现世界在巨变。
未来学家雷蒙德·库茨魏尔(Ray Kurzweil)说,技术奇点(Singularity)即将来临。人工智能的突飞猛进面前,他还是认为 2030 年的世界能继续把我们吓一大跳,2050 年的世界会变得面目全非。

刚刚举行的 2025 美国科技贸易国际消费电子展(CES)上,AI 陪伴和 AI 电子硬件已呈井喷的态势。主办方预测,AI 与现有手机和电脑等电子设备的结合,会给普通人应用 AI 带来一个升级周期。CES 往往代表了全球科技消费的风向标——也就是说,与 AI 互动,将会成为我们每个人接下来主动或者被动都要去面对的议题。
苏格拉底思辨的核心就是对话法。我带着奇点来临的思考,某天突然意识到,与 AI 对话其实就是找到对我们最有帮助的点:AI 能让我们知道很多自己的不知道。
为我们提供了一种极大超越自身认知局限性的可能。
为什么这么说呢?
身为行业中的一个观察者,我想用人工智能领域我接触到最喜欢的人和事,串联我最为敬畏的贡献者,给即将发生的未来,为大家梳理一个我脑海里的新的信息时代黎明,是怎样一个图景。
我主要想讲述的故事,大家其实可能都知道——2017 年 DeepMind 阿尔法狗围棋 AlphaGo 对战世界围棋冠军李世石。
我们可能都记得 AI 赢了人类。其实这背后,很多有太多不为人知的人和事,充满特别值得我们去品味的细节,对于今天我们理解人与 AI 的互动特别有意义。
李世石作为围棋天才,他与 AlphaGo 的对战过程充满了人性的纠结与光辉之处。看完了纪录片我觉得,李世石真的完全变成了另外一个李世石——对他思维的改变,实在是太大了。
技术奇点来临,我们每个人其实都会遇到类似的问题:在 AI 面前,自尊和自负只是一线之隔,这往往决定了一个人接下来会如何认识这个世界。
我已经尽可能用白话,边讲八卦边来书写人工智能最必要的入门点。如果你觉得知识点的部分比较难,别急,我相信你看完这个故事之后,面对 AI 的知识点会更耐心。
AlphaGo 故事的起源就在英国。我来英国完全是偶然,后来发现,英国是理解 AI 行业比较有意思的一个地理切入点。
Paul Graham 曾经在《城市与雄心》里写到,地理环境对一个人的发展有很大影响。每个城市都有自己的气息,志同道合的人会相遇。特别是在一个领域萌芽的艰苦时期,少数人能互相鼓励做一些自己觉得重要,但其他人觉得不重要的事情。
2020 年,我还在牛津念书,偶然遇到做神经网络研究的计算机系校友 Yishu Miao 和 Ziyu Wang,后来发现他们原来都在 DeepMind 工作过,在深度学习领域多年。他们自己创业之后,我欣然加入,这才开启了我的从 0 到 1 学习之路。
从互联网产业角度看,英国本身并不是发展最蓬勃的地方——完全比不上中国和美国的市场热情。英国和欧洲更强调公民权利和数据保护,在产业发展角度却较为保守。英国在 AI 这块的领先,主要是因为 Google DeepMind 和牛津大学等高等学府计算机科学的研究贡献。
今年获得诺贝尔奖的 Geoffery Hinton 和 Demis Hassabis,都是英国人。Geoffery Hinton 作为“深度学习之父”,因为将神经网络运用于机器学习的突出贡献获得 2024 诺贝尔物理学奖,Demis Hassabis 则因为DeepMind AlphaFold 应用神经网络于蛋白质结构预测的贡献,获得了诺贝尔化学奖。
作为人工智能领域绕不开的人物,他们可以成为我们入门 AI 的重要线索,也可以帮助我们更好地理解 AlphaGo 的故事。
巧合的是,Yishu 和 Ziyu 都曾经直接与两位先驱共事过,茶余饭后经常提到他们。2021 年的除夕,我跟 Yishu 还有同事们边吃年夜饭饺子边聊天,听大家聊深度学习学术圈的趣事。听完了我就记得三句话:
“啊?你连 Geoffery Hinton 都不知道?!”
“Demis Hassabis 是个天才。”
“你竟然没有看过《AlphaGo》?”
随后,我就拿出记者的看家八卦本领,像追星一样关注深度学习圈的动向。
后来我才发现,我的好奇心,是完全两位大拿,以及《AlphaGo》这部纪录片推动的。
《阿尔法围棋(AlphaGo)》,是 Yishu 喊我一定要看的一部纪录片。
那年的新年假期我不知所以地打开(B站就有),一个小时看完以后,非常感激他的推荐。开始想要写一写我的学习心得,也是因为这部片子,因为看完实在久久难以平静。
AlphaGo 的背后,就来自于 DeepMind CEO Demis Hassabis 的一手推动。这部记录了 AlphaGo 的开发过程,以及 2016 年与世界围棋冠军李世石进行世纪之战的片子,其实是一个非常简洁的故事,但让我非常激动。
其实大家都大概知道发生了什么,AlphaGo 4 比 1 赢了李世石,当时就震惊了全世界。
我曾以为,这件事核心就是 AlphaGo 是凭借其强大的计算能力击败人类的——人工智能和人类直接,进行人机大战谁输谁赢的比赛,机器赢了而已。
结果发现,这是一个关于我们如何由机器的激发而拓展人性(Expand Humanness)的故事。
这不仅是对李世石来说,也是对于 DeepMind 的科学家来说。AlphaGo 就是是 Hassabis 作为 DeepMind CEO 带着一帮科学家开发了近 20 年的智力成果。
对于因为这部片子而对人工智能产生好奇的观众,我觉得更有鼓励意义。
你会发现你一边跟着故事走,会开始特别矛盾:你可能一会站在 DeepMind 的角度看待 AI,被一帮科学家追求科研突破的那种特别单纯的好奇心和耐心打动;可能一会又站在李世石的角度的看待 AI,从不太关心、不屑一顾到完全震惊,再到放下自尊心迎战。
你会很好奇到底五局对战会是什么结果,但你好像越来越不在乎到底是谁赢——你会特别在乎这个过程里每个参与者的表现,特别是每个参与者与 AI 互动的表现。
于是这个故事的内核意义,已经远远超出输赢本身。
我听 Yishu 说,Hassabis 是极其聪明的一个人,情商也特别高——他能和一个公司的实习生在电梯里打过一次招呼,就记得关于这个人的诸多细节。
他是顶尖的科学家,却不仅仅关注科研。2016 年前后,虽然业内已经对神经网络的能力开始有了相当的认知和把握,主流社会却完全没有概念。那个时候还没什么人知道 DeepMind。
DeepMind 的定位是人工智能的阿波罗登月计划,以彻底理解智能为任务,通过人工方式再创造。Hassabis 提到,他们想用这项科技重新造福社会,解决各种问题。快进至2024 年, 他参与研发的 AlphaFold 因为对预测蛋白质结构的贡献而获得诺贝尔奖,也体现了 DeepMind 确实说到做到。
可 Hassabis 提到,早年间他经常需要请合作伙伴亲自到办公室去看一下,才能让人家确认 DeepMind 是家正经公司,真的有正经的员工在做正规的人工智能研究。
Yishu 说,Hassabis 一直在寻找面向大众的案例,来测试 DeepMind 的研发成果,让科学走出象牙塔。
DeepMind 一直在围绕各种游戏来测试 AI 的理解能力。Hassabis 从小喜欢各种游戏,8 岁时候就拿西洋棋锦标赛的比赛奖金买了自己的第一部电脑。13那年,他已经全世界排名第二(确实是个天才)。
那个时候开始,他就觉得电脑是延展心智的神奇装置。
围棋就是他找到的其中一个绝佳案例。AlphaGo 围棋的程序开发了两年多,但 20 多年前 Hassabis 就和他的团队在讨论围棋程序的可能性。
围棋是有史以来人类发明的最复杂的游戏。对于热爱围棋的人来说,这项有几千年历史游戏近乎拥有催眠一般的魔力。纪录片开篇就提到,它特别单纯且最抽象,往往能挑战人的脑力极限。
围棋更难让电脑破解的原因在于,每颗围棋可以选择的走的路径是200步,这是西洋棋的 10 倍。Hassabis 曾说,围棋棋局可能的变化数量比全宇宙的原子数量还多。
所以,即使出动当时世界上全部的电脑运作一百万年,也不够计算出所有可能的棋局变化。之前,AI 在任何领域的实验即使成功了,到围棋这里都会失败。
所以打败职业围棋手,长久以来一直是人工智能研究的一大挑战和终极目标(Holy Grail)。当时的主流经验认为, AI 能打败围棋还需要几十年时间,或者永远不可能,因为在围棋中获胜,需要人类的直觉才行。
如果你问一个围棋高手“为什么要走这步”,他们只会告诉你“感觉是对的”。AlphaGo 计划必须效仿人类的直觉来创造一种足够聪明的算法。
樊麾是职业围棋二段,2013 年至 2015 年的欧洲围棋冠军。在李世石之前,Hassabis 先邀请的他和 AlphaGo 对战。
看到 Hassabis 邀请他去伦敦办公室参与 AlphaGo 计划的邮件,樊麾一头雾水。
第一次去之前,他想象的大概跟我们脑海里关于人工智能的印象一样夸张:坐在一间特殊的房间里,在他的手上和身上接一堆电线。他一边下棋的时候一边扫描他的大脑,来完成某种难以预知的实验。
但他也确实没把 AlphaGo 的能力放在心上:“毕竟那只是个电脑程序”。
后面你会看到,包括李世石在内的顶尖棋手,刚开始对 AI 的态度都是这么不屑一顾。
跟我们被 ChatGPT 震惊之前的态度一样。
对战的方式很简单,AlphaGo的主要研究员之一黄士杰坐在樊麾对面,帮助程序代为操作。可是最后樊麾五局全输了,还上了欧洲这边的新闻。
他这才意识到,AlphaGo 并不是普通的电脑程序。
AlphaGo 学习围棋的方式是,自己看十万部 DeepMind 团队从网上下载的顶尖棋局。首先学习人类棋手的动作,再自己挑战不同的棋局几百万次进行强化,从错误中学习——核心技术就是神经网络。
如果说到神经网络的突破性进展,不得不提的人就是 Geoffery Hinton。如果能理解他的特殊贡献,可以更好地帮助我们理解这个故事接下来的走向。
Bear with me.
AI 的商业化竞争一度占据了所有人的注意力。ChatGPT 是互联网历史上用户增长最快的应用,两个月就达到了全球一亿的月活量。
过去三年,以深度学习为主的 AI 从学术圈层走向全球主流,从被吹上天再到现在被各国政府进行法规管制。
现在大家可能对 AI 的认知能力已经觉得不新鲜,但其实十年前完全没有人这么想。Hinton 和 Hassabis 在过去的十年左右,其实都有过推动 AI 认知的大动作。提了不少 Hassabis ,我们来捋一捋 Hinton, 能帮助我们理解很多深度学习发展的背景。
Hinton 与他两位学生创办的公司曾被 Google 收购。他们开发的神经网络 AlexNet(通过分析数千张照片自行学习识别诸如狗、猫和花朵等常见物体),开创了现代深度学习的浪潮,也正是这项研究一定程度上最终促成了 ChatGPT 和 Google Gemini 的诞生。
其中一位学生 Ilya Sutskever 后来成为 OpenAI 的首席科学家兼联合创始人——他曾经准备裁掉 Sam Altman 的 OpenAI 宫斗八卦,媒体有很多报道。
神经网络,即深度学习的核心算法,目前 AI 最热门的研究方向。神经网络和深度学习这两个词基本指的是同一个意思,几乎可以交替使用。
到底什么是人工智能神经网络?
我之前一直云里雾里。直到 Hinton 从 Google 离职后,他开始面向全球社会讲解他理解的神经网络如何影响未来,我才开始感觉清晰了一些。
从科普角度,最容易让我看懂的解释吴恩达的深度学习课程(偏技术讲解),以及《AI万金油(AI Snake Oil)》这本书(偏社会影响),来自于我牛津的导师推荐。后者的作者是普林斯顿大学计算机学院的教授和学生。当然,我的理解还有来自于目前团队的科学家们,也结合了Hassabis,吴恩达(Andrew Ng),李飞飞等业界大拿在过去几年来的一些讲解。
Artificial Intelligence,简称 AI ,其实是一个概念集——是一组松散相关技术的统称。这些技术其实都可以理解成人工智能不同的工具,这其中就包括了大家可能听说的媒体上报道最频繁的机器学习和深度学习。
我粗浅的理解,机器学习是 AI 的子集,而深度学习是机器学习的子集,他们是俄罗斯套娃一样的关系。
你可能会听到更多的 AI 流行词(buzz words),比如强化学习啊,知识图谱啊等等。不用着急都了解它们——按照吴恩达的话来说,他们都是让计算机智能化不同的工具而已,入门不一定用得上。
ChatGPT,以及像 Dall-E、Stable Diffusion 和 Midjourney 这样的图像生成器,都属于生成式人工智能(Generative AI),是目前主要普通人能应用的AI。
生成式 AI 是指能够生成文本、图像、视频或其他媒体的 AI 技术。这个技术其实已经有了八十年的历史,目前仍处于大规模应用的早期阶段。
神经网络是生成式 AI 背后核心的技术,从 1950s 年起源时期的研究,开始即受到人的大脑运作方式的启发。要注意的是,很难说人工神经网络和大脑神经网络的运作方式完全一样——因为我们对于大脑的理解还是很少,我们对于 AI 黑盒子具体如何运作的理解其实也有限——比较谨慎的说法是二者有比较松散的关联性。
我自己的理解是,大脑和神经网络的共通点是做数学。
我们的大脑是通过计算数学公式来运作的:神经元在大脑中通过突触连接,传递并触发电信号。神经元和神经元的联系之间有不同的权重(神经元之间的连接)。
AI 的人工神经网络也可以描述为一长串数字,来代表(人工)神经元和神经元之间的权重。
人工神经网络中,一个神经网络是一组神经元,每个神经元会计算出一个相对简单的函数。更多层的神经网络就可以进行更复杂的计算,从而传导更复杂的权重和连接强度。多层神经网络就好像乐高积木那样堆叠,这样可以计算出极其复杂的函数,这些函数能精准地根据输入来输出答案。
1986 年发表在《Nature》杂志上的一篇论文,标志了围绕神经网络研究的复兴:其一,学术圈开始研究构建更大的神经网络,因为研究者发现,如果计算能力允许,拥有更多层的网络是有帮助的;再者,一种称为反向传播的算法可以训练深度神经网络。其中一位作者就是 Geoffrey Hinton。
2007 年,时任普林斯顿大学教授的李飞飞察觉到计算机视觉领域发展停滞的原因:缺乏训练数据。为解决这一问题,她带领团队创建了大型图像数据集ImageNet,为后来深度学习的突破奠定了基础。
围绕 ImageNet,他们发起了一项竞赛,让圈内比较哪种 AI 模型可以最准确地对图像进行分类。ImageNet 的一个子集,其中包含大约一百万张图像,被指定为训练数据集。任何研究人员都可以通过在这些图像上训练模型来参与。不同模型分类的准确程度会有一个最终排名。
2011年,Hinton 和他的两个学生 Alex Krizhevsky 和 Ilya Sutskever,带着他们花了一年时间开发的神经网络参赛,即前文提到的被谷歌收购的 AlexNet。效果好的远超过第二名,让更多的人已经意识到更多层(深度)的神经网络可以提高结果准确性。从那个时候开始,神经网络就冠名“深度学习”。
同样是这一年,AlexNet 的训练适逢强大的计算能力开始出现——主要是因为英伟达这样的硬件公司,找到了重新利用游戏中强大的图形处理器(GPU)的方法,这对深度学习的训练起到了关键性的作用。
为什么说 Geoffery Hinton 他们用于参加 ImageNet 比赛的研究,一定程度上促成了 ChatGPT 和 Google Gemini 的诞生呢?
因为 AlexNet 的成功不仅重新点燃了学界和业界对深度神经网络的兴趣,并证明了深度学习在大规模数据和强大计算资源下的潜力。
这就是为什么,AlphaGo 的科学家们当年其实足够有信心能够挑战李世石。
这种成功促使研究者探索更复杂、更高效的神经网络结构——谷歌随即花了4400 万美金收购了 Hinton 和学生的公司。坊间传闻,第一个业界收购其实来自于百度,一百万美金。
2017 年,谷歌的研究科学家就在 AlexNet 的研究成果上取得了重大突破,主要是创新了一种叫做 Transformer 的架构。这就带来了一个足以改变世界的飞跃。
划重点——Transformer 架构主要用于文本处理,但是通用性很强。李飞飞的博士生,OpenAI 联合创始人 Andrej Karpathy 最近在接受采访时强调了Transformer 架构的革命性,说要比其他神经网络还要“神奇得多”。
这其实进一步证明了人工智能领域的一个重要推论:机器从数据中学习的效果更好,比依赖于人好。比曾经业内的传统方法,即专家把知识编程给机器的方法好很多很多。
这样,神经网络在训练和解决问题的时候,只要有足够的样本和数据,深度学习的开发者可以普遍使用单一算法。只需调整模型的数据和训练过程,大模型就能应用于各种任务,包括自然语言处理、计算机视觉和机器人技术。
也就是说,今天我们看到的聊天机器人、文本到图像生成器以及执行各种功能的数千个其他 AI 应用程序背后,都是相同的学习算法。
Hassabis 在纪录片里面说,AlphaGo 算法的美妙之处在于,正是因为机器可以自己学习,他们可以走出超越人类认知范畴的棋步——因为能看到人类看不到的地方,才更能够在科学和医疗领域做出认知的革命性突破。
这就是 AI 拓展人类认知的基础。
AlphaGo 挑战完樊麾之后,Hassabis 就向过去十年内世界公认的最顶尖围棋高手李世石发出了邀请。
李世石也被认为是个天才。
记者会的时候,李世石说:“我不想让人觉得我很自大,但我认为我还是很有优势,我不认为这场比赛我们会势均力敌。”
“之前 AlphaGo 挑战的对象和我并不是一个级别,目前也就过去了两个月,我不认为 AlphaGo 可以到追上我的程度。”
李世石说,他一局都不会输。“我希望能以五比零或者四比一结束比赛。”在记者会现场听到这句话的 Hassabis,给了一个意味深长的笑。
其实不怪李世石作为 18 次的世界围棋冠军这么认为。
樊麾说几乎圈内的所有人,不是百分之一百,也有百分之 99 点 99 的人认为李世石绝对会赢的。
DeepMind 就是那百分之零点一。Hassabis 的笑,是科学家已经看到了未来,再回来看待人类时候的会心一笑。那个时候他心里的把握已经很大——这个笑现在看到就更显得有韵味。
不过他在接受媒体采访的时候,还是很谦虚的。后面你会看到,确实也应该谦虚,因为 AI 也有很明显的弱点。
李世石看起来很安静,其实能感觉出来思维上很叛逆。他小时候的围棋老师说,他从小跟别人就不一样,下围棋的时候眼睛闪闪发光。
李世石自己说,他学围棋是因为打败年纪比他大的人,觉得很好玩。小时候起,围棋就是他的个人创作,创造不同的棋风,全新的、属于他自己的、从来没有人想到的风格。
他的棋风被评价为超越输赢的那种有趣——用创新的方式把围棋提高到另一个层次。所以你看,他是不可能会拒绝 AlphaGo 的挑战的,因为实在太奇葩、太与众不同。
Hassabis 发出这个奇葩的邀请,也说明他对顶尖棋手,甚至是说顶尖的像他一样的棋手和思考上叛逆者,把握得非常精准。
但真正到赛前,双方都是会紧张的。两方反应都非常有意思。
虽然有些骄傲,比赛前李世石还是视频通话 Hassabis 问了一下 AlphaGo 当时的训练进步程度。
DeepMind 团队的反应就更有趣了。毕竟努力了 20 年的研究成果,在此一搏。纪录片团队在他们办公室拍下不少非常真实的细节。
小注脚,DeepMind 伦敦办公室就在 Kingscross,靠近谷歌和华为的办公室。我们公司办公室也在附近,我之前每天上下班的时候都经过,忍不住会想象,纪录片里看到的科学家们都在干嘛。
DeepMind 的科学家团队虽然心里有数,但因为李世石实在太强了。时间有限,无法完全搞定新数据集的强化训练任务。内部开会的时候气氛很紧张。
“我们可能会输得丢尽颜面。而且可能输得很难看,所以大家要加油啊。”
樊麾随即被 DeepMind 邀请来当顾问。他虽然被 AlphaGo 打败,他变得更加乐观和积极。他不分早晚地对战 AlphaGo,随即发现了程序非常大的弱点。
也就是说,即使 AI 再强,也会有 DeepMind 团队称为难以理解的知识块。
而AI本身有黑盒子属性,所以科学家也很难知道什么时候 AlphaGo 会调用这些知识块,随即就开始幻觉,在棋局中程序错乱瞎走一通。所以 AlphaGo 输掉比赛的风险也是很高的。
比赛之前,DeepMind 也没能解决这个弱点,只好硬着头皮上。
对战安排在了韩国首尔,所以是李世石的主场。
场内媒体和聚光灯爆满,李世石对媒体也继续微笑着直言说五比零是肯定的。
纪录片里能看出气氛有多高昂:围棋是韩国的国民运动,光玩围棋的就有八百万人。

李世石对战人工智能这不仅关系着国家的荣耀,已经上升到了为人类而战的水准。又奇葩又让人特别好奇。
有趣的细节是,AlphaGo 是被封版后装在电脑里,由 Deepmind 团队背到首尔的。在这样一个异国他乡,大家的关注点由围棋连接,对战的却是一个让普通人感到陌生和抽象的对象。
虽然安静冰冷地被装在电脑里,但背后是一堆科学家背着大包小包来设计、支持和维护这个对战。

所以,这并不是简单的人机对战,这是人-机器-人的对战,而且两边的人都无法预测到底会发生什么,机器会如何和人互动。
整个对战的过程也是相当奇特的。AlphaGo 的主要研究者黄士杰需要坐在李世石对面,帮助 AlphaGo 来把每一步棋摆到相应的位置。

接下来的故事大家都知道了,但是故事并不止步于此。关注胜负之外,整个过程中,人因为 AI 带来的反应是特别值得去看的。
比赛之前 DeepMind 的团队互相说看起来你很紧张:

李世石在疯狂的聚光灯下闭上眼睛等待比赛开始:

Hassabis 和领队注视着李世石走向对战的棋局,带着颇为复杂的期待表情:

比赛正式开始之后,AlphaGO 的第一步都思考了很久很久,被韩国的电视主持人嘲笑了一把:

黄士杰说,坐在李世石对面,能感受到卓越棋手的意念和风度。李世石第一次面对这样奇怪的对手——看不到摸不到冷冰冰的——但李世石很沉着,黄士杰能感受到他强大的意志力。
第一局中途开始,AlphaGo 的棋局对战能力就开始很明显了。
所有人都开始感到不对劲,特别是李世石,能感觉到机器走的棋步并不是人类的风格。过程中,李世石会不自主地抬头去看黄士杰:

意识到黄士杰并不是对手之后,又只好看回棋盘:

报道现场的主持人评价说,这是棋手的一种习惯反射,因为身为比赛选手,会习惯去看对面的人。李世石当然会想要知道对方的情绪如何。
但是,看黄士杰是没有用的,对手是他背后的 AlphaGo,看不到摸不到。
韩国的主持人已经能看出来李世石第一局就已经精疲力尽,开始慌了:

樊麾解释说,人跟人下棋的话,是可以有情感交流的,能感受到对手的很多情绪。感受不到对手的情绪,就会开始陷入自我怀疑的情绪。

这种怀疑是一个不断下沉的螺旋,从“这真的是一步好棋吗”到“我怎么会走出这么烂的一步棋”。

在李世石的心理防线开始全面溃败的时候,DeepMind 团队看到 AlphaGo 基本已经搜索出了接下来的 50~60 步要走的棋,完全不在一个对战级别:

不仅是李世石,观赛的所有人都惊呆了。当然,视李世石为国宝的韩国同学是很难过且难以置信的:

樊麾从职业棋手的角度来解释,李世石刚开始完全无法接受自己会输,太难以置信了——因为即使人工智能很强,这难道不是很远很远以后才会发生的事情吗?怎么会是现在,当下,在我面前。不可能,完全不可能。
很容易想象,李世石在接下来的比赛中会有多大的压力 —— 所有人都看着他,特别是把他当国宝的韩国人。这很容易是一个巨大的圈套——想赢的圈套。第一局赛后采访时候,他果然掉进去了:

第二局开始,明显能看到李世石的变化。据说他找同僚彻夜不睡研究AlphaGo。他的老师还说,李世石开始采用截然不同的风格来对战,应该承受着极大的压力。
第二局中间,李世石去抽烟休息了。

在这个休息的间歇,AlphaGo下出了震惊全世界的第 37 步。

这个震惊,首先带来的是让围棋专家嘲笑的震惊,大家都以为 AlphaGo 开始错乱了。

樊麾说自己也很错愕,觉得这一步走得实在太差了。专业的围棋评价一边倒地认为这步走错了。因为位置太高,围棋高手一般不会这么走,很不寻常。
但是 DeepMind 的科学家非常兴奋,“这样出其不意的棋步才是玩围棋的意义”。

他们现场查看了一下 AlphaGo 这一步到底是怎么算的,结果发现 AlphaGo 其实也同意人类会觉得这么走很糟糕,因为人类棋手只有万分之一的概率会走第 37 步这样的棋步。它知道这是人类看了极不合理的做法,但是超越了人类的指导,还是走出了全新不一样的一步。
这非常符合深度学习科学家的思考方式。按照 Hinton 的说法,神经网络因为能学习巨大的数据集,并且可以寻找不同类型数据之间的共同结构(Common Sturctures),可以看到很多人类看不到的规律。这正是科学家致力于培养 AI 去辅助人类做创新的目标所在。
在现场的《连线》杂志记者说,他是通过围棋专家们的评论来理解比赛的。可是当最懂围棋的一帮人都懵了,他自己就更没有头绪了。
可他发现原来专家们此时此刻也都搞不清楚到底怎么回事,他反而觉得很有趣了——只有机器是有思路的。
李世石抽烟回来,看到棋局的表情也很有意思,他有点懵也有点乐:

李世石说,他就是从这一步开始改变了想法,对 AlphaGo 刮目相看。他觉得 AlphaGo 其实很有创意,真正开始尊敬人工智能这个对手。曾经他以为,“只不过是一部机器罢了”。

樊麾解释说,他看了好久才明白,这第 37 步非常特殊。因为这一步,之前的每个落子都起了作用。
这一步棋,李世石的评价是非常漂亮又创意十足。这恰好表达出了李世石他自己热爱围棋的初衷——是他个人表达创意的一种方式。
他开始重新思考,围棋里的创意究竟是什么?
李世石说,第一局让他惊讶,第二局他则无言以对。整个过程中他没有任何一刻觉得自己有过主导权。这个感觉估计对蝉联 18 次世界冠军的他来说,非常陌生。

到了第三局,外界对李世石的评价是他非赢不可了。据说他和四位职业围棋手彻夜分析了 AlphaGo 的棋局——他现在一定非常想赢。
但是他的围棋老师说,输了两局之后的第三局一定是最难熬的。可当一个人拼命想赢的时候,就会输掉。
樊麾说,李世石在第三局一上来就开始厮杀,试图硬碰硬,但这不是他的风格。一旦棋手改变自己的风格来试图打赢对手,结果往往非常不妙。结果果然这局 AlphaGo 赢得轻而易举。樊麾说觉得这场棋让李世石最难过,因为他完全没有用平常的风格应战。
《连线》杂志记者说,李世石连续输第二盘棋之后,他能开始感觉到整层楼都弥漫着异常悲伤的气氛。
三局过后,全球各类风评四起,大家的各种情绪似乎都被点燃了。全世界观战的人很多,互联网上键盘侠批评李世石没有发挥出真正实力的也不在少数。
我看着比赛后的记者会,全是长枪大炮摄像头对着李世石,就觉得真的好残酷。失败了还得出来继续营业,表达想法。

李世石跟大家道歉说,“对不起,这一次我让很多人都失望了。如果我的棋艺更高,或者智商更高,结果可能会不同。我从来没有感受过这么大的压力和重担。”
看到如此骄傲的 18 次世界冠军这么说,我的鼻子都酸了。试问,又有谁能比他做得更好呢?
DeepMind 的团队虽然占上风,竟然高兴不起来。大家似乎都对李世石面对的这种特殊对战感到不忍,因为他们知道 AlphaGo 实在太强了,面对他的孤军奋战感同身受。

他的朋友表达得更为准确:“九段棋手李世石在我认识的人里面,拥有最坚强的心。他正在打一场孤独的战斗。他的对手没有实际的形体,我很同情他的处境。”
“如果李世石选手能发挥出他平常的水平,我有信心我们能够打败机器”。
整场比赛的顶点是第四局。
连输了三局之后的李世石,心态明显轻松了,所谓的顶级棋手的自尊已经放下了。

樊麾说,第四局的李世石并没有看起来胸有成竹,但似乎如释重负。他希望李世石能用自己的风格应战。
AlphaGo 让人的感觉是一面镜子。很他对战是一种非常奇怪的感受——感觉自己好像随时都赤裸裸的。
当一个人第一次通过这面镜子看到真正的自己,他可能会首先会选择回避,然后才是慢慢的接受。

有意思的是,这一局的刚开始真的是 AlphaGo 占上风。上半局,包括 DeepMind 的人在内都觉得,所有围棋评论家,基本都已经对李世石能赢不抱希望了。他们一边倒地评价说,李世石这一局采取保守战略是错误的。

难以置信的地方在于,他们觉得 AlphaGo 占据了很大的优势,李世石则早放弃可能早好。

可逐渐地,大家慢慢发现,李世石开始从一块很小的地盘杀出一条生路。

李世石某一步可能就要花上七、八分钟。在韩国大街上的大屏幕上,都能感觉到他的屏息凝神。

大家感觉他的谋算貌似正在接近找到 AlphaGo 的弱点。

樊麾想象说,李世石就像冬天森林里埋伏的一匹狼,一直在静待时机。冬天很冷,非常非常冷,但是他必须耐着性子继续等待。
一旦时机出现,他就会发动攻击。
李世石走出了他的第 78 步时,AlphaGo 又来了让人难以理解的一步。

评论家们包括李世石,一时都不敢轻敌,都试图找出这一步的意义。DeepMind 的科学家们则惊讶地发现, AlphaGo 的赢率迅速下降:

大家终于发现,这可能是 AlphaGo 正因为能看到很多未来的步骤和赢率,已经找不到突围的方法了,于是开始犯错。

科学家们心里一沉,估计 AlphaGo 到这一刻已经开始错乱(delusional)了,棋步变得非常混乱。

他们估计 AlphaGo 搜寻了很久很深到底应该什么棋步才有胜算,已经有点迷失了。

Hassabis 看到 AlphaGo 已经放弃当前的方法开始乱跳:

DeepMind 的团队一边看 AlphaGo 在挣扎一边看李世石一头雾水:

科学家们看到 AlphaGo 的下一步,已经到难以置信地荒谬,他们已经开始想象如何被李世石嘲笑 (看科学家们的自尊心在作祟也挺有意思的)。

这个时候 AlphaGo 计算的赢率一直在下降:

评论家们开始看到李世石赢的希望:

李世石仍不敢轻敌,完全没有大家猜想的笑意,可他已经创造了奇迹。

他设计的棋局复杂到让 AlphaGo 都无法正确地计算该如何走出棋步——AlphaGo 安安静静投降了:

看到这里,我会和《连线》这位记者一样,鼻子很酸,快要哭出来了。

李世石重新在机器面前找到自己之后,在所有人都不认为可能的情况下,赢回一局。
现场很多人都开心地大叫,站起来鼓掌。

他说,大家如此开心的原因,大概是因为人类第一次真的因为机器感到无助和害怕,因为人类感觉自己脆弱和无助。
“但这次胜利代表着,我们还是保有优势。虽然打败人工智能可能会日渐困难。”

这一局之后的记者会,李世石进入会场的时候,全场都在欢呼。我看得也泪目了。他说这是他赢棋被最多人恭喜的一次。

大家都说,好像自己赢了一局一样。

从这里我们就能看出,科学家们是非常紧张程序的漏洞、弱点以及可能出现的幻觉的,同时 AlphaGo 真的也在比赛过程中出现了荒谬的棋步。
因为 AI 也是人类的创造,创造即不可能完美无缺。在比赛现场的一位评论家在看到 AlphaGo 错乱的时候的评价很到位:“如果 DeepMind 真的研发出了完全没有 Bug 的程序,这才是震惊世界的大新闻。”
反思 AI 比较有代表性的事件是,Hinton 在 Google 工作了 10 年后,于 2023 年下半年突然宣布离开。
去年开始,Hinton 越来越多地公开谈论强大 AI 系统可能带来的风险,特别强调其被滥用、发展成自主武器以及可能超越人类控制的潜在危险。尽管 Hassabis 也承认这些风险,他的公开声明更多地聚焦于 AGI(通用人工智能)的潜在益处以及安全开发的策略。
今年最新的 AI 安全研究已经发现,LLMs 模型随着规模和复杂性增加而表现出很多意外行为。AI 经常会出现欺骗用户的行为,甚至有情境下会威胁用户。
至少我们需要意识到,目前在使用 AI 工具时,要给自己做好信息把关人(information gatekeeper),因为AI 不仅会出错,还可能会故意犯错。
DeepMind 的团队发现,李世石改变局面的关键一步在 AlphaGo 计算看来,概率只有0.007%,也就是说一万个人里面只有一个人会这么走。

这就是所谓万里挑一的神之一手(The God Move)。
《连线》记者评价说,是 AlphaGo 的第 37 步催生了李世石的第 78 步。
AlphaGo 能够下出在人类看来非常奇怪和不可思议的第 37 棋步,因为它不受预设的严格规则限制,也因此突破了人类知识的局限。
最令人惊叹的是,最顶尖的围棋选手李世石从不以为然,到被这种表现震撼到,同时又学习、接受、挑战它,并且还能找到 AlphaGo 的漏洞,扳回一局。

围棋专家认为,大家好像突然都意识到,人类对围棋的认知其实非常有限。

大家开始反思,人类自认为开创性的棋步,是不是真的这么具有开创性?AlphaGo 甚至让大家开始思考这项几千年游戏的方式本身。

很多时候我们下棋的时候会希望,每一步都要赢。

比如,AlphaGo 并不会去为了赢而攻占不必要的棋盘领土,只要最后多赢一气即可。
这场比赛深刻影响了人类未来下围棋的方式。

比赛后的采访你能感受出,李世石真的完全变成了另外一个李世石——如前文所说,与 AI 互动后对他思维的改变,实在是太大了。

他已经变成了新的李世石。

“我好像找到了下围棋的意义”。

纪录片结尾我们得知,AlphaGo 之后,李世石和樊麾都赢得了更多场围棋锦标赛。

对于这个故事的旁白,我想用这部纪录片的海报来结尾。这应该是我最喜欢的其中一张电影海报。

因为这张海报完全抓住了这场人-机器-人互动的的精髓——AI 在背后安静地跑着,研发程序的科学家默默支持程序运行,看似面无表情,内心却翻腾倒海。
李世石则身体前倾全神贯注——在被 AI 震惊之后,集中着一万个注意力的火力来思考如何往下面突围。
这是给我们的非常清晰的启示。
把视野拉回今天,可以看到人工智能的发展速度已经超出了我们的想象。
《纽约时报》的采访中 Hinton 提到,“这种技术实际上能比人类更聪明——当时只有少数人相信这一点......但大多数人认为这种可能性还很遥远。我也曾这样认为。我以为这还需要 30 到 50 年,甚至更长时间。显然,我现在不再这么想了。”
但是,两人都相信AI的理解能力会继续提升,而且时间发生点都基本在 2030~2034 年左右。AGI 将展现出对概念的真正理解、逻辑推理的能力,以及解决复杂问题的能力——这意味着其认知复杂性远高于当前的 AI。
这对于我们的影响非常深远。
媒体人在 AI 面前可能是小学生,可媒体人往往对信息时代的变化非常敏感,特别是一个时代的信息如何产生、传递、把关、接收给受众。
互联网过去几十年,信息传播和生成出现了无限扁平的趋势(The Great Flattening)。当所有人被互联网连接起来,理论上信息层级界限逐渐趋于零。于是,旧中心被打破,新中心在崛起。
在这个基础上,AI 更进一步打破信息生成的界限,带来一个新的信息时代黎明。以神经网络代表的人工智能技术,让人类在历史上第一次,可以认知到无法感知或理解的模式(pattern)。与互联网带来的扁平化重构相比,所有人重新与 AI 连接,并且可以从与 AI 的互动中直接得到所需要的认知。
因此,新的 AI 信息时代的大趋势在于无限探索(The Great Discovery)。
普通人要如何应用这一点呢?
做 AI 的朋友,与AI对话,不断拓展自己的认知边界。
苏格拉底的“我只知道我一无所知”,并非简单的自我否定。
我们看到,最一流的科学家的科研创新精神,就是来自于对无知的自觉与谦逊,才会在无人关心的时代,对人工智能的训练充满信心。
科学家们很早就理解到,与人类知识体系不同,深度学习的 AI 模型可以在海量数据中挖掘复杂的高维度关系,常常能在我们无法直观理解的层面上,捕捉到潜在模式。
与 AI 互动,就是我们现在在 AI 面前需要做的事情——尽量去用就好了。技术发展到今天,已经不需要人们去努力学习配合它,这是科技四两拨千斤的杠杆作用。
到了今天,我们不必成为 Hassabis 李世石那样的天才,就可以直接体验到最新的 AI 应用。
但是,在各种文本大模型已经非常普遍的今天,高质量的互动并不只是给 AI 随便发指令而已。AI 不可能完美,我们自己更需要把关。
与 AI 互动,最好是把 AI 当做思辨的朋友。苏格拉底的提问法精髓在于,通过一系列引导性问题,逐步揭示隐藏的矛盾或知识漏洞,使对话者自己发现真相。
还记得我在之前的文章里提到的吗,我们在信息时代要警惕 GIGO(Gargabge In Garbage Out. ),正因为有好的工具,我们更需要深入理解自己所在的领域,成为顶尖的棋手,才能用最好的互动策略让 AI 给到我们最好的激发。
像李世石一样,不需要去懂 AlphaGo 研发的原理,只需要一心跟 AlphaGo 下棋。
经历了一场和 AlphaGo 的对话,李世石就变成了另外一个人。这就是由机器的激发而拓展人性(Expand Humanness)的最好案例。
早期参与者的互动,就代表了我们的互动。我们被他们在 AI 面前特别单纯的好奇心和耐心打动,其实也会经历类似的过程:从不太关心、不屑一顾到完全震惊,再到放下骄傲去迎接新的技术。
正如苏格拉底所言,认识到“自己的无知”是避免自负与谬误的第一步,也是开启真正学习的起点。
其实我真正开始把 AI 当回事,是因为这部纪录片结尾的一个细节。那个时候还没有 ChatGPT,对我影响很大的,就是环境和其中的人而已。
我自己一直有喜欢看电影纪录片制作团队细节的习惯。AlphaGo 结尾黑底白字的字幕时,我像平时一样,默默地看着,却突然看到我牛津同学/后来同事 Ziyu 的名字,就在DeepMind AlphaGo 研究团队里面。
他的名字就在把 Open AI Sam Altman 开除的首席科学家、和 Hinton 一起开发AlexNet的 Ilya Sutskever 下面。
我一愣:原来我同事这么厉害啊。
于是开始好好工作。我觉得 Ziyu 应该是我在深度学习领域最好的入门老师,我真的跟他学到了很多东西——我经常觉得他能把神经网络的运行原理讲得通俗易懂,小学生都能懂的级别。
刚开始我自己打退堂鼓的地方在于,非技术背景学习 AI 的痛苦之处在于觉得自己不懂技术,或者说总是懒得认真去看技术知识。“文科生”的这顶帽子,我从大学时候就开始带上了,那个时候就一直逃避数学课。
可我喜欢研究新的媒介变化,又发现媒介传播方式的最新变革不仅是由技术驱动,而且技术已经越来越开始影响媒介生成内容的本身——我们每个人都需要去自己面对技术的影响,而且是每天。
在牛津念书时重温统计初阶和高阶,带着自学的三脚猫编程能力来做研究,我以为已经是大龄文科生做题家的自我突破。
加入现在团队后,我吭哧吭哧跟着他们读了快一年的机器学习paper,恶补基本概念。我暗暗捉急,自己想着还好在牛津把数学基本知识点又学了一下,可每次听团队讲 paper,我能听懂 5% 就不错了,云里雾里抓耳挠腮。
可随着团队产品的研发和用户调研的进度,我某一天突然意识到技术是用来为人服务,特别是服务于我们的生活的。普通人可以更多地去了解技术原理,但我不需要了解到科学家的程度啊。
就像是我们都在小学数学学过算术,这对于我们长大以后的生活已经完全够用了,我并不需要去理解深刻的数学公理和逻辑本质。
我在牛津的导师更是给了我启发:我们可以从社会学角度来理解 AI 对于人和社会的意义。我之前分享过,在牛津学到的最大的心得就是针对问题的思考方法——追问定义、冷静切分和平衡审视——每个问题都有很多面,没有绝对的好,也没有绝对的坏。
正是因为已经有很多科学家和工程师在研究技术本身,我们更应该去思考技术给人带来的微观和宏观影响——毕竟,技术是要服务于人,终极问题都是,人类如何过上更好的生活。
我终于觉得,我理解的 5% AI 入门知识够用了,即使我只是 AI 领域的小学生。此外,我也是经历了媒介素养训练和过去三十年互联网带来的媒介变迁的——因此我还可以带着传媒老编辑筛选优质信息的眼光,来把关 AI 小学级别的认识。
我们只要去好好地用 AI,就够了。
希望我们都能在新的信息时代黎明,拓展自己的边界。
Now, it's your turn.
本文来自微信公众号:糖总总,作者:糖总总