扫码打开虎嗅APP
头图来自视觉中国,未经授权,请勿转载使用。
文/ 曾欢 罗砚
围棋从未像现在这样得到来自棋界内外、横跨体育界科技界的全球瞩目。人机大战才比了第一场,但好多人似乎觉得已成定局。因为李世石开局第一盘就输了,人类输给了机器。
记得当年输给深蓝,我们喊过人类还有围棋,这次李世石如果失败,是不是就意味着人类在象征大脑发育水平的棋类运动里,从此再无与机器人抗衡的优势了呢?
先别慌,面对首战的失利,有位拥有洪荒之力的天才少年站出来说,李世石会输,我不会输!#人类的尊严由我来捍卫#这个微博名叫@柯洁大棋渣 的19岁少年哪来的自信?因为他就是多次力挫李世石,目前世界排名第一的围棋九段柯洁啊。
一、李世石是怎么输的?
让我们先复盘下,李世石是如何失掉这至关重要的首局。
开局:李世石看似乱来的“邪恶招法”
AlphaGo的长处在于学习前人经验和计算,正如李世石判断的一样,布局是相对的短板,这也是李世石选择执黑先行的原因。
下到第7手,李世石九段把起黑子放在了一个棋盘右下侧出乎所有人意料的位置,既不守,又不攻。中国围棋九段选手柯洁把这一招定义为“从没有见过的邪恶招法”,而古力九段也表示这一招从未在职业选手中出现过。你AlphaGo不是经验丰富、阅棋无数吗?下个你没见过的,看你学谁去。
然而这里,AlphaGo似乎并没有接茬,而是继续稳扎稳打,专攻右上角。
而AlphaGo怎么想的呢?
AlphaGo是用两个大脑去决策的,第一个大脑叫落子选择器Move Picker,即“监督学习的策略网络(Policy Network)” ,它会预测每一个合法下一步的最佳概率,给出候选走子。这里的最佳目标不是数学意义上的赢棋,而是怎么下出符合人类高手选择的落子,简单说就是下得像个人样。
第二大脑是局面评估器Position Evaluator,即价值网络(Value Network),学习大量棋谱后,它自我强化学习,通过“左右互搏”来学习判断局势,让从AlphaGo候选中做出决策。
事后,我们能看出这里两者预期的误差,李世石试图以经验去扰乱机器,而AlphaGo的智能之处在于它不是简单的数据库调取方案,而是智能模仿人类行为,反而让李世石的“邪恶招法”显得多余。
中盘:李世石稳占优势
到第27子后,刚刚进入中盘,到了这个阶段,李世石还是占有一些优势,但李世石陷入了思考。
有趣的是白棋的第84手,居然下出了从未见过的下法,韩国金成龙九段表示:“成为职业棋手27年来,第一次看到白断这手棋!”李世石看到这步棋,摇了摇头。
那么问题来了,既然 AlphaGo 是跟别人学的棋谱,那么这招是和谁学的?连Google作者表示连他也不知道。作者设置了机制,但并不知道这个机制具体如何运作学习。#AI对人类目前来说,还是一只尚不了解的怪兽#
收官:AlphaGo的恐怖逆袭
最后官子阶段AlphaGo开始展现恐怖之处。
“明明之前是我的优势,但在最后的官子阶段,却被他一步一步蚕食,最后输的却是我。”AlphaGo的上一个对手樊麾二段就感受过,“AlphaGo用同样的方式蹂躏了我五盘,只要犯哪怕一个错误,就会被穷追猛打,最后万劫不复。”
可惜的是李世石也犯了错,还是两个。挣扎了一个小时,局势仍然不可逆转。
下午3点33分,李世石投子认输,AlphaGo获胜。
留下李世石一个人坐在棋局前复盘。开赛前,李不止一次的对媒体表示,“除非出现不可理喻的低级失误,我绝不会输,尤其是第一局。”但两三个小时后,李世石只得重新再试图去认识他的对手,虽然了解或许也是徒劳。
二、这局棋,如何评说?
接下来李世石胜算多大?
“虽然受到很大冲击,但还是很享受这盘棋,并且很期待后面的比赛。这盘我没下好,所以想后面的棋我胜算还是会很大吧,胜算会是五成吧。”
“这盘棋电脑不是靠运气,而是凭借实力完胜的,这不由让我们对李世石的信心有所动摇。他们自己发挥的水平高低相差很大,如果说是柯洁去下,可能整体会好一点,但也难说一定能赢。毕竟电脑具备很多人所不具备的优势,最主要的还是心态。”
AlphaGo表现如何?
而对人工智能,前微软亚洲研究院副院长张峥则评价:
AlphaGo胜利的概率是100%,只不过不见得是这次。“毛病”还是机器学习的老毛病。表现在:无法总结规律,或者说无法吐出一套规整自洽的规律;泛化能力差,无法在复盘中举一反三,即便告诉它哪步走错了,恐怕它也不知道为啥,只是一气儿死磕到撞了南墙才完事。
Facebook人工智能组研究员,Facebook人工智能围棋程序Darkforest负责人田渊栋评论AlphaGo:
第一点,如果你觉得AlphaGo的落子水平会波动,其实它可能判断胜率已经很高,有时候随便下;
第二点,蒙特卡洛树搜索是遇强则强的,如果对手太弱的话也不会下出太强的手;
第三点,AlphaGo下棋每一步最后都是算整体分数的,并非单纯局部,反倒是有时候局部弱,对杀会有问题;
第四点,接下去的研究是进入程序的黑箱里去。人工智能研究者们虽然设计学习算法,但其实不知道电脑是怎么决策的,要打开黑箱了解内部机理,还有很长的路要走。
谷歌,让我爱你还是怕你?
国内科技界大有迷信算法的拥趸,搜狗CEO王小川正是其中代表,不过在他看来,谷歌这次是个“心计婊”:
“谷歌找樊麾的时候,他找了一个职业棋手至少是一个洲的冠军,但其实段位相对比较低,这样他能够在里面得到一个取胜,但是说出去是很大的影响力。另外还有一个设定,谷歌和樊麾签了保密协议,最后等到《Nature》封面文章一发表,立刻起到了引爆的作用。所以谷歌在做这件事情的时候,不仅在做技术研究的问题,还深刻考虑了背后选什么人,怎样实现媒体影响力。
以我对AlphaGo的判断,他们并不会对李世石做特别的判断,样本量不够。”
虎嗅编辑翻同学却在这人机大战中,感到深刻的危机:
“科技公司最邪恶之处在于,把全部用户信息拿去让机器学习,而且还不告诉用户。#人类的叛徒#”
三、AlphaGo:(希望)下一场对手是柯洁
AlphaGo为何选择李世石作为首个挑战的职业九段棋手?据新华社对AlphaGo创始人戴密斯·哈萨比斯的采访,这是因为李世石在顶尖水平已有十年甚至更久,“也许更年轻的选手也能有这个水平,但现在还不确定,因为他们还需要有十年顶尖水平去证明自己。”事实上,对于许多高段位的职业棋手来说,李世石是他们实力的试金石,有种说法是,不管拿过几个冠军,只要没赢过李世石,就不能妄谈“第一人”,对于AlphaGo来说,也是如此。
哈萨比斯同时表示,由于对电脑来说,中国的规则更为简便易行,AlphaGo的对弈选择了中国的规则,因此他们也期待在这次挑战李世石之后,AlphaGo能与中国的职业棋手过招,他点到了一个名字——柯洁。
柯洁在前文也多次提到,但是在AlphaGo对战李世石之前,不关注围棋的人们或许还根本没听说过这个名字,然而在李世石宣布认输之后,柯洁以这样一条微博出现在公众视野:
这个微博ID名为:@柯洁大棋渣 的用户,认证信息显示他正是围棋九段、第二届百灵杯世界冠军——柯洁。
四、柯洁是谁?
柯洁是谁?他哪来的自信?——5天前(3月5日)柯洁刚刚在第17届农心杯上战胜擂主李世石,帮助中国队夺得农心杯三连冠;一个月前(2月11日),在2016央视贺岁杯围棋赛决赛中,柯洁以7胜2负战胜李世石;2个月前(1月5日),在第二届梦百合杯世界围棋公开赛五番棋决赛中,柯洁也曾以3比2战胜李世石。
图为李世石与柯洁最近一次比赛对弈,本图来自视觉中国,请勿转载
值得一提的是这场一月初进行的世界围棋公开赛五番棋决赛,首局柯洁执白输给了李世石,第二局比赛由于几招不慎,柯洁落入极度被动地位,当时在央视研究室观赛的棋圣聂卫平生气地预言其“败局已定”,并中途离席,但柯洁在最后30分钟上演神奇逆转,翻盘胜出。
这就是柯洁,他有着极其强大的计算能力,棋风犀利,犹善后发制人。若如上文所说,李世石是最高段位棋手证明自己实力的试金石,那么以上战绩足以说明柯洁的冠军成色。而这个屡次战胜李世石的中国棋手柯洁,还不到19岁。
有人将刚刚过去的2015年称为围棋界的柯洁之年,他一度世界大赛14连胜,刷新了孔杰尘封6年的纪录。柯洁全年等级分对局58胜16负,胜率78.38%。去年11月,柯洁以2687分登顶国内等级分排行榜,一举超越时越,成为目前国内第一人。而从等级分排名第35位到超越另一位90后棋手时越登顶,柯洁只用了两年时间。
在自己的微博里,他同样自信地这样自我介绍道:
据公开资料,柯洁,1997年生人,父亲柯国凡是个棋迷,业余4段,还曾开办过围棋馆,母亲周柳萍曾拿过市运会女子成人组前6,在这种背景下成长的柯洁5岁就开始学习围棋,最早师从周宗强5段,随后师从丽水围棋好手郑一兵。
2004年10月,7岁的柯洁第一次参加比赛就获得了16周岁以下组冠军。2005年,柯洁破格进入聂卫平道场开始深造。
2007年,在全国少年儿童围棋锦标赛上,10岁的柯洁拿到了他的第1个全国冠军。2008年柯洁幸运地获得最后一个定段名额,冲段成功,迈过职业门槛。随后柯洁正式签约云南围棋队,成为一名职业棋手。在全国升段赛上,在二段组比赛11胜1负,在第三轮比赛中就提前晋升三段。
围棋界的“网红”,一边对弈一边网聊
在性格方面,柯洁一反大多数棋手给人沉稳、内敛的印象,而是和大多数95后一样,个性张扬,直言直语,他爱上网,喜欢使用社交网络(他的微博资料还认真填写着:异性恋、求交往)、喜欢追电子产品(从微博观察,他还是个“果粉”),网络还为他提供了另一种日常训练的方式——“下网棋”,他在知名围棋对弈网站的昵称叫“潜伏”,头像是电视剧《潜伏》里孙红雷的剧照。柯洁曾在采访中说:“‘潜伏’的寓意是默默努力,有一天脱颖而出。”
据成都商报报道,从2011年到2013年,柯洁在网上与国内外高手下了4000多盘棋,赢了3100多盘。据对弈网站统计,2012年是他网上下棋创纪录的一年,达到1600多盘。他还有每逢大赛前会上网下一盘的习惯,以快棋“砍杀”高手为乐,第二届梦百合杯世界围棋公开赛决赛第四局输了后,他立马上网用直接读秒的快棋战胜了韩国的元晟溱九段。
同时,柯洁还喜欢一边在网上与高手快棋对弈一边网聊,有时是给网友讲棋,有时是自嘲自己的失误,抒发情绪。
评价李世石:传奇是时候落幕了
在一月举行的世界围棋公开赛五番棋决赛前,柯洁曾表示:“李世石之前说他有五成希望取胜,我想如果一共是一百成的话,他有五成。另外我想说,传奇是时候落幕了。”
对于自己,柯洁曾多次在采访中表示:“我要做这个时代的领军人物,NO.1。”
对于这些言论,有人评价柯洁年少轻狂,也有人认为这正体现出柯洁已经具备优秀棋手最该具备的自信心,要知道,年少时的李世石也是如此。而柯洁目前取得的成绩也足以为他的豪言撑腰。
AlphaGo约战?“我的胜算大概六成”
AlphaGo将柯洁作为了下个挑战对象,那柯洁怎么想?
在AlphaGo对战李世石之前,柯洁在1月份接受果壳网专访时表示:
我当然非常想和它下了!当然不是为了钱或者什么的,而是想看看自己到底有什么实力。因为它和樊麾下的这五盘棋,其实是樊麾下得太糟糕了我觉得,完全是……有点看不下去,没法看的(笑)。甚至大家对这个棋谱都有很多质疑,怀疑他是不是有意放水,搞不清楚。他可能也是好久不下棋了,实力表现非常糟糕。
但不只是我想下,我们棋院可以说所有人都想和机器一战,都想挑战一下这个“阿法狗”。我觉得只要是懂点围棋的都会想和这个计算机高手下一盘吧!都非常期待看看它到底有多大的实力,有多大的能量。
我觉得我去下的话也非常有信心能战胜这个阿法狗。这是就现在来说啊,以后不知道。
在人机大战第一回合结束后,柯洁坦言“阿尔法围棋”的实力远超自己想象,现在“谁输谁赢不敢说,说实话都有点想支持‘机器’了。” 对于未来可能被约战,他表示:“如果被约战,我肯定会接受,’百看不如一试’嘛,”柯洁说,“我想电脑终究有一天会击败我们所有职业棋手,但目前我肯定会尽力拿下,我相信自己还是会赢的。” 他估计自己的胜算有6成。
柯洁也有自己的顾虑:“通过AlphaGo和李世石刚刚的比赛可以看出AlphaGo一定是弱于我的,但我不想通过比赛让AlphaGo拷贝我的比赛思路。”
前微软亚洲研究院副院长张峥曾解释过:“其实“偷招”这个倒不用担心,五局的样本对机器没用,它不靠这个,靠的是工程上高效率、策略上粗枝大叶但大方向正确。”
外界评价如何评价?
韩国棋院博士裴泰一认为,现今世界棋坛当之无愧的第一人必是未来的柯洁。
李世石:“这种自信满满的表现,不就是小朋友的魅力所在吗?先不说韩国围棋界,也不谈国籍,作为前辈棋手一定要阻止柯洁这么小的年纪成为第一人。怎么说也得20几岁才合适吧?柯洁。。。现在太小了吧?”
日本围棋史上最年轻的九段棋手井山裕太:柯洁是世界上顶级的棋手。
上海围棋队主教练刘世振:“从人的风格、以及棋的风格上来看,柯洁都非常像年轻时的古力。而且柯洁的计算力要比古力更快更准。”
五、今天的比赛,想看柯洁的上哪?
虽然嘴上狂傲,但是相信今天的比赛给每一个职业围棋选手的冲击都是很大的。今天凌晨一点,柯洁还在微博发自拍,感叹:“辗转反侧,梦醒黑白”。#还是一个多愁善感的文艺少年啊#
知道你和我一样,都被这个97年点天才小鲜肉的狂拽酷炫所迷倒了,那今天(3月10日)的人机大战第二场比赛,能在哪看到柯洁呢?他被邀请到乐视直播间去了,别怪我没提醒你哦#请打赏广告费#!