扫码打开虎嗅APP
本文来自微信公众号:晚点LatePost (ID:postlate),作者:姚胤米、贺乾明、程曼祺,题图来自:视觉中国
“计算机领域有点像是沉积的岩石,你贡献薄薄的一层,使山变得更加高耸。但最终,人们只是站在山顶,只有带着 X 光才能看到里面是什么样子。”——乔布斯
自从计算机成为一门科学以来,人们对于互联网技术将如何改写我们族群的未来命运发表过诸多富有科幻感的想象。其中最具一致性的图景是,计算机能够像人类一样 “理解” 世界。
现有的 AI 应用已经无处不在,从手机就能完成的夜间拍照到实时翻译对话,从汽车的半自动驾驶到工厂查验屏幕上的残次品。像所有技术一样,AI 的进展也被藏在产品营销的背后,大企业雇一些工程人员,能跟着最前沿的研究,实现 AI 的功能。
这些应用看似轻盈,实则踩在科研人员的巧思和钻研之上,是借助超级算力和电堆积起来的数据庞然大物。过去二、三十年,科学家们日复一日的努力,不过是在计算机具有真正的智慧之前,把人类的感官先挪过去。
视觉是 “机器要拥有智能” 最重要的感官。而孙剑,是计算机视觉这一领域极具影响力的科学家。他拥有超过 40 项专利,在顶级学术会议和期刊上发表过 200 余篇论文,谷歌学术引用高达 28 万次,H-index 指数高达 121。按照论文被引数量统计,全球做计算机视觉领域的学者中,孙剑位列前五名。
由孙剑带队完成的 ResNet 是深度学习领域最重要的研究之一,在很多人心中,“之一” 可以拿掉。亚马逊首席科学家李沐曾评价:假设你在使用卷积神经网络,有一半的可能性就是在使用 ResNet 或它的变种。该论文的被引用量达到惊人的 12 万次。
用户未必总能意识到产品的便利性得益于更精确的 AI 技术。就像乔布斯所说的,技术的积累就像沉积的岩石。孙剑,以及诸多先行者和后来者,用尽一生将技术的山脉垒高一些,为更远的社会变革积累一些基础。
做最先回答问题的人
孙剑是成长于本土的计算机视觉科学家,本硕博都在西安交大完成。他原本读自动化专业,大三时,被《数字图像处理》课程激发了兴趣。博士阶段,孙剑被西安交大和微软公司联合培养,加入成立不久的微软亚洲研究院(MSRA),进入视觉组,师从院长、首席科学家沈向洋。
博士毕业后,孙剑留在 MSRA,在微软工作了十三年。后来,MSRA 在互联网领域鼎鼎有名,被誉为 “中国互联网的黄埔军校”,为诸多公司贡献了技术高管和首席科学家。
2000 年代初是外企在中国的黄金年代,MSRA 天才云集。在西安读完第一年博士课程,孙剑来到北京新微软大厦实习。研究院里早已有研究员和助理研究工程师投入工作,“他们的编程能力都特别厉害”,孙剑一看,编程路可能走不通,“差距太大”,那就只剩一条路了:认真做科研。
不过,把毕生投入科研和实践并不完全如孙剑所形容的,是一个自谦的选择结果。孙剑对于科研有发自内心的热爱,“有一颗赤子之心”,他的同事危夷晨这样回忆道。孙剑曾和我们说,很多博士毕业后再也不想写论文了,他却一直想写,也一直能写。他在旷视管理近 200 人的团队,但工位上仍有一块显示屏始终开着论文。
像许多科学领域一样,计算机视觉的重要问题也只能被回答一次。在这个垂直的科研小宇宙里,有几个核心问题一直都在,对应一些始终解决不了的目标。研究员们都很好奇,都想 “先” 弄清楚。
在 MSRA 期间,很多同事见证过孙剑痴迷科研、苦读论文的样子,他去洗手间的路上也读,11、12 点大家都下班了,他还在读。读到灵感迸发时,孙剑会拿着论文冲出办公室,穿过开放的工位,把同事拉过来热络地讨论。
2003 年,智能手机还是少数极客的玩物,“当时我们都没有敢想这个技术能用在手机上。” 孙剑当时已开始研究如何利用软件和算法拍出更好的照片。那个全新的研究领域后来被定义为 “计算摄影学”,改造的首要对象是数字相机。
条件有限,能看到当时在很好的大学里都见不到的专用计算机图形卡,都能让他们很高兴。为了研究,孙剑和贾佳亚把两人的月薪凑起来,斥巨资买了当时市面上比较高端的单反相机,再结合 MSRA 的环境拿到更多实验数据。他们一整天一整天地讨论问题,每年都有很多个通宵要度过。
孙剑手上的项目最多,同事们体谅地帮他点好外卖。凌晨十二点,饭一到,孙剑快快地吃,吃完快快地走。有时大家做着做着项目,突然发现孙剑不见了,走到外面大厅一看,他已经在沙发上飞快地睡着了。等到被喊醒,孙剑又能精神抖擞地继续做实验和写论文。贾佳亚羡慕极了,他的睡眠就没有那么好。
再后来,孙剑的洞察力越来越敏锐,在 MSRA 视觉组的地位也越来越高。贾佳亚说,很多人都意识到孙剑是一位很好的倾听者,他总是能在讨论找到问题的本质,帮助他们打开思路。
多年之后,孙剑和贾佳亚跻身中国计算机视觉领域举足轻重的人物之列。他们一位在 MSRA 就职十三年,成为旷视科技首席科学家;一位毕业后加入港中文做教授,曾任腾讯优图实验室联合负责人,后创办思谋科技。
在 MSRA,孙剑和贾佳亚并肩而坐,他们都是沈向洋的学生,总是一个讲想法一个倾听,背一样的瑞典 THULE 拓乐双肩包,合作了许多篇计算摄影学领域的重要论文。孙剑是 “大师兄”,大家喊他 “孙老大”。
后来他们共同参与一些活动,贾佳亚跟孙剑扛着几斤重的单反一起爬山,一路拍了许许多多照片。孙剑在生活中总爱拍照,不仅因为他喜欢摄影,还因为他需要数据,别管多少,以后总能用上,他跟贾佳亚说。
答应了接受我们的采访之后,贾佳亚写了一篇情感真挚的悼文。到了约定的采访时间,他无法平静地读下去,只能交给 AI 朗读。近 5000 字的文章,机器人以并不波澜语气读了近 20 分钟。贾佳亚一直红着眼睛,几度离座,最后他干脆关掉摄像头。伴随着黑暗的画面,AI 读完了悼文的结尾,接着,只剩下贾佳亚的几声抽泣声。
“不做到最好就没有存在的意义了。”
有些时候,一个人的行业地位高也许是因为他在这个领域待得足够久。然而,孙剑的地位并非简单努力的结果。计算机视觉曾经历多次大大小小的技术变革,因为眼光独到,转型迅速以及一如既往的勤奋,孙剑得以一直站在技术前沿,引领着行业。
在深度学习之前的远古时期,计算机视觉领域相对小众,虽然也有些应用,但愿没有今天这么广泛和深入。“产品过不了一个技术门槛,就不能变成产品。” 人脸识别也曾是孙剑当年重要的研究方向,但那时的技术水平无法做出今天的人脸支付。
2012 年,多伦多大学 Geoffrey Hinton 团队提出 8 层的卷积神经网络模型 AlexNet 识别错误率只有 16.4%,在 ImageNet 上的识别错误率只有 16.4%,比之前最好的传统视觉方法降低近 10 个百分点,一举轰动整个视觉领域。但由于深度学习的长期低迷,依然有很多学者不相信也不愿接受这个 “新生事物”。关键时刻,孙剑毅然带领团队彻底转型。后来的故事大家都知道了。
孙剑的职业生涯和研究重心作过多次成功的转型,从计算摄影学,到图像检索,到人脸识别,到自然人机交互界面,一直到深度学习。每一次的技术和方向转型多少都会有些 “自废武功”,在新的赛道上跟其他众多的竞争者退回到同一起跑线,重新开始。
危夷晨深知这看似一笔就可带过的决定需要何等的勇气和果决。危夷晨自己就深有体会,他的博士研究课题是三维重建,那是一个相对更小众但成熟的领域。在加入 MSRA 的初期,甚至找不到合适的科研课题。他曾迷茫了好一段时间:不转型,看不到方向;转型,则意味着之前的经验和知识被束之高阁,实在不甘心。孙剑的一句话点醒了他:“就当重新读一个 PhD。” 多年以后,危夷晨依然记得当时内心的触动。
很多身边的朋友都了解,孙剑有种 “大道至简” 的本事。他擅长用最简单的话讲一个最能直击人的内心,使那些道理生效的关键是,孙剑自己也践行并做到了。
2015 年,由孙剑带队,何恺明、张祥雨、任少卿共同完成的深达 152 层的残差神经网络模型 ResNet 参加 ImageNet 大规模视觉识别挑战赛,误差率降到 3.57%,首次超过人眼的准确率,夺得所有细分比赛冠军。2016 年的计算机视觉顶级学术会议 CVPR 上,ResNet 论文被授予最佳论文奖,这也是孙剑带领团队第二次获得该奖项,此前没有科学家获得过这一成就。
ResNet 已经被写进教科书,是每个人工智能从业者都要掌握的基本功。在 ResNet 出现之前,研究人员苦于无法成功训练深度较大的神经网络(十多层已经是极限了),从而无法充分发挥神经网络超强的建模能力。ResNet 彻底地解决了这个基础重要的问题。不仅对于计算机视觉,语音识别、机器翻译等任务也适用。后来的 AlphaGo Zero——DeepMind 研发的升级版围棋人工智能,就使用了 ResNet。
也许孙剑一直珍视自己作为一个技术科研者所拥有的机会,“因为技术变革也不是经常发生,所以正好碰到,觉得挺幸运的。”
他对自己要求很高,电脑上曾贴过一张纸片,写着 “只许成功,不许失败”。他也要求他带领的团队 “必须在某一个字领域的一个特定问题的技术找到最好的算法和最好的解决方案”,而且,还不能是静态的,得一直保持最强,“不做到最好就没有存在的意义了。”
技术一定要有用
科研是一个需要全力以赴的领域。他的人生成年后几乎所有的时间都用来完成一件事,即,在他所热爱的计算机视觉领域搞科研,并尽可能把他的研究成果应用到实践中。
MSRA 是一个由企业主导的研究团队,虽有学院氛围,但强调技术的应用前景。孙剑是一个非常彻底的技术实用主义者,并留下了影响了他同事和学生的技术主张:
“价值务实。”
“这个东西 work 吗?”
“既要做神,也要做鬼。”
孙剑很早就成为了 MSRA 视觉组的核心成员。每年,在微软总部的技术节(TechFest)活动上,孙剑都带领着同事们,找到产品部门的业务负责人交流,找到技术落地的方向。
微软的图像处理软件 Digital Image Suite 在处理照片方面就大受孙剑团队的帮助。有段时间,孙剑非常想把计算机视觉技术做到微软 Office 办公软件里,“那一下就有上千万用户可以用。” 后来他真的做到了。
2016 年,微软在当年的 Build 大会上发布了一个新的云服务产品 CaptionBot。它被使用在为盲人设计的 Seeing AI 眼镜等硬件设备上,能将摄像头拍到的图像变成文字描述,再用语音技术读给盲人听。后来,这个技术又演变成 Office Power Point 的一个小功能:插入图片时,会自动生成文字描述,不再需要手动加文字就可为视障人士读屏。
当时在微软总部任职的 AI 科学家何晓冬邀请孙剑一起合作了这个项目。何晓冬后于 2018 年回国加入了京东,他也认同技术务实的主张,他说:“AI 工程化、产品化是保障 AI 不再回到寒冬的重要一点。”
一位旷视研究院的前员工对孙剑在内部论坛上的一次发言印象深刻,有研究员问孙剑,如何平衡工作和生活。孙剑表达的大意如下:为什么要区分工作和生活?应该融在一起,工作对生活有帮助,生活也能给工作灵感。
倘若换成别人说同样的话,这位前员工可能觉得是公司高管在暗示员工要为公司 “燃烧自己”,“但因为说这个话的是孙老师”,他认真地读完,并想了想其中的道理,一直记到今天。
2016 年,孙剑加入 AI 视觉创业公司旷视科技,担任首席科学家创始人印奇曾是他的学生,唐文斌也曾在 MSRA 实习。
那是科学家们纷纷 “下海” 进公司的年代。技术变革到来后,越来越多科研人员意识到,创业公司有更多的机会和资金,让他们能在细分领域有更多自由度,让自己的科研成果更快地应用到工业领域。
孙剑的同事和学生也多进入知名公司或自主创业。何恺明加入了 Facebook(Meta),在 Facebook AI 研究院(现 Meta AI)任研究科学家;曹旭东创办了自动驾驶技术公司 Momenta;任少卿离开 Momenta 后,加入蔚来汽车,任北美自动驾驶助理副总裁;危夷晨 2018 年加入旷视,担任旷视上海研究院院长。
在旷视,孙剑也要求研究员们报项目时,必须首先保证能在三年内有工业应用价值,才能启动研究。他还要求项目的重要负责人必须 “下现场”,查看技术应用的现实环境,而不只是远坐办公室电脑前,用公式和代码想象一个应用。
旷视公司从孙剑那里收获巨大。旷视研究院自孙剑接手以来,重要科研成果包括 AI 生产力平台 Brain++、开源深度学习框架天元 MegEngine、移动端高效卷积神经网络 ShuffleNet 等;并在多个顶级学术会议和期刊上累计发表学术论文 120 余篇,是中国人工智能领域发表论文最多的公司之一。
旷视员工都尊敬孙剑,旷视研究院在公司里也有着非常重要的地位。有了孙剑之后,旷视容易吸引优秀的计算机视觉人才,很多年轻人加入,是冲着孙剑而来。
接过衣钵,砥砺前行
进入旷视后,“孙老大” 变成 “孙老师”,这个称呼在全公司蔓延。比起世界上绝大多数公司里被称呼的 “老师”,孙剑更接近于一个真正意义上的师者。
尽管管理工作十分繁重,但孙剑一直保持着对于科研的热情,经常亲自参与研究院重要论文的讨论和写作。经常有同事或学生向孙剑咨询关于科研甚至人生的话题,孙剑总是耐心地跟他们交流,设身处地的为他们着想。“我觉得已经超出职场的责任了,按理说不需要那样,大家是工作关系,所以说真的很难得。许多年轻人的学术上的三观,受他影响很大。” 孙剑的一位师弟说。
在所有人的描述中,孙剑的形象都是一致的,他总是带着温和的笑容,即便不认同一些结论,他也很少直接站出来强烈表达自己的反对意见,从没有人目睹过孙剑发脾气。后来,熟悉了孙剑的同事和学生都知道,沉默代表着孙老师对讨论有疑惑。
不论是 MSRA 视觉组还是旷视研究院,身处其中的研究员们都深深留恋那个环境单纯的环境和努力的氛围。多年来,孙剑默默地塑造和维护了这种独特的气质。
在公司走廊,被孙剑偶遇的研究员会被询问上次讨论的进度,有人答不上来(毕竟只过了一个周末),孙剑笑笑离开,留下温柔但无形的压力。后来,有的学生会故意绕过处在交通要道的孙剑工位。
改变和影响人很不容易。孙剑有一种润物细无声的力量。“早些年的时候,我的论文写的不好,每次拿给孙老师看的时候都很彷徨。”危夷晨回忆道。“孙老师会尽量提出意见。有时候可能实在看不下去了,孙老师会委婉的说,要不你再回去想想”。神奇的是,这样几次之后,还真的就写好了。人的潜力就是这样被逼出来的。
孙剑谦和低调。他不太乐意参加公众活动,更多地参加面向技术人士的活动。等到旷视的名气越来越大后,孙剑依然推掉大部分采访、活动和大众评奖邀约,他总是说,叫印奇去吧,叫文斌去吧。后来,他还鼓励张祥雨、范浩强、周而进等年轻骨干代表研究院出席活动、分享学术和实践成果。
而他个人,多年来维持着单纯的生活方式,主要构成要素有三样:科研、运动和美食。
早在 MSRA,孙剑就十分热爱运动。孙剑和危夷晨常年一起打羽毛球。刚开始,孙剑连球都不会发。然而,没过多久,危夷晨发现孙剑的技术突飞猛进。孙剑把他做科研的严谨专业拿来练习羽毛球,看大量教学视频、请教练并坚持长期练习、总结方法和经验,后来,他们一起拿了 MSRA 内部的羽毛球团体赛冠军。
在旷视这几年,孙剑又迷上了骑车和跑步,还要带着研究院的同学们一起运动。在旷视的内部运动打卡群里,孙剑是少有的每周都能完成至少 3 次运动的打卡的人。研究院的团建一定和运动相关,孙剑会带着学生一起爬山、跑步,还会去体验射箭和冰壶。也有研究员苦于孙老师的运动热情,不得不在电脑上发出无声但无效的抗议——我不要举铁!
在论坛上,孙剑发表最多的内容不是谈论技术,而是谈论如何科学健身。他的家里有很多健身和运动相关的书籍,也按照步骤告诉同事跑前如何科学热身、跑步中间如何保护膝盖、跑后怎么拉伸。一位前同事记得,孙剑还曾认真做过一份 PPT 在公司内分享。他还开玩笑说,以后可以叫他 “孙健身”。
6 月 14 日凌晨,孙剑因突发疾病骤然离世。因为消息太过突然,他身边的很多人仍不能很好消化这个事实。孙剑的工位还保持着原来的样子,有员工上班时,为他的在办公桌上摆了一束花。
6 月 18 日,是张祥雨的生日,往年这一天,孙剑会早早地为爱徒送上生日祝福。昨天,张祥雨带着一束花来到公司,对着孙剑的位置深深地鞠了一躬。他在知乎上发布了自己注册以来的第一条回答,他说:要独立,要坚强;接过衣钵,砥砺前行。
人类的历史很长,人的一生很短。一个人匆匆来到世上,又匆匆离开,他个人的痕迹或许总会被时间抚平,但他的智慧将成为世界的一部分。
*《晚点 LatePost》曾在 2020 年 6 月采访孙剑,本文部分内容源自那次访谈。还要感谢贾佳亚、危夷晨、何晓冬、朱明杰老师,以及多位曾在旷视与孙剑有交集的人士为本文提供帮助。
本文来自微信公众号:晚点LatePost (ID:postlate),作者:姚胤米、贺乾明、程曼祺