扫码打开虎嗅APP
本文来自微信公众号:生物学霸(ID:ShengWuXueBa),原文标题:《为了论文能尽快发表,我私自篡改了实验数据:游走在学术不端边界的博士们》,头图来自:IC photo
最近韩国纳米材料大牛李永熙(Young Hee Lee)教授只怕有点头疼。
今年 7 月李教授课题组发表的 Nature Nanotechnology 论文中,拉曼数据和透射电镜选区电子衍射数据涉嫌造假。
图片来源:Nature Nanotechnology
李教授为韩国科学院院士、ACS Nano 副主编,是国际纳米材料领域的顶级科学家,还是韩国的国家学者(National Scholars)之一。如此重量级的科学家涉嫌论文作假,不知道这是不是又一次黄禹锡事件。
当然,学术圈打假的门槛比较高。如果不是事主承认,学术不端往往不是三言两语就能盖棺定论的。
因为各种原因导致发表的论文有瑕疵,这是很正常的情况。
不少人总想制造大新闻,听风就是雨,很容易把节奏带坏。今天我来自爆家丑,说说我所碰到的几件游走在学术不端边界的灰色事件。
为发表论文而被修饰的产率
要说令人头秃,科研人一定首选写论文。在薅头发比薅羊毛还迅速的日子里,论文撰写一度是科研人的“噩梦”。
只有在对着电脑枯坐,一天写下不足两百个单词的时候,科研人们才会觉得,那些实验中的屡败屡战全都是小儿科。
归根到底,这种不如意还是来自实验数据没有足够好。
“当时只道是寻常”,没日没夜熬出来的实验数据,在写论文的时候才被发现竟然略有差池;“只是当时已惘然”,已经开始写论文,数据即便有瑕疵,也是“箭在弦上不得不发”了。
好巧不巧,这种经历恰好在我撰写博士期间第一篇论文的时候,就真真实实被印证了。
我博士期间主修有机化学和化学生物学,在艰难完成一个天然产物的化学合成后,我开始着手撰写论文。论文写好后,导师说其中一步产率有点低,只有 40 多。
他想让我多重复几遍,怎么也优化到 60 以上,才能勉强算是 modest yield。
刚好那时我手头还有点原料,就花了两周多的时间不断重复再重复。很不幸,产率始终上不去,最高还是 49。分析下来,这个结果也仅仅是熟练度带来的产率微弱提升。
眼看手里的原料要用光,我开始了一次足以改变人生的思辨。
本来吧,能发论文是挺高兴的事情,在项目完成的大前提下,因为一个数据增加过多工作量,本质上是得不偿失的。刨去时间成本不说,科研人也和打工人一样,最忌讳的就是从导师口袋里掏钱,遑论我还未必能搞定,将来搞不好还要面对导师那张饱经数据摧残的老脸。
想通此中关节,我顿时豁然开朗。为了快点搞定论文,我在最后一次实验中,假装无意地缩短烘干时间,把产率好歹做到 54。报告给导师后,再稍稍 make up 一下,变成了 58。
我当时的感觉是,又回到大学里面的公共课考试,即便考 40 多分,授课老师也拼命往 60 分拉。
有时候,写论文就跟嫁闺女一样,大家一起努力,争取在最短的时间内促成此事,免不了动点小心思。
反正数据未见报道,究竟什么样子,这个地球上只有学生本人说了算。端的是“天知地知我知”,所以不排除有些学生会铤而走险了。
回想这段不光彩的心路,一次次地重复实验,不是因为求真和执着,而是一种黔驴技穷后的挣扎,我颇有些心酸和无奈。
尽管如此,今天依旧能够坦然讲起这件事,恐怕还是学术界论及这种对数据小小的 make up 早已司空见惯,所以如果读者想黑我,也请手下留情。
不慎解错的单晶
小小不言地修改数据这种事情,肯定是不光彩的,即便无伤大雅也是道德污点,当事人自黑起来也有那么一丝调侃的成分。但某些学术成果经不起调侃,外界也不允许此类调侃发生。
接下来说的这件事,绝对是无心之失,但造成的后果反而比对个别数据的 make up 还要严重。
我最早的专业是晶体化学,主要做些稀奇古怪的金属配合物单晶。组里有位兄,大三就进组,后面本科毕设直至博士,在组里呆了七年。论资排辈的话,师兄位列前茅是不必说的;就脾性来说,师兄也是组里难得的好脾气;做事又是极其认真负责,学术能力也是组里的 TOP 级人物;所以,他是导师最器重的弟子。
就在我进组后不久,师兄发表了一篇很优秀的论文,迄今为止,在我们实验室发展历史上都有着重大的意义。
论文的 IF 虽然不算顶级高,但期刊是本领域中非常有 credit 的一流杂志,并且当时还是组里发的最好论文。整篇论文从最初 idea 的产生,到设计实验,发表论文,都是在本组完成的。
以硕导的学术履历而言,这篇论文不但摆脱导师博士期间工作的延续,而且还是在不接受任何外组帮助下独立完成的,确实非常难能可贵。
然而几个月后,导师接到编辑部回馈的信件,很委婉地说是有读者写信给编辑,认为我们给出的一个单晶结构可能解错了。具体地,读者认为晶体中应该有三个金属核心,而我们给的是一个单核结构。
咱们都知道,单晶解析实际上收集到的是一些重核的点阵,也就是原子的位置。这个位置上到底是什么原子,则需要根据反应可能的产物来猜测。当然,我们还有其他的检测手段做辅助,帮我们猜得更准一点。
组里的单晶一直是师兄做解析,从来没出过错,怎么解自己单晶会出问题呢?而且按照以往的经验,组里在设计反应的时候,从来都指向一个金属的产物,得到的晶体绝大多数也是单核的。我们这帮傻不愣登的小弟都很信任师兄,觉得是读者搞错了。
出于对自己学术声誉的珍惜,导师把质疑看得很重,让师兄重新解单晶。因为单晶怕水怕氧,保留重测的数据并不太好。导师就让师兄把项目重做一遍,而且每一步都必须扎扎实实。师兄自己也挺慌,带着一个师妹没白没黑地开始重新做实验,导师也一天好几遍地来问。小师妹哪里经历过这个,一周之内哭了三鼻子,最后好歹把高质量的单晶拿到了。
我们组以最快的速度测完晶体,重新解析,自己解完后还找了福建物构所专门解单晶的高手行家请教。最后发现,的确是我们解错了。
导师回信承认了错误,也很诚恳地建议可以撤回论文。幸运的是,编辑部非常慷慨,认为这个瑕疵不影响论文的整体工作和结论,而且并不涉及到学术造假,所以只是在杂志上发了条 correction/addition,事情就这么解决了。
师兄毕业后,导师还经常拿这个事情举例,告诫学生做实验一定需考虑周全,无论是前期的数据收集还是后期的数据处理,都得一丝不苟,考虑到尽可能多的情况。
话虽如此,可学生们的水平总有限,水平高的也难免疏忽,出现错误真是在所难免的。
毕业后我有次跟师兄吃饭说起这事儿,师兄竟然说自己运气好,原话是:还好解错的是我自己的单晶,不然……
瞧,这么好心的人,断然不可能学术造假。然而发表的论文里,却的确存在错误,还被细心的读者逮着了。
您说,这事儿找谁说理去?
故意无视的意外
以单晶解析来说,只有一种结构是正确的。解错的话,一定会出现跳脱的数据。
我后来琢磨着,师兄大概是在解单晶的时候有意无意地忽略了几个关键的跳脱数据,所以才搞出上面有惊无险的一次意外。
相比较而言,还有一些意外就更多了。实验中总会遇到很多跳脱的数据,拿到各种意料之外的结果。
绝大多数时候,我们没有时间和精力来进行解释。因为这种解释往往意味着延伸出更多的实验,而在这些延伸出的实验中,肯定还会再次出现意料之外的结果,一环套一环。
我们总在解决问题的时候发现新的问题,于是问题越来越多,就像愚公说的那样“子子孙孙,无穷匮也!”
我博士期间进行过很短暂的多肽合成,虽然有理论上那么完美的固相合成技术,但总有些氨基酸就是上不去。我们知道那么多氨基酸连不上的原因,在设计反应的时候尽力回避,但真的到了连不上的时候,也没人能说出个所以然。
类似的,一条多肽有时并不是直接用固相合成法就能搞定的,需要先合成两条短肽,再通过自然化学连接得到。这类连接反应的模版很多。具体到目标多肽,根据不同的模版反应,理论上可以选择不同的连接位点,对应两段不同的短肽。
比如一段 60 个氨基酸的多肽,到底是用 20+40 还是 30+30,这是很考验学术直觉的事情。经常会碰到容易连上的位点,也有怎么都连不起来的。
当然,这些问题确实有人研究过,也能查到文献,但当面对一条新的多肽合成路线时,常常很难给出完美的解释,也不太可能验证。
多数时候给出的解释是:序列决定的(depends on it’s sequence)。很显然,这个解释非常牵强,约等于什么都没说!
面对这样的意外,更多的情况则是选择性遗忘。偶尔一次备料做坏了,其实无伤大雅,再来一轮,能顺利做过去就行了。连接位点选错也没关系,重新选一个,发论文的时候只说自己搞定的,对自己没有连成功的位点提也不提。
只要最后做成了,之前的失败可以全都忘掉,反正也没有时间搞清楚。
这些说不清的结果,绝大多数没有体现在论文里,可能有一小部分会在毕业论文中提一句,不然那些失败的实验,没办法体现出工作量嘛。
但提归提,给定论是不可能,随便写一个大家都能接受的、可能的解释就好。同样的,“天知地知我知”,没人追究的。
从某种意义上说,这种偶然闯入的“小意外”里有一定概率蕴藏着革命性的发现,科技史上这类例子不少。很多理想主义的研究人员也认为这些意料之外的结果才是科学研究的精髓。
但如果每个博士生都抱定把所有碰到的“小意外”都弄明白的信念来做研究的话,恐怕一辈子都读不完博士。
所以,对某些跳脱的意外视而不见,是博士生们“自保”的方式之一。
理想很丰满,现实很骨感。实验中碰到的情况,远比用软件写下的方程式和机理更加复杂,也比简单几下 PS 更难。
回到最初学术不端的问题,相信任何有过足够实验室经验的人,大概都会认为这是个灰色地带。
最终的认定,也需要非常专业的人士来评估。所以,面对那些新闻,我们还是应该保持清醒的头脑,不跟风,不盲从,让新闻飞一会儿。
本文来自微信公众号:生物学霸(ID:ShengWuXueBa)