扫码打开虎嗅APP
5 月 12 日,学术打假名人 Elisabeth Bik 发文指出,最近由中国科研团队在《自然》发表的新冠病毒小鼠模型研究论文中,来自两个不同组别的图像出现了“可能的重合”。目前 Bik 的这条 Twitter 已经有上千个转发,相关团队和《自然》仍未公开回应。
图像造假已经成为生物医学领域的一大问题。近日,多家学术出版商合作成立了工作组,探讨如何建立图像查重合作机制,并计划对图像问题进行更加明确的分类和界定。
本文来自微信公众号:科研圈(ID:keyanquan),作者:戚译引,原标题《中国医科院Nature最新论文被指一图多用,涉及新冠肺炎动物模型》头图来自:Pixabay
5 月 7 日,中国研究团队以加快评审形式在《自然》在线发表论文,题为《SARS-CoV-2 在 hACE2 转基因小鼠中的致病性》(The pathogenicity of SARS-CoV-2 in hACE2 transgenic mice),在小鼠中转入人血管紧张素转换酶 2(hACE2)基因,构建能够感染新冠病毒的小鼠模型,以促进相关药物和疫苗的研发。
该研究最初于 2 月 28 日发表于预印本网站 bioRxiv。研究由中国医学科学院实验动物研究所、北京新发传染病动物模型重点实验室、北京协和医学院比较医学中心和国家病毒性疾病控制预防研究所等单位合作完成,共同通讯作者为中国医学科学院医学实验动物研究所所长秦川教授、中国疾病预防控制中心病毒病预防控制所武桂珍研究员。
5 月 12 日,学术打假名人 Elisabeth Bik 指出,这篇论文的 Fig.2 中,本该来自两个不同对照组的图片出现了重合区域。在野生株小鼠(WB-HB-01)和 hACE2 空白对照小鼠(ACE2-Mock)的肺部组织 HE 染色图片中,部分区域的纹理看起来高度一致(见蓝框标注)。
图片来源:Twitter
有 PubPeer 用户进行了图像处理方面的分析,认为两张图片蓝框区域中强度和边沿高度一致。
图片来源:PubPeer
有网友询问 Bik,这类重复使用图片可能的动机是什么,Bik 回答:“我注意到重合部分更有可能出现在两个不同的对照组中,正如这个案例。这可能表示研究者只设置了一个对照组,以便节约实验动物,或者应付评审人的要求。”
Bik 还表示:“这是一份‘未经编辑的稿件’,‘在最终发表前将会经过审校’。这很有可能被认定为‘证明过程中的小失误’。”但很显然,一张有问题的图片足以令同行感到强烈的不信任。许多人在 Bik 的推特下面列举了论文中其他的疑点。
屡禁不止的图像造假
如今论文文字查重技术已经比较成熟,相比之下,识别图像造假的技术还有许多不足。2016 年,Bik 团队对生物医学领域超过 2 万篇论文进行了人工分析,认为多达 4% 的论文包含有问题的图片。
近年来,Bik 团队还揭发了多起中国学者的图像造假事件。2019 年 11 月,Bik 团队指出南开大学校长、中国工程院院士曹雪涛参与的多篇论文数据可疑,实验图片有 PS 痕迹。据《自然》报道,最终 PubPeer 上被指出有疑问的相关论文超过 60 篇,截止今年 5 月有 13 篇作出了更正,大多数更正声明都宣称研究结论没有受到影响。
今年 2 月 21 日,Bik 团队宣布发现超过 400 篇论文可能都来自于同一个“论文作坊”。这些论文全部来自于中国的几十家医院,其中包含了多家三甲医院,涉及不同作者、不同研究领域。其中许多论文也是因为图像高度相似而露出马脚。
《自然》的另一篇报道指出,目前许多期刊都没有雇用专人审核论文中的图片,理由是这样做成本太高或太花时间。现有的技术也无法大量扫描论文图片。一些公司已经开始提供小规模的图片审核服务,例如日本的 LPIXEL、以色列的 Proofig、意大利的 Resis 等。还有研究者在开发能够对多篇论文中的图片进行交叉对比的软件工具。但是,大型出版商需要的是能够处理大量图片的软件,并且它要能被整合到同行评审过程中,最好还能对大量论文中的图片进行交叉对比。
图像也需要“查重数据库”
为了解决这一问题,学术出版界已经行动起来。今年四月起,国际科学、技术和医学出版商协会(STM)标准与技术委员会(STEC)成立了工作组,探讨如何自动识别论文中的图像问题。工作组由爱思唯尔学术诚信高级副总裁 IJsbrand Jan Aalbersberg 任组长,成员均来自施普林格·自然、威立、T&F 等学术出版商。
工作组的任务是梳理对图片扫描软件的最低要求,并探讨出版商如何借助这一技术处理数十万甚至百万计的论文。该团队还希望对“图像问题的类型和严重性”进行分类,并“制订指南说明在何种情况下进行何种图像调整是允许的”。
爱思唯尔出版服务主任 Catriona Fennell 也是工作组的成员,她表示爱思唯尔对少数论文的“工业化造假”高度关注。前文提到的论文作坊就属于这种情况。她指出,不同论文中的相似之处很难在同行评审过程中被发现,不仅是因为大多数审稿人不会留意这类问题,也因为这种方式产出的论文会在同一时期被投往不同期刊,在保密情况下接受评审。因此,学术出版界需要一个共享数据库,以识别论文之间重复使用的图像,就像使用 CrossCheck 进行文字查重一样。Fennell 说:“在图像审核方面,我们也需要同样的合作模式。”
相关论文:
Bao, L., Deng, W., Huang, B. et al. The pathogenicity of SARS-CoV-2 in hACE2 transgenic mice. Nature (2020).
https://www.nature.com/articles/s41586-020-2312-y
参考来源:
1. Twitter 讨论:
https://twitter.com/MicrobiomDigest/status/1260030238987128833
2. PubPeer 讨论:
https://pubpeer.com/publications/0FD2B5E6B80FF1A63F834A964A309D
3. Nature:秦川等揭示 SARS-CoV-2 在 hACE2 转基因小鼠中的致病性,生物谷
https://news.bioon.com/article/6755709.html
4. Meet this super-spotter of duplicated images in science papersm, Nature
https://www.nature.com/articles/d41586-020-01363-z
5. Publishers launch joint effort to tackle altered images in research papers, Nature
https://www.nature.com/articles/d41586-020-01410-9
6. STM STEC Working Group on Image Alterations and Duplications, STM-ASSOC.org
https://www.stm-assoc.org/standards-technology/working-group-on-image-alterations-and-duplications/本文来自微信公众号:科研圈(ID:keyanquan),作者:戚译引