扫码打开虎嗅APP
本文来自微信公众号:量子位(ID:QbitAI),作者:金磊、白交,题图来自:视觉中国
最近,哈佛相关的一篇未经同行评审的研究,被骂上天了。
原因是,这项研究仅仅根据武汉医院附近的交通流量和病症相关的搜索引擎数据,就得出了一个骇人的结论:去年8月就有新冠病毒在武汉传播。
而且,论文作者的核心研究工具,还是百度。更离奇的是,文章竟可以通过“哈佛”网站审核发表,进一步得到特朗普关注转发。
于是一石激起千层浪。
但或许你会问,这篇论文怎么就“漏洞百出”了,难道用百度写论文就不行吗?问题到底出在了哪里?
如果顺藤摸瓜,再挖掘下这位“脑洞清奇”的论文作者,可能就不难得出答案。
各位看官,且往下细读。
BBC都看不下去了:论文站得住脚?
国内不说了。大家看到哈佛相关的论文竟是用百度搜索来写,直接就笑了。
但不仅在国内,在国外连英国BBC都看不下去:“你们用百度搜索搞研究我不管,但好歹也要用对好不好?”
先来看下论文题目中的亮点(槽点):
对武汉医院的交通、搜索引擎数据的研究显示,疾病的早期活动发生在2019年秋季。
你没看错,不是研究病毒来源等信息,而是“交通流量”和“搜索引擎数据”,然后就得到了如此骇人的结论。
结论是怎么来的?这项未经同行评审的研究,是基于对武汉市医院周围交通流量卫星地图的追踪,以及对特定症状的在线搜索,研究称:
在2019年8月下旬到12月1日,武汉市6家医院外的停车数量明显增加。与此同时,对可能的新冠病毒症状(如咳嗽和腹泻)的搜索量也有所增加。
论文中还强调说:
这将是一个重要的发现,因为武汉最早报告的病例是在12月初。虽然我们不能确定数量的增加是否与新病毒直接相关,但我们的证据支持了最近的其他研究,即新冠病毒在华南海鲜市场发现之前,就已经存在了。
(前方高能:一大波槽点正在来袭)
对此,BBC发问了:证据站得住脚吗?
BBC的质疑点主要来自三个方面。
一、搜索的词不够准确
首先,要提醒的一点是,研究中提到的搜索引擎是我们熟知的百度(在中国,本科生写课堂小作业论文都不被允许这样做的)。
然后,研究人员就在百度上搜索了一些与新冠病毒症状相关的词语,发现尤其是“腹泻”这个词,搜索量有所增加。而且研究发表后,百度也觉得冤,回应称:“大哥,在这段时间,‘腹泻’这个词的搜索量是有所下降的啊。”
怎么回事?
哈佛大学这篇论文中使用的术语,实际上是从中文翻译过来的“腹泻症状”(symptom of diarrhoea)。
BBC便用这个术语,在百度上做了测试,发现搜索量确实是有所增加。
但如果使用“腹泻”(diarrhoea)这个词(BBC认为是在武汉更为常见的搜索词),搜索量的结果实际上是有所下降的。
然后,BBC还搜索了另外两个与新冠病毒症状相关的词语——“发烧”(fever)和“呼吸困难”(difficulty in breathing),他们发现:
在8月份以后,“发烧”的搜索量有所增加,增幅与“咳嗽”相当,而“呼吸困难”搜索量,在同期是有所下降。
此外,BBC对于把“腹泻”作为疾病指标,也提出了质疑:
英国一项针对近1.7万名新冠病毒患者的大规模研究发现,腹泻是第七大最常见症状,远低于前三大症状:咳嗽、发烧和气短。
所以,错误的方法得出的结论,能是正确的吗?
二、停车数量无法准确评估
在这一点上,论文的研究结论是这样的:从2019年8月到12月,医院停车场的汽车数量有所上升。
然而,BBC发现了他们分析中的严重错误。虽然研究中指出,为了避免统计过多或过少的车辆,已经把存在树木覆盖和建筑阴影的图像都排除掉了。
但是从研究的卫星图像上来看,医院停车场的大片区域是被高层建筑挡住了,也就是说,无法准确评估停车数量。
BBC还用白框,注释了被高楼遮挡的区域。
此外,BBC还指出,天佑医院还有一个地下停车场。而地下停车场能从百度的街景功能上看到,但卫星照片只能拍到其入口部分。
对此,研究作者之一的Benjamin还发文回应说:“我们肯定无法在研究的任何时间段内,考虑到地下停车场内的情况,这也是这类研究的局限性之一。”
三、选择哪家医院也是问题
BBC的第三个质疑点,是对医院的选择。因为湖北省妇幼保健医院,也纳入到了此次研究中,但是我们都知道,儿童这个群体,在此次疫情中是很少需要入院治疗的。
然而,针对BBC的这个质疑,研究作者回应道:“即便排除了这家医院,停车数量整体上还是增加的。”
最后,BBC建议研究人员,将“停车数量”和“病症词语搜索”这两个指标,跟其它城市的医院做个比较。
于是三大质疑下来,这篇论文要么就是实在能力不行,要么就是动机有问题了。
暂且相信是能力不行吧。因为这个作者团队,有点神奇。
脑洞清奇的“一作”
这篇论文“一作”名叫Elaine O.Nsoesie,在波士顿大学担任助理教授。
她本科毕业于马里兰大学,在弗吉尼亚理工大学完成硕博士学位,之后便在哈佛医学院和波士顿儿童医院做博士后研究。现在是波士顿大学公共卫生学院全球卫生系的助理教授,主要研究“计算机技术(大数据分析)”实现慢性病和传染病监测。
原来大数据分析这么简单!只需鼠标轻轻一点,人人皆可数据分析,百度你值得拥有。
那搞这项研究,她到底有什么目的呢?
其实人家只不过是平平无奇、脑洞清奇的女生而已。而这只不过是她研究里的一个“侧影”罢了。看了她的主页,你就发现,这项研究真的就只是“小场面”。
通过电商评论来判断食物有没有毒;
通过推特来研究堕胎:
利用社交媒体捕捉人口区域活动:
结合已有人口统计数据和“搜索查询”,评估美国的肥胖发生率:
而其他作者,都是来自波士顿儿童医院的研究员。而其中一个名为Yiyao L.Barnoon的人,可谓是最强辅助了,她在研究过程中负责“处理中文数据”。
那么论文写成了,万事俱备了,还差一个“东风”。
于是东风,他就来了。这次的通讯作者——John S. Brownstein,哈佛医学院的医学教授,波士顿儿童医院的CIO(首席创新官)。
但这些都不重要,重要的是他还有一个身份——“美国广播公司”的撰稿人。
未经同行评审,匆忙发出,媒体争相报道……而且具体“发表”的平台,还是哈佛大学一个叫做DASH的开放存取资料库的分支——哈佛医学院资料库。
这是一个公开开放供学术交流的数据库,意味着任何一个研究者都可以上传自己的文章,通过以后,就将被“哈佛图书馆”保存,每月还会收到读者的反馈报告。
所以,这种“论文”后来被媒体说“哈佛刊发”确实让哈佛有点冤,但研究团队中确实也有哈佛的作者,而且这篇“论文”,恰好符合了某位别有用心的推特大V的需求。
这就是,美国总统特朗普。
这个论文,特朗普觉得很满意
之前美国国内抗疫不力,又赶上黑人之死舆论汹涌,这样指向“中国”的“证据”,特朗普怎会错过?马上就是一个转发,推文分享迅速超过3万,点赞量也高达8.6万。
特朗普的支持者们,也不问对错,也不看看“论文”,大佬转发什么,他们就认为事实就是什么。
但是,也有高赞的评论,一位博士小姐姐对此提出批评:“媒体每天还在持续欺骗民众。”
也有人看穿了特朗普这种甩锅、搅浑水,转移视线的路数。他说:“还玩这种招数?根本无法解决当前的问题。”
可悲的是,更多人只愿意相信他们相信的事情。
而对于正本清源的分析,比如BBC官方发布对这项研究质疑的推文,截至发稿,转发量只有442。
完全起不到“辟谣”的作用。所以,这件事倒是说明了前几年被热议的信息茧房确实存在。
但并非技术造成了“信息茧房”,而是信息大爆炸得厉害,更多人只愿意相信自己愿意相信的东西,很多人只关注愿意接受的结果,而不是判别真相的方法及真相本身。
特朗普或许就深谙此道,在他转推的这则“谣言”中,8.6万个赞代表着8.6万个认同。
中国网友要跟他们讲道理?BBC要跟他们讲道理?
别费劲了。
参考链接:https://dash.harvard.edu/bitstream/handle/1/42669767/Satellite_Images_Baidu_COVID19_manuscript_DASH.pdf?sequence=3&isAllowed=y
https://www.bu.edu/sph/profile/elaine-nsoesie/https://world.huanqiu.com/article/3yaJ7XshNOh
本文来自微信公众号:量子位(ID:QbitAI),作者:金磊、白交