扫码打开虎嗅APP
一周前,腾讯大家编辑部就一个热点社会问题向作者约稿,作者经过七天考虑,最终给的答复是他并不打算写这篇稿子。让人感动的是,作者并非只是简单地拒绝写作,而是写了一封6000字长信,来解释他不写约稿的原因,大家编辑部最后决定通篇发出,让更多读者一起感受这位作者的情怀。按照作者本人要求,大家编辑部选择隐去了作者名字,并不为本帖支付任何稿费。
本文来自微信公众号:大家,ID:ipress,虎嗅获授权发表,题图来自视觉中国
贾兄:
十分抱歉,我这个文章,这两天交不出来了,因为我研究之后发现,涉及的面实在有点复杂,如果不介意的话,可能要一个月的研究时间。我在这里跟你解释下为什么(希望解释的篇幅不会太长,不要浪费太多时间)。
贾兄约稿的内容是关于学术界的评价规则和猫腻。
这个选题如果有意义,在我看来,它必须满足一个基本判断,即“中国的学术界评价规则有巨大漏洞,这个漏洞使得许多低水平人士获得了很高的评价,且形成了劣币驱逐良币的效应”。
将规则和猫腻联系起来的是几个关键词,即“巨大”“许多”“劣币驱逐良币”。我来谈一下为什么这几个关键词重要。
A. 先来谈“许多”的问题,这里有几个关键点
(1)之所以认为猫腻一事值得谈,有一个前提,就是猫腻常发生。“许多”的意思就是要保证“猫腻”是重复发生的,从论证的角度,毫无疑问,我们需要提供数据。通常情况下,我们知道猫腻都是通过媒体曝光,但问题是,媒体曝光只是以个案的形式曝光的,我们根本不可能通过媒体知道这个猫腻是不是重复发生。
(2)媒体有放大镜效应,媒体一报道,会让人直觉上以为天下乌鸦一般黑,但如果去掉媒体的放大镜效应,我们就不会犯“从个案推出普遍”的错。虽然成熟的学者、观察者一眼就能看出到底是偶然事件,还是常态事件,但写文章的时候,绝对不能说“一眼就看出”这种话。对于成熟学者来说,直觉和事实经常是吻合的,但写文章的时候,不能假定吻合,直觉必须被验证。
B. 再来谈“巨大”的问题
有漏洞与有巨大漏洞,是不一样的。一个系统有巨大漏洞,说明这个系统本身该被废除,但如果只是有漏洞,那么从理性主义的角度来讲,应该通过缝缝补补的方式保留,如果漏洞不大,那么就需要容错。
这就好比高中选课,如果物理化学,不管怎么考,永远只有三十分,那就应该选文科(相当于换一个系统),但如果能考六十分,那么就应该请请家教,说不定能上八十(这说明系统的框架没问题,只不过写代码的人比较不负责任),但如果能考九十的,就没有必要花钱请家教,老老实实准备错题集(这说明系统框架没问题,写代码的人也负责,但可能是粗心)。
C. 关于“劣币驱逐良币”
之所以要强调“劣币驱逐良币”这一条件,是因为考虑到时间问题。
我们今天可能推出一个很好的制度,但是好的制度并不意味着能够立竿见影。我们说美国制度好,有没有想过美国制度经历了两百三十年的磨合。在这么长的周期里,在这个过程中发生过南北战争、多次大萧条、多次金融危机,从宏观的角度看,民权在扩大,人均寿命在提高,人民收入在不断提高,的确是变好,所以我们说这个制度是有希望的、是好的。但我们如果站在历史的细节中,假设站在南北战争中某个点去看,假设我们就是其中参战时的一个小士兵,我们会不会觉得美国制度要完?
转过来说,我们现在从媒体上知道了许多头衔学者的丑闻,但是我们能不能说这整个评价体系有问题呢?这取决于我们站在那个点。如果我们站在“南北战争参战士兵”这个点,那么我们会觉得这个体系坏的要死。但如果这套体系存活的很好,活上个五十年,后面的人比前面好,我们站在未来的某个点回望,我们是不是会说,“这套评价体系挺好的,只是起初的时候,那批人水平不行”。
一套系统,放在三十年里看,好像是在劣币驱逐良币,但是放在六十年里看,或者九十年来看,或许就不是劣币驱逐良币了。我们不是上帝,不知道未来,也不知道自己身处的是不是历史结点,所以无法预测系统是否本身会更新。
在做这个选题的时候,尽管我打了一堆电话,查了一堆资料,每个人都跟我说这个猫腻,那个猫腻,但依旧是样本不足,有些研究评价系统问题的学术文章,要么是缺乏数据支持,要么就是从语句到语句的推理,没实证。
所以,我根本没有办法通过媒体曝光的丑闻以及文献调查推出结论,我们的评价系统有问题。
当然,我个人是认为有问题的,因为国内数据库的文章质量,在我看来,都差的一塌糊涂,下载一百篇,九十九篇是垃圾。但问题就在于这只是我觉得。我可以觉得学者水平都很差,但是我不能以此作为讨论的起点。
理由有三:
(一)我比较熟悉的只有文史社科,无论我怎么分析,都是以偏概全
中国改革开放四十来年,学术发展总体上很快,但每个领域发展的并不平均,发展的最好的,也是国际化程度最高的是工学和医学、农学之类,越实用的发展的越快,比较中间的是社会科学和理学,接下来是史学,最差的,也是混混最多的,是文学和哲学。
像浙江大学、清华大学,每年都有少量工学类博士去常春藤做博士后,运气好的话,还能留下来,获取教职。而文科就比较差了。八九十年代,北大复旦都有不少学生可以申请到美国常春藤的博士名额,有时候会因为中美关系,人家有意放低标准接纳中国学生,同时也是那时候竞争者比较少。
但是到了2008年之后,几乎没有了,原因两个:
一个是,在全球化竞争激烈之下,同期美国文科社科博士比较饱和了。去欧洲可以,但是欧洲的教育质量比较差——其实也不是差,只是对外来学生要求不高。
另一个是因为国内在这方面的本科教育太差,毕业的本科生满足不了人家的招生录取,与国外脱节的厉害,竞争不过其他地区的考生。
如果我们相信学术评价体系和学生质量有关,那么就需要解释为什么工科学生的质量会比文科类学生的质量好,为什么工科类师资会比文科类师资好这么多,毕竟他们是在同一套学术评价体系下成长起来的。
这里有许多的问题需要解释,比如:
(a)是不是因为不同学科,不能采取同样的学术评价体系,现在的评价体系只适合工科,而不适合文科;
(b)是不是因为工科和应用结合的更紧密,过去四十年,制造业的发展意外训练出了一支工科队伍,而文科教育和应用结合的不紧密,所以没有发展出一个好的机制去提高师资和学生水平,诸如此类的问题。
这里面的干扰因素太多,学科之间的差异有太大,让我不敢泛泛而谈,用一个大词“中国学术评价体系”去讨论所有情况;
(二)语境和年代的问题。
我可以指出那些知名学者一大堆论文中的不严谨,但这里需要考虑有关“语境”和“年代”差异的问题。我是一个出过国,在海外接受过专业学术训练的人,同时也自认为是一个自学能力很强的人,我知道现代学术工业的基本玩法。但是,我不能以自己为标准说那些我看不上的知名学者是被高估的。
道理很简单,现在那些吃香喝辣的学者——或者说学阀——都是55岁以上的人,这些人在20年前,其实相对同行来说,都是还不错的,虽然从现在的角度看,他们基本上还不如国外一个普通学校的硕士水平。但如果我们回想二十年,他们是不是挺好的呢?
这些人当初被选上这个学者那个学者的时候,中国的学术标准还未确立,八零九零年代的很多学者都搞不清抄袭是怎么一回事。中国真正开始正视抄袭,我觉得应该要拜方舟子所赐,以及互联网形成的监督。就我个人而言,我当然是厌恶抄袭的,但我似乎又不应该拿那些老人说事。
南存辉,很有名的浙商,当年做电插头,做了一批质量很差的,周其仁问,你干嘛做假冒伪劣的?南存辉说,我没见过什么是真的啊~
按现在的标准,那些上了55的,没有接受过海外学术训练的,搞哲学的,几乎都是民哲,搞历史的都是民史,尽管有少数像葛兆光这样的例外,但大部分都不行。想想看,我一个老师,98年写论文的时候,他导师给的意见是“你怎么没引用马克思”,就知道当初的水平有多低。
如果我们宽容一点看,放到一百年看,维特根斯坦、罗素等哲学家的很多写作内容都很不规范,那些成长的年代,八九十年代,无论是世面还是对于规则的认知,远远不如1970年代以前的英国。
这么看来,现在很多被曝光头衔学者水平差,与其说是我们的评价体系有问题,不如说是因为当初的水位太低。
(三)历史遗留问题
水位太低是一个历史遗留问题。
中国的院士制度始于民国,后来中断,80年代又开放,后来在98年开始出现长江学者,接着各地出现了这种学者,那样的学者。
为什么会有这样的评选?作为一种荣誉体制,自然是为了树立榜样,全世界的荣誉机制都一样。但荣誉机制能不能发展的好,很多时候取决于初始者的水平。长江学者,起初的时候,都是由一批经历过文革的老人决定的,后来就慢慢演变成,老的长江学者评新的长江学者。
我们现在经常会有一些媒体报道,说一些老学者德高望重之类的话。但其实是媒体在树楷模,赚同情,信是不能信的。经历过极端年代的人,经历了这么久的不学习,无论心智还是学识水平,都是值得怀疑的。事实上也确实如此,我们现在把茅于轼、李泽厚捧得很高,但是学术水平上,是不作数的。
长江学者98年开始评,如我前面所说,那一代人整体上就不行,由于评选模式是,前人评后人,如果前面的人taste很差,后面被选上去的人也不会很好。同样的机制,其实放到诺贝尔奖就好很多。
当年爱因斯坦提出相对论,诺贝尔奖委员会要给他颁奖,那些先前拿了奖的人说,如果你颁给他,我们就退还诺奖。道理很简单,因为相对论没证据,理论上再对,但是未经验证,就不好作数。后来诺贝尔奖以其他理由给爱因斯坦颁了。想想看,诺贝尔奖公信力这么高,其实和前期获奖者的taste很有关系啊。
基于理由(一)(二)(三),所以我不认为能以“学者水平都很差”作为讨论评价体系问题的起点。
关于评价体系,最后,我提一点我自己的看法。
我觉得国家其实也意识到了这里面的问题,他们也想出了不少的解决方案,比如,不停的推出新的评价体系。
2015年开始的青年长江学者,2008年开始搞的千人计划。为什么要搞这些计划呢?主要还是请神容易送神难,一旦弄了长江学者、两院院士,就形成了利益集团,但又不好随便得罪人,所以只能另起炉灶。好处是,新的炉灶能够摆脱原来那批老人,坏处是评价体系太多,太臃肿,头衔通货膨胀化。
其次,中国的评价制度其实是非常严苛的,相对于国外要严苛的多,只不过这个严苛转化不能完全转化到学术能力上的较量。
浙大评一个副教授,即要有国家级课题,还要权威期刊的发表,除此之外还要获奖之类的。但是国外不需要,只需要拿出代表作,专家之间互评。为什么国内要设立这么复杂的评选,而不设立专家互评呢?两个原因:
1. 政府学术大跃进,要出政绩,希望通过激励机制的角度,让学者往前冲;
2. 对于个体的不信任,因为让国内学者互相参评,最后会人情利益大于学术标准。
我们知道,考核政府管理部门的主要指标是绩效。中国政府部门特别讲绩效,是因为绩效合法性是各国政治的合法性来源之一。
一个规则的合法性来源有三个,政治程序合法性(民主与法治),绩效合法性,以及意识形态合法性(机会之地,应许之地、复兴之地之类)。如果在第一个和第三个合法性方面比较弱点,一直是通过绩效合法性来弥补的,这种绩效主义文化从政府蔓延至学术机构,所以在评价体系上面特别讲发表论文数量、申请到国家课题多少,各种指标化。
指标化的好处就是清晰,但指标只能用来看的,但是不能用来追求的,一旦拿来追求,就丧失了效果。这就好比GDP,当没有人去追求GDP的时候,GDP能够看出一个国家的发展效率,但以GDP作为标准去追求的时候,它就会失真。
有人说,要建立同行评议机制。这个我是同意的。只是因为互相参评推动学术进步的方式太漫长了,政府部门等不了,政府需要效率。
同行评议有效的前提是,形成一个自主的学术共同体,它其实需要各种相关机制辅佐,比如学术民主等,还需要学者们的知识水位高度差不多,有基本的学术范式共识。除此之外,学术共同体内部还要酝酿一个长期有效的自由主义文化传统。反正诸如此类的前提条件要一大堆。就目前而言,中国的学术界不具备这些条件。既然如此,校方自然也不相信同行评议搞的好,还不如让教育部、科技部之类的部门指挥,或者就是地方社科联之类的,下面跟着就好。他们指挥的方式,就是搞一堆课题。
就评选课题的程序而言,还是比较严格的,至少我问了周边的老师和同学,都是实行双向匿名评审的,而且要经历好几轮,评审的时候都是去某个宾馆,手机什么的都没收的。但问题就在于,学术圈子其实很小。谁研究什么课题,到底专家库有多少人,差不多都是知道的。
一说起法国史,就不外乎谁谁谁的学生,一说起搞德国史的,就不外乎谁谁谁的学生,一说起搞希腊哲学的,就不外乎谁谁谁的学生。这样一来,其实大家都有数。如果不知道,那就多去参加各种学术会议,认识人,主动介绍下自己。同样类型的话题,一年之内,学术会议有十多轮,甚至几十轮,但去的人总是那么几个。一回生二回熟,下次评审的时候就知道了,稍微打个招呼就过了。很容易就演变成互相输送利益。
利益输送对不对呢?作为旁观者来看,是不太好的。但是从规则的角度来看,也说不出有什么错,所以我没法拿这个说事。
其实这种输送利益的模式,并不是中国人想到的,美国人早就搞过了。一对教授坐在那边挑老师,一个教授对旁边的教授说,我想选这个人,你如果愿意投的话,我就投你喜欢的那个,结果互相输送利益。这样的评选机制,在西方国家到处渗透,在中国也是,你当然不能说这是一种好方法,只不过这样的做法不错。
同样,发表论文也是一回事。每个学校都弄出一堆核心期刊,然后鼓励学者在上面发表文章,可以算业绩。
但期刊和期刊之间差异很大。投稿给期刊的编辑,编辑把文章发给评审。尽管是双向匿名的,作者不知道评审,评审不知道作者。但里面依旧可以暗箱操作,你如果和编辑关系很好,编辑会发给一些很好说话的学者,程序上没问题,这文章就发了,有些学者比较苛刻,那就发不出来。西方的学者就不会这样,因为西方的学者每个都苛刻。这样就是为什么国外期刊的含金量要比国内的高了多。
这一系列评选机制,单独来看,其实都没问题,而且还都构成了闭环。事实上,很多还都是照搬国外的,但放在一起的时候,不是这个有问题,要么就是那个有问题,看看都很好,但就是不发挥作用。一套系统设立的时间不对,系统的早期维护者taste不行,加上一堆历史遗留问题,诸多原因才导致了今天的结果。
那么,问题(question)来了,这是不是问题(problem)呢?
是,也不是。
说是,是因为,水货太多,这是明摆着的,每天爆出一个丑闻,人们对于学术界的信心是要瓦解的,而且短期内也解决不了。说不是,是因为这些不够格的学者总要退出历史舞台的,等他们都没了的时候,总要比现在好。
长江青年学者的水平总体上就是比长江学者好,而且好得多;千人计划的质量也比院士质量好,好得多。设立长江青年学者和千人计划都类似于外科手术式的做法。其实挺有效的。比如浙大把赵鼎新挖来之后成为新的系主任,他一次性挖来一堆海归,把整个社会学系的水平连续往上拉了几个台阶,如果他们能培养出优秀的本科生,把他们再送出去,等个五年十年再回来,国内学者的taste不就一下子好了多么。只不过,这需要时间。
从历史的角度看,今天比三十年前好,你也不能保证,未来的三十年不会比今天好。评价系统或许没怎么变,只不过人变了,那么学术界总体上也变好了。大概对于你我的问题是,那个比较好的学术界轮不到我们来享受了。
好了,我写了五千多字,整篇文章只是想解释,解释我为什么写不出贾兄要的文章,原因很简单:我无法建立起“学术规则”和“学术猫腻”之间的因果性联系。如果可以的话,给我一个月时间,我再反复研究下国内的评选机制,看看有没有新的发现。
腾讯《大家》独家稿件,未经授权,请勿转载。