李盛兵|打破高校学术评价的“四个替代”
摘要:“四个替代”是我国高校学术评价的主要表象和问题,严重影响了我国学术研究的生态和风气,阻碍了我国科学技术的进步和高校人才培养工作,必须全力打破。我国高校学术评价存在简单化和片面化两大问题,具体表现为“引用替代”“刊物替代”“数量替代”和“科研替代”。通过分析中外高校学术评价的量化与质化之争,概括质化为主、量化为辅的国际主张,在此基础上,提出打破“四个替代”的主要思路与方法。
关键词:学术评价;“四个替代”;教师评价;人才评价
高校学术评价是高等教育评价的重要组成部分,在高校人才培养、科学研究和社会服务等方面起到重要的指挥棒作用。目前这个指挥棒出现了问题,所指方向偏离了正确的轨道,伤害了高校广大教师的工作积极性和学校长远发展。因此,对高校的学术评价改革势在必行。《深化新时代教育评价改革总体方案》提出,用10~15年甚至更长的时间来解决教育评价这个难题,可见决心之大。本研究直面高校学术评价的突出问题,分析学术评价的质性评价与量化评价之争及利弊,提出要彻底打破学术评价的“引用替代”“刊物替代”“数量替代”和“科研替代”这“四个替代”,久久为功,解决长期制约、阻碍高校学术健康发展的评价问题。
一、学术评价问题突出
我国高校学术评价问题是随着高等教育的发展和科学研究的进步而不断积累起来的,主要集中表现在简单化和片面化两个方面。一方面是简单化问题,它是指“以客观和可比较的数字化形式把学术评价简化成了一种点数字游戏,几乎可以脱离论著的内容本身来实施评价,本质上沦为高校科层制的管理工具,而非基于论文实际学术贡献的学术评价,因此很难识别论文真正的学术贡献。”在许多高校,教师职称评审、人才评价、科研评价,主要是通过计量的方式来评价,包括课题的数量与级别、论文的数量与刊物级别、著作的数量与级别、获奖的数量与级别,忽视成果的实质内容、实际水平。这些方面的学术评价,方法简单,就是数材料,过于量化,没有学术含量,从而导致学术评价工作简单化。
另一方面是片面化问题。高校学术评价的片面化长期存在,与基础教育领域的片面教育和片面评价如出一辙。从全国范围来看,高校的人才评价、教师评价大都是以科研的评价来代替人才的整体评价,而人才培养质量和社会服务质量则不受评价的重视,甚至被严重忽视。这种片面化评价,亦即“科研替代”。重科研轻教学既是高校学术工作的真实反映,也是学术评价的基本观念、行为。当这种观念和行为成为一种普遍行为,甚至成为一种追逐的价值取向,那所带来的不良后果是显而易见、贻害无穷的。就科研评价而言,它也表现为评价的片面,过于重视量化而轻视内容评价、水平评价和贡献评价。
二、学术计量评价与质化评价争论不止
历史上,存在着学术计量评价与质化评价之争。在20世纪80年代,西方学术界就开始对学术评价到底是以量化评价还是质化评价为主的问题进行了长期争论。为了更理性地讨论学术评价之争,这里有必要认真分析和反思关于学术评价的两个宣言和我国关于“唯论文”的十个“不得”。
第一个宣言是“旧金山宣言”。2012年,学术期刊的编辑和出版者反思科研评价问题而发表的“旧金山宣言”,呼吁停止使用期刊影响因子等期刊计量指标来评价研究论文和学者个体的贡献,主张同行评价是科研成果评价最主要的方式,强调科研产出的多样性。对于科研产出,除了论文之外,还包括著作、数据、试剂和软件等,呼吁采用更广泛多元的影响测度方法,包括定性指标,如对政策和社会实际的影响等。《科学》杂志和欧洲研究型大学联盟都发表声明支持“旧金山宣言”,认为影响因子会妨碍科学创新,引导研究者过度关注影响因子,追逐“热点”。“旧金山宣言”虽然是学术期刊界提出来的,但是它指出了计量评价的短板和危害,倡导注重定性指标的评价和科研成果的多样性,对学术评价理论与实践都有很大的启示。
第二个宣言是“莱顿宣言”。这个著名的宣言是2015年由专家学者提出来的。“莱顿宣言”提出了学术评价的10个原则,其中,第一个原则是量化的评估应当支持而非取代质化的专家评审,即不能用量化评价来取代质化评价。指出量化指标可以降低同行评议中的偏见并促进更为深入的审议。第二个原则是科研绩效的考量应基于机构、团队、个人的科研使命,而不能用一个标准来评价不同使命的机构和个人。第三个原则是保护用本国语言发表的研究成果,起因是本国语言发表的优秀研究成果不受重视。此外,学术评价还要考虑到发表和引用的学科差异,个人的研究评价应该是一个综合的工作,包括优质的教学工作、科研成果转化、社会服务与贡献等。总的来说,“莱顿宣言”的10条原则强调量化指标只具有辅助性的功能,要重视内容评价。量化评价,计算机都可以做出来,不需要那么深度的高水平评价。随着人工智能的发展,更需要质性评价和同行评价。因此,同行评议、专家评价、内容评价应该是第一位的、主导性的,当然也不能取消量化指标。
2016年教育部颁布的《关于深化高校教师考核评价制度改革的指导意见》指出:完善同行专家评价机制,积极探索建立以“代表性成果”和实际贡献为主要内容的评价方式,将具有创新性和显示度的学术成果作为评价教师科研工作的重要依据。2020年,教育部印发《关于破除高校哲学社会科学研究评价中“唯论文”不良导向的若干意见》的通知,提出十个“不得”,与西方十个原则差不多。可见,无论是中国还是西方都在讨论学术评价的质和量的问题。教育部发布的这十个“不得”主要内容是不得以刊物、头衔、资历、国际发表、影响因子等替代学术质量和水平,强调围绕质量和贡献的学术评价,改变过于量化的学术评价风气,从理念、政策和行为上改变我国学术评价存在的“唯论文”“唯数量”的顽瘴痼疾,打破高校学术评价的各种替代。
三、高校学术评价的“四个替代”必须打破
如前所述,我国高校学术评价存在简单化和片面化的问题,具体表现在“引用替代”“刊物替代”“数量替代”和“科研替代”等“四个替代”。而这“四个替代”恰恰忽视了学术成果的内容、质量、水平和贡献,忽视了人才评价的全面性和教师工作的复杂性,发挥了不良的学术导向作用,严重影响我国高校的学术风气。因此,在中央政府的统领下,需要通过自上而下和自下而上的方式合力打破学术评价的“四个替代”。
(一)打破“引用替代”
“引用替代”是根据引文量判断论文的好坏,引用得多就是好论文。从十个“不得”来看,都要求打破“引用替代”。“旧金山宣言”呼吁停止使用期刊影响因子等期刊计量指标来评价研究论文和学者个体的贡献。《科学》杂志也指出了计量评价的危害。“引用替代”不利于原创性研究的开展与传播,热点问题容易被引用,学术行为容易被异化。典型的表现是发文章引用自己和自己团队的研究。任胜利等指出,作者自引和期刊自引在被引频次中均占有很高的比例。他还认为,把影响因子和被引频次与论文的学术质量直接联系,是没有任何依据的。这是因为论文的引证中存在有大量的作者自引、反引批评式引用、合作者和小团体间的“友情互引”,以及一般意义上的“罗列式引用”,因此,期刊的影响因子和论文的被引次数并不能与其科学价值成正比。如何打破学术评价的“引用替代”呢?以清华大学为例,清华大学物理系在评聘一名教师中,要求评聘小组提供3~5人与申请人同领域相近年龄段国际一流学者的对比名单,评审专家将申请人与名单上的学者进行直接比较。可见清华大学的目标是要成为世界一流大学,它的学术人才评价就是和国际优秀同行竞争、比较。所以,以高水平的同行评估,取代数材料的计量评估,是必须进行的。
(二)打破“刊物替代”
“刊物替代”是指发在高级别刊物的论文都是好论文。这有一定道理,但是不全是。所有SCI、SSCI刊物的文章都是好文章吗?显然不是,这些刊物的论文有好也有坏。既然如此,那么就存在不能“刊物替代”的问题,就必须开展实质评价和内容评价,这才是真评价。学术乃天下之公器,刊物只是发表论文的载体,是学术同行交流的工具。论文质量和水平取决于论文本身而不是刊物。当然,现在刊物很多,学术刊物也有质量高低的区分。备受国内学术界推崇的SCI、SSCI期刊,也开始受到广泛的批评。为此,国家专门出台关于SCI、SSCI的政策文件,来打破唯SCI、SSCI的盲目迷信。苏新宁指出,部分高校还存在论文评价机制问题:通过论文评价教师学术能力时,忽视论文质量,只看论文发表刊物的“影响因子”、是否SCI期刊、是SCI的一区或二区,错误地将评价期刊的指标等同于评价论文价值的指标。部分高校将在SCI期刊上刊发论文与重金奖励挂钩。因此,这种替代必须打破,放弃刊物替代,把刊物作为内容评价的辅助材料。
(三)打破“数量替代”
长期以来,学术评价有一种倾向,就是发表的论文越多水平就越高,课题越多水平就越高,课题级别越高水平越高。这种认识,看起来没有毛病,细想起来却是非常荒谬。其实拿到级别高的课题就能代表水平高吗?拿到课题、拿到经费只是一种投入,而不是产出。评价究竟评什么?是评产出而不是评投入。很多专家没有经费,不需要多少经费,也能产出高水平的成果。这不是更好吗?所以,学术评价到底是评产出,还是评投入,答案是很明显的,但是在学术评价现实中却往往是本末倒置。因此,在职称评价、学科评价、人才评审当中,普遍存在数材料的情况,以量代质。在职称评定中往往以论文数量、发表期刊层次等外在形式作为评价标准,而忽视对论著内容本身的分析并在此基础上对其研究水平与研究贡献做出判断,体现出强烈的量化评价取向。质性评价是需要时间的,需要做真功夫的。“数量替代”问题不利于进行创新研究。
(四)打破“科研替代”
现阶段,“科研替代”特别严重,影响了人才的全面评价,形成了不良的学术风气。课题做得好,就是好老师吗?显然不是。有研究者对我国20所原“985工程”高校职称评聘细则进行分析,发现对于申报副教授和教授职称的教学工作要求标准较低,阐述简单,合格即可。但对于科研则有非常具体的考核要求,对于专著和各级别(SSCI/CI/EI/A&HCI/CSSCI等)期刊应发表的论文篇数以及主持国家、省部级课题的数量给出了明确规定,对论文发表篇数达不到规定数量的申请人进行“一刀切”淘汰。在人才评价中,“科研替代”非常严重。那么,如何破除“科研替代”?黄达人教授指出,对教师的学术能力应以人才培养水平来衡量。他认为评价一个老师学术能力,不是看论文,不是看课题,不是看帽子,而是看他培养的学生是否发展良好,成就突出。西安交通大学把课堂教学作为代表作进行学术评价。这些探索,把学术评价扭转到真正的人才培养当中来,而人才培养则是所有大学活动的根本。教学工作如何硬起来?就必须在学术评价上下功夫。
概言之,“四个替代”是我国高校学术评价的主要表象,严重影响了我国学术研究的生态和风气,阻碍了我国科学技术的进步和高校人才培养工作,必须全力打破。第一,教育评价要转变思想,思想转变为先。传统学术评价思想是根深蒂固的,必须进行长期的、彻底的革命。第二,要深度评价,不要浅显评价。要内容评价和实质评价,不要计数评价。第三,要全面评价,不要单一评价。要三个贡献度评价,包括学术贡献度、人才培养水平贡献度和经济生产贡献度评价,不要数量评价。
【李盛兵,华南师范大学教育科学学院院长、教授】
原文刊载于《中国高教研究》2022年第9期