全球高等教育发展呈现大众化、普及化、国际化态势,竞争不断加剧。世界一流大学(学科)的合作伙伴和竞争对手是全球范围的。世界大学(学科)排名“由于其简单性和面向消费者,在利益相关者中享有较高的接受度”,世界大学(学科)排名已成为高等教育领域不可回避的现实,排名对高等教育格局的影响越来越大,受欢迎程度不断提高,与此同时对它们的批评和讨论也在不断增长。欧洲大学理事会2011年的一份研究报告指出:尽管排名存在缺点,偏差,但排名仍在流行。
决策部门、高等教育界和社会对排名的追捧和批评同步上升,可谓是爱恨交加。许多大学通过机构网页,突出自己在排行榜中的位置,以表明自己取得了更高的成绩。大学领导也经常提到他们的机构的排名成绩,以打动资金提供者,并吸引国内外学者和学生的注意。排名的增长向市场发出信号,这些信号随后被放大和反馈,从而为那些在全球排名中取得显著进步的大学创造了一种持续的力量。排名下降也会带来一些后果,要么是因为大学失去了一些声誉,要么是被成长的竞争对手超过从而失去吸引力。因此,许多大学的管理者都在一定程度上遵循这些排名来制定组织政策和实践,以提高自己院校的排名成功率。
各种各样、不同视角的排名产生了积极的影响,因为它们有助于提高利益相关者对高等教育的认识,并促进了高等教育的透明度。另一方面,大学排名也引起了广泛争论,批评意见也指出了各种排名的方法缺陷、指标选择和权重的偏见。批评人士还担心排名会带来意想不到的负面后果,认为无论是在大学层面还是国家层面,决策者都会滥用排名。
纵观当前存在的各种类型和各种层次的大学(学科)排名,面临着两个巨大的挑战。一是如何定义卓越?大学的职能多样(教学、科研、社会服务、国际交流合作、文化传承;知识生产和知识传播)。不同的排名对大学(学科)的卓越有着不同的定义,因此,一种排名并不具备在所有维度上评估大学和学科质量的能力。二是如何测度卓越?在指标选取、权重选取充分考虑规模差异、学科差异、地区差异、文化差异等。
排名是一种定期的产品,通常每年都会出现。尽管大多数排名都声称能产生世界范围的排名,对不同排名的地理覆盖率分析表面,不同排名体系对“世界”的定义是不同的,每一种排名都有一个地理偏向。例如,THE和QS偏向欧洲地区,ARWU偏向北美地区,莱顿排名偏向亚洲新兴国家等。
从排名的层次来看,国家排名往往包含更多的指标,主要关注教育和制度参数,而全球排名系统往往只有较少的指标主要关注研究业绩。对每个国家的国家排名和全球排名之间的排名相似性分析表明,除少数情况外,全球排名并不能有力地预测国家排名。
全球排名能代替国家排名吗?比较发现,国家排名往往依赖更多的指标,更倾向于强调人才培养指标,因为他们的目标人群主要是本地学生及家庭,寻求大学选择的指导。其次才是科研和机构事实和数据(等同地位);国家排名体系更倾向选择规模独立指标,可能是因为在国家和机构一级更容易收集人均指标(如每名教员的学生数、每名教员的出版物等)。就投入产出特征而言,国家排名同等倾向于对产出和制度属性,其次是投入和过程指标。例如,中国的学科排名更强调产出指标,就机构事实和数据的权重而言,中国的排名在各类排名中脱颖而出。当对这些指标的不同分组进行比较时,可以观察到国家和全球排名之间的显著差异。特别是,国家和全球排名系统在规模依赖性、投入/产出特征以及指标子类别分组方面存在显著差异。因此,这些研究结果表明,国家排名系统并不一定包括全球排名系统的一个子类。对指标类别的分析表明,全球排名并不能完全预测国家排名结果,尽管存在一定的关联度,但国家排名和全球排名之间存在重要差异。没有任何一个全球排名在预测所有国家排名时能够始终优于其他排名。
从覆盖面来看,不同的全球大学(学科)排名所涵盖的大学数量不同,覆盖范围存在差异,大多数包括500-700所大学,上榜高校数量仅占全球高校的极少数。而美国、英国和中国的大学更有可能出现在这些排名中。QS和LEIDEN在英国国家排名中的相似性得分最高。没有一个全球排名与中国的排名有很高的相似性得分。
在学科分类方面,不同的排名体系的学科分类标准不同,不同国家和地区的学科分类标准也存在巨大的差异。新一轮科技革命影响深远,新知识新领域快速拓展,新兴交叉学科不断涌现,知识体系综合趋势日益增强,原有的学科划分体系已不能满足时代需要。
不同大学(学科)排名体系的指标体系和指标数量及其相关权重有很大差异。这些指标通常分为规模依赖、投入产出特征和主要类别三个维度,从四个方面来组合:投入(教师、学生、课程设计、财务资源和设施)、过程(教学、组织和管理、学生支持系统和教学质量)、产出(满意度、论文、引用、专利、授予学位、增值、学习进度,就业、国际化)和声誉。研究表明,影响大学(学科)排名最大的因素是学术声誉和科研(论文和引用等)得分。
在指标选取方面,虽然大多数排名选定的指标对衡量一所大学(学科)的研究生产力和学术声誉非常有用,但这些排名并不能完全反映大学的教学质量和社会经济影响的水平。
此外,部分大学(学科)排名在方法和数据处理方面还存在一定的技术缺陷,比如,反等张属性(即正权重不保证正分数)、奖励效率低下(同一水平的投入,不同大学可能不同的产出)、排名指标间存在多重共线性(选取的不同指标间存在相关性)和透明度、再现问题。更有人将其归结为“七宗罪”:虚假精度、权重差异(权重设置的武断性)、假设相互补偿、指标冗余、系统间差异、忽视指标得分(各指标得分对整体得分的贡献)以及排名变动与整体不一致等。
在数据采集方面,不同的排名体系既有硬数据,也有软数据,如何确保硬数据的科学选择,如何确保软数据透明和准确,特别要高度关注“输入类”数据(机构自我报告数据)的数据质量。全球排名很难在国家层面收集可靠的人均数据,因而更重视与规模相关的文献计量指标。伴随着全球排名流行的同时,国家排名也在激增,特别是在发展中国家。这不仅使我们更好地了解各国高等教育状况,还可以通过比较分析和基准测试,从而为改进现有全球排名方法提供可能性。
在统计方法上,由于对计量评分方法的解释不足,并使用模糊的统计程序来生成总得分,各种排名体系中测量的偏差程度实质上受到根据原始数据计算指标得分方式的影响,这也是透明度和再现性问题的主要来源, 研究表明,世界大学(学科)排名会受到锚定效应、回声效应、马太效应以及补偿效应的影响。锚定效应即排名者往往会根据排名起始值作出随后排名判断,动态调整不够充分,即使起始值完全是随机的。排名通过锚定效应影响教师和机构领导人对机构声誉的评估,大学排名实际上是衡量大学随着时间推移而逐渐巩固的声誉,因此存在声誉偏差的问题。所谓回声效应,是指排名通过强大的媒体传播渠道不断放大,影响随后的新的排名,形成一个坚实的“声誉-排名-声誉”回路。所谓马太效应,也可以叫光环效应,也是一种认知偏差,即强者愈强,一种特征的评估会影响其他特征的判断。此外,大学(学科)的排名随时间的演变还有一种补偿效应,这种效应往往会根据前几年的变化而产生,从而抵消某一特定年份的任何提高或下降,而随后产生相反的影响。
大学(学科)排名应该是多样、多维、多层次并存的。对各种排名的比较分析得出,世界大学(学科)排名是价值和局限共存。不同的排名的侧重点不同,全球不同地区和不同国家的学科划分体系也不尽相同;不同的排名方法衡量了大学或学科的不同方面,学术卓越并不存在单一的“最终”或“完美”的“黄金标准”,因此,不同排名体系有一定的互补性。大学(学科)排名的首要目标是向目标客户(决策者、学者、学生、家长)提供信息,一个好的排名体系应提供有效和有用的信息,能有效地定义和测度学术卓越,指标选取科学,数据来源可靠,统计技术先进(比如人工智能、区块链技术),结果可重现。
一个根本性的问题:大学是否应该根据排名来制定发展策略,制定科研和人才培养政策?外部排名竞争的结果是内部学术创造力和自主性的丧失,导致了盲目模仿,大学变得更加标准化和缺乏独创性,这就是排名的负面影响。一味地追求排名对大学构成了严重的风险,因为排名注重制度的可比性和一致性,将学术工作转变为标准化的工业化生产。越来越多的大学为了名望而相互竞争,这种竞争导致了一致性。机构比较的压力导致许多大学都放弃了创新,转而从众。
总之,大学(学科)排名是衡量高等教育质量的重要手段之一,满足利益相关者多样化需求,提高了大学的透明度,增强了大学间的竞争意识。但高等教育质量衡量是一个多维度的问题,大学排名并不能全面反映大学教育的质量,排名影响了高校的价值和运作方式,产生了一种意想不到的同质化压力效应,导致内部学术创造力和自主性的丧失,导致盲目跟风。因此,我们要理性地看待各类排名,不能把追求排名变为大学(学科)的发展目标,要以知情、负责任的方式解释和使用这些信息,要保持定力,不能被排名牵着走,维护自身价值观。排名不能不看,不能多看。