打印

【光明调查】学术评价：超越量化模式

karin

论坛元老

Rank: 8 Rank: 8 Rank: 8 Rank: 8 Rank: 8 Rank: 8 Rank: 8 Rank: 8

宝葫芦: 4675

论坛开拓者风火神灌水奖

1^# 大中小发表于 2013-2-4 07:35 只看该作者

【光明调查】学术评价：超越量化模式

《光明日报》（ 2012年12月18日 15 版）

哈佛大学内部晋升教授的流程

中国教授晋升的一般流程

　　学术评价是高校管理的一个核心环节，事关教师业绩考核、职称晋升和学术奖励，在高校教学科研工作中具有指挥棒式的导向作用。建立科学、公正的学术评价制度，对于我国高校学术创新能力的提高乃至世界一流大学的建设都具有重要的意义。调查显示，目前我国高校普遍重视采用量化手段来进行学术评价，一些高校甚至采用“工分制”来对教师的工作进行考核，同行评议在学术评价中的作用没有得到充分的发挥。建立以质量和创新为导向的学术评价机制迫在眉睫。

　　调查人：陈洪捷（北京大学教育学院教授、博士生导师）

　　沈文钦（北京大学教育学院副教授）

　　改革开放以来，我国的高等教育事业取得了辉煌的成就，实现了高等教育大众化的目标，也为社会主义现代化建设事业作出了巨大贡献。但是，与西方高等教育强国相比，我国的高等教育发展水平仍有很大差距，缺乏能够引领世界的一流大学和一流学者，一个很重要的原因在于学术创新能力不足。

　　从上世纪90年代开始，我国政府便明确提出了建设世界一流大学的政策目标，并通过实施“211工程”和“985工程”给予大力支持。党的十八大报告指出，推动高等教育内涵式发展，对高等教育工作提出了新的更高要求。面对新形势新任务新要求，高等教育发展模式必须进一步从规模扩张转向质量提升，加快世界一流大学的建设步伐，提高高校的学术创新能力。

　　如何才能提高高校的学术创新能力？除了增加投入、改善硬件设施、引进优秀人才、加强国际交流等措施，学术评价机制所发挥的作用是非常关键的。对教师学术工作的评价是高校教师管理的重要手段，是教师业绩考核、职称晋升、学术奖励的基本依据，在高校科研工作中具有指挥棒式的导向作用。因此，建立科学、公正的学术评价制度，意义特别重大。对于我国目前的学术评价制度，学术界一直不乏反思、批判的声音，也有一些理论性探讨和基于国际经验的比较研究，但总体来说系统、深入的调查分析较为缺乏。

　　当前中国高校学术评价的基本状况是怎样的？目前的学术评价存在哪些有待改进之处？国外有哪些经验可供借鉴？围绕上述问题，我们访谈了部分高校教师对当前学术评价制度的看法，查阅了国内外一些高校有关学术评价的制度文本，在此基础上形成了本调研报告。

　　量化管理：当前学术评价和绩效考核的通用手段

　　一般来说，学术评价的方法主要有量化评估和同行评议两种。所谓量化评估，就是把大学整体和各院系乃至每个教师的科研和教学情况进行数量化处理，折合为数字单位，并作为考察其绩效，决定其职称评定、岗位设置、学术奖励的依据。所谓同行评议，指的是根据本领域同行专家的评议意见来判断学术研究的质量。

　　在我国的学术评价当中，这两种方法都得到了采用，但由于量化的指标往往被看作是一种更为精确、客观、透明、公平的标准，能够减少人为的主观评价，做到数字面前人人平等，而且便于操作和管理，因此尤其受到重视。各种类型、各种层次的高等学校都在运用量化评估，以激励教师们产出更多的学术成果。

　　量化评估有两种形式，一种是简单的数数，另一种是所谓的文献计量法，即考虑文章的被引次数、期刊影响因子等因素。在我国当前的学术评价当中，量化评估最极端的一种形式是简单的数数。例如，在职称晋升时，发表文章数量更多的教师被优先考虑。另一种相对温和的做法是考虑所发表文章的层次（如期刊级别）及影响（如被引次数）。研究成果的被引情况也是某种形式的同行评议，是同行对被引作品的一种判断，因此数量与质量、量化评估与同行评议并不是绝然对立的关系。本文提出超越量化模式，并不是完全抛弃量化手段。

　　量化评估贯穿于教师学术发展的各个环节，包括业绩考核、职称评定、学术奖励等等。就业绩考核来看，我国很多高校的管理部门都采用“工分制”来对教师进行年终考核。例如，规定教师每年在科研方面要完成一定的“工分”，包括科研工分和教学工分。科研工分一般包括成果发表和科研项目经费两个部分。例如，某985高校一位计算机学科的教师在接受访谈时向我们介绍，他们每年有2500分的科研工作量要求，每10万元课题经费可以折算成1000分，发表不同级别的论文也可折合成不同的分值。在有些高校，有些教师无法申请到课题，但为了完成科研经费的要求，不得不从校外寻找合作对象（如公司）来获得横向课题，实际上是自己支付课题经费。从学术奖励来看，很多高校都有针对论文发表的金钱奖励，这也成为当前学术发表数量攀升的一个诱因。

　　从职称评定环节来看，目前大部分高校对论文、著作的数量都有基本的硬性要求。例如某高校规定人文学科教师申请正教授职位需至少发表7篇论文，理学类教师至少发表11篇论文，其中7篇为SCI和EI收录。有些高校的规定更为细致，将学术期刊分为ABC等不同等级，要求必须在A类刊物发表一定数量的论文才能申请副教授或教授职位。也有一些学校进行了改革，实施代表作制度。某985高校2012年的教师职务聘任规定，教师在职称晋升材料送外审时，仅需提供3篇最具代表性的论文。在实行代表作制度后，对学者研究成果质量的判断主要依靠同行评议。不过，目前真正实施代表作制度的高校仍属少数。即便实行代表作制度的高校，也基本上仍沿用旧制度，代表作制度仅是其中一个辅助性的通道。

　　在职称评定环节，我国高校在对教师的科研成果进行量化考核的同时，也比较普遍采用了同行评议的方法，即参考校外同行专家对申请人的评价。但同行评议在学术评价中的作用受到两个方面的限制。第一，在很多高校，校外同行评议意见被赋予的作用很小，甚至是在院系内部已经做出晋升决定之后，再送外审，此时校外同行评议所发挥的作用仅是形式上的认可。第二，受到人情文化等因素的影响，其实施效果大打折扣，有时往往沦为形式主义。外审材料常常被送到与申请人相熟的专家手中，专家意见的独立性、客观性都受到干扰。

　　总的来说，由于量化管理在管理上更为便捷，而且具有表面上的客观性和公正性，因此在学术评价中被广为采用，而同行评议则由于其主观性、人情文化的干预等原因，其发挥的作用受到很大限制。

　　作为一种学术评价的手段，量化的方法其实只是表象，它与大学的所谓“行政化”现象密切相关。就是说，量化评估的盛行是大学行政化的一种具体表现。大学中存在着各种形式的权力，如教授个人权力、行会权力、专业权力、科层权力等等。科层权力主要指的是大学中的行政管理人员根据其职位所拥有的权力。早期的大学一般规模都不大，教授不仅管理学术事务，也负责经费预算、图书购置、人员聘用等具体事务，这就是学界所津津乐道的“教授治校”制度。随着大学组织的分化，学校事务越来越繁杂，行政管理人员逐渐成为专职管理学术事务的阶层，而且规模越来越大，权力也随之强化。

　　大学中的行政管理机构建立在科层制基础之上，因此其运行必然遵循科层制的文化逻辑。科层制的文化则集中表现为对效率的追求，即对速度和数量的追求。而其效率主要是建立在可预计性和纪律原则之上的。可预计性和纪律减少了不确定性、偶然性、人为因素，从而使组织能够按照明确的规则精确、有效地运行。科层化的行政系统是等级化的、非个人化的组织结构，具有形式性和工具性特征，与管理的对象没有必然的联系，主要是借助于形式化的数字和量化的指标进行计划、协调、指挥和控制。在这种系统内，若没有统一的、可计算性的指标，系统在信息的搜集、整理和绩效的控制方面就难以进行。在这种逻辑的支配下，大学行政管理部门必然偏好以量化模式来管理学术事务，强调学术成果的可计算性，其结果就是对量的重视，甚至“量成了质的对等物”。尽管道理很清楚，“把一名教授终身工作的质量还原为一个简单的数字是完全没有道理的”。当大学中学术权力足够强大，与行政权力处于一种平衡状态时，这种量化的手段尚不足以危及学术活动。而一旦行政权力膨胀，居于主宰地位，行政的思维就会取代学术的思维。其结果就是大学的管理趋于异化，凌驾于学术之上，出现行政为体、量化为用局面。

　　量化管理与学术活动的内在冲突

　　毋庸置疑，量化评估具有一定的合理性。从行政管理者的角度来说，量化管理具有客观性、便捷性的优点。就学理层面而言，学术的质量与学术的数量之间并不是完全对立的，很多研究表明，研究的质量与数量之间存在一定的关联。具体来说，作出杰出成就的学者有相当的比例也是高产的学者，但反过来不成立，即高产的学者并不一定是优秀的学者。

　　“高产的学者并不一定是优秀的学者”，这恰恰是中国目前学术界的症结所在。在量化管理政策的激励下，我国产生了一大批高产的学者，但真正大师级的学者却少之又少。我国的SCI论文总数已连续多年位列世界第二，世界顶尖水平的学者却寥寥可数。据ISI数据库2009年的统计，美国拥有4124名高被引作者，而我国仅拥有24名高被引作者，其中仅4位来自中国大陆。2011年，中国入选“高被引研究者”的人数仅为28人，且多数来自香港地区。人文社会科学领域的情况同样不乐观，缺乏思想大师、缺乏有世界影响力的学者是学术界共同的感受。

　　对于我国高校中比较流行的简单化的量化管理方法，学术界的批评声音一直不绝于耳。比如批评者指出：“必要的量化是教育主管部门加强管理的一项必要手段。这种量化开始时仅限于各类教学的评估机制中，但是后来它的功能被越说越神，居然扩大到各种学术和教育的考核、评比、提级提职、业绩考核、课题和项目的审批以及各种名目繁多的评估中，几乎到了无孔不入、无名无利不靠的程度。”一位大学教师对流行的奖励制度抨击道：“现在的一些奖励变成了科研管理工作者根据文章发表刊物的‘级别’简单地进行加减乘除运算。这里没有思想的评价，也没有学术表达是否精练的评估，有的是对核心刊物的迷恋，以及对文章字数的简单统计。”更尖锐的批评者认为量化管理是学术腐败的一个重要根源。

　　那么，量化管理的方法为何会招致如此之多的批评？量化管理到底存在哪些弊端？

　　首先，极端的量化评估模式违背了大学学术研究的基本规律。大学作为学术性组织以学术性活动为中心。学术活动在本质上是一种探索性活动，而探索未知活动的最大特点就是其不确定性、不可预计性。不仅探索的内容具有不确定性，探索工作的过程也同样难以标准化。根据我们的调研，不少高校或院系在年度工作考核中实行“工分制”，即规定教师每年至少发表的论文数量以及论文发表刊物的级别，这就违背了学术活动“不确定性、不可预计性”的特点，强迫教师对其科研活动进行理性规划，按时按点产出特定数量的成果。科学研究还具有周期性和波动性，一些研究成果的出现往往需要酝酿数年的时间。同时，对于教师个人来说，其学术生涯也有巅峰期和低谷期，要求教师每年至少发表若干论文的规定是不符合科学研究规律的，用一位受访教师的话来说，这是“用最简单的算术方法来管理世界上最复杂的脑力劳动”，同时也是对教师工作自主性的干扰。

　　其次，量化评估以及量化的奖励措施鼓励学者匆忙地发表成果，营造不良的科研文化，对于那些不急于发表成果、追求尽善尽美的学者来说，是不公平的。而且，很多学者不得不最终屈从于这种崇尚数量的文化，转而从事低层次的、容易获得高产出的研究领域和研究问题。

　　第三，量化评估倾向于用“一刀切”的管理方式来管理所有学科，忽视学科文化的差异。发表数量、影响因子、被引次数，这些表面上客观化的指标是不能在不同学科之间对等地比较的，甚至在同一学科的不同研究方向也无法进行对等比较。不同学科的发表节律是不同的，例如传统的文史哲学科并不鼓励大量发表论文。不同学科的引用模式不同，即便同一学科内，不同研究领域之间也有很大差异。有些研究领域同行较少，即便是最杰出的研究，可能被引次数也并不高，有些研究被引次数很高，可能只是因为它们处理的是热门的研究问题，并不能客观说明其研究水平，因此仅仅依靠被引次数判断研究质量也不完全可靠。

　　目前的学术评价普遍强调SCI、SSCI、EI论文，甚至到了崇拜的地步。但这个评价标准并不适用于所有学科。在我们的访谈中，很多被访者希望能够重新反思SCI的导向。一位生物学学者就指出：

　　“（工科）可能不重视论文，他可能重视把这个东西做出来。北航就是飞上天去，或者你真能发明新型水稻，比你写11万篇论文还好，有一些是可以发论文的，有一些是发不出来的。”

　　第四，高校量化评估不鼓励团队合作。很多高校的职称晋升条例都明文规定，只统计第一作者或通讯作者论文。这一要求在以合作研究为主流方式的某些理工科领域肯定是不合适的，即便在社会科学领域也有失偏颇。经济学、心理学、社会学、语言学等学科的研究越来越需要合作研究，因此多个作者署名的论文在所难免，非第一作者的贡献也理应获得认可。一位语言学学者在接受我们的访谈时指出：

　　“语言学的研究越来越需要跨学科的合作。我目前就和心理学系的学者合作进行研究，发表成果时必然有时是第二作者。但在我们的评价体系当中，第二作者是不算数的……基于学术兴趣，我可以这样做，但作为一个制度，长此以往是行不通的。”

　　最后，学术生产的数量繁荣是当前学术界的一个显著现象，其背后的问题是缺乏以同行评议为基础的期刊评审制度。很多学术期刊并没有采用匿名评审的同行评议制度，而是编辑部自行作出是否录用稿件的决定，这就为人情公关以及一些低质量稿件的发表打开了方便之门。尤有甚者，为了刊发更多数量的论文，不少学术期刊都对论文篇幅进行严格限制，或要求作者主动删减，这是典型的以数量牺牲质量的做法。

　　国外学术评价的经验：以美国为例

　　它山之石，可以攻玉。美国是当今世界公认的学术中心，这一地位的获得，与美国高校所实施的灵活的、有利于激发教师创新精神的学术评价制度是密不可分的。

　　首先，美国高校并没有用工分制来管理、考核教师的科研工作。美国高校也会对教师进行年度考核。在学年初，教师会和系主任或院长订立年度目标，双方协商教学、科研和社会服务方面的工作量，根据年度目标进行考核，但数量化的工作量要求一般限于教学领域，在教师的科研工作领域，院校和院系一般不会硬性规定论文发表的数量、期刊的级别以及科研项目的经费额度和数量。当然，对于那些科研成果特别突出的教师，在财政状况允许的情况下，会以加薪的方式给予奖励。美国教师获得终身教职之后，就享有很高的科研自由，教师可以自由地决定研究的内容，也能决定在某一个年度是否发表论文及发表多少论文，年度考核对这个群体的教师很少发挥作用。

　　其次，在职称晋升环节，美国研究型大学更加强调研究的质量而不是数量，而且特别强调所发表的成果应当通过同行评议。美国哈佛大学文理学院《终身轨教师手册》在建议教师如何获得终身教职时指出：

　　“发表大量没有经过严格同行评议的论文，不会对申请终身教职有助益，反而不如发表少数经过同行评议的高影响论文。关键在于界定一个有原创性和重要的研究议程，致力于此，并最大程度地扩大你研究的影响力。”

　　第三，和我国高校普遍流行的做法不同，美国高校的教师晋升条件中并没有硬性规定论文发表的数量和期刊级别。一般来说，每个高校的《教师手册》都会对职称晋升以及获得终身职的条件作出规定，笔者查阅了哈佛大学等部分高校的《教师手册》，并没有发现它们对论文发表的数量做出要求。例如，美国某高校英语系的职称晋升委员会主席指出：

　　“在晋升为副教授、终身制或晋升为正教授的过程中，我们并没有指定的论文数量要求。但我们有一种直觉，来分辨何谓实质性的、真正的学术贡献。”

　　一位美国某大学的化学系主任在接受美国某研究者的访谈时也指出，他们对教师职称晋升的规定是“模糊的”，“在我们的教师职称晋升指南中，你找不到你必须有3个研究基金，或你必须发表6篇论文，或诸如其他这样的规定”。换言之，尽管美国高校在教师职称评定过程中非常注重论文发表和著作出版，而且要求教师在申请材料中提供详细的发表记录，有些学科还会要求提供论文的被引用情况，但没有做简单的数量要求。

　　第四，在没有硬性数量要求的情况下，美国高校非常重视通过同行评价来确保评估的可靠性。2012-2013年哈佛文理学院的《招聘与晋升手册》规定，在晋升正教授时，候选人所在的学系需联系12-15位同行对其进行评价，这一数量要求远远超过我国。特别值得注意的是，哈佛大学在考察候选人的学术影响力时，引用率、期刊级别等量化指标仅作为参考，最重要的标准是“候选人是否在设定该领域的研究议程”，换言之，候选人是否提出了新的研究问题并引领该领域的发展。

　　第五，美国高校在教师职称评定中很注意尊重学科之间的差异。人文学科的产出形式以著作为主，且研究周期长，因此考评主要以著作为主。对于社会工作、公共政策等实践性较强的学科，则并不一味强调其学术贡献，而是注重考察其政策影响和对实践领域的贡献。

　　最后，就评估的内容而言，美国的做法更为灵活。例如哈佛大学、波士顿大学在评估教师的研究时，既包括已经发表的作品，也包括未发表的作品，或即将发表的作品。

　　改进学术评价的意见和建议

　　人类活动中存在两种秩序，一种是人为设计的秩序，另一种是自发的秩序，两种秩序都有其正当性。科层组织显然属于人为设计的秩序，而学术工作则可归类于自发的秩序。科层制在现代社会倍受青睐，而自发的秩序则遭到排斥，受到科层制的挤压。目前我国大学学术管理面临的问题，在很大的程度上就可归因于科层理性对自发秩序逻辑的排斥。

　　随着高等教育事业规模的扩大，随着大学规模的扩大以及高等教育内部差异的扩大，主管部门当然有理由制定更密集的质量保障系统和学术评价系统，以保证教学与科研的效率，这些也符合科层制的“可预计性”原则。但是，这种理性化和技术化的质量保障思维能否促进学术创新，是大可质疑的。要促进真正的学术创新，必须小心呵护来自学术的自发秩序。《国务院办公厅关于开展国家教育体制改革试点的通知》（2010）指出要“改革学科建设绩效评估方式，完善以质量和创新为导向的学术评价机制”，这应当是中国高校共同努力的方向。

　　那么，应当如何落实“以质量和创新为导向的学术评价机制”？我们认为，高等教育是一个由国家系统、院校、学科共同体等不同层次组成的体系，需要在不同的层面同时着力，才能得到根本的解决。

　　首先，就整个高等教育系统的层面而言，政府要发挥正确的引导作用，在学科评估和大学评估当中弱化数量导向。

　　其次，具体到院校和院系的层面，在职称晋升和考评当中，应当更加注重同行评议的意见，而不是简单的量化考核。应大力推进目前一些高校已经开展探索的“学术代表作”评价制度，进一步摈弃“重数量，轻质量”的观念。在设计评估标准时，要尊重学科之间的差异，在一些学科，应当允许甚至鼓励“十年磨一剑”的研究，给研究者提供宽松的学术环境。改变僵化的工分制考核办法。评估应该更有弹性和灵活性，有利于提高教师从事科研的积极性，并鼓励跨学科、跨院校的合作。

　　最后，在学术制度和学术共同体的层面上，应当在更多的期刊推行同行评议制度，鼓励刊发“大文章”、“大作品”，从学术发表的层面引导学者刊发高质量论文。