德国科研评价政策发展的功能职责、制度逻辑及对我国的启示

摘要：学术评价机制是学术系统的重要组成部分。作为现代大学制度发源地的德国，也经历了一个学术评价机制的转型过程。为进一步提高科研机构的运营效率，特别是增强其创新能力，德国政府加强了第三方评估机制的建立，积极引入激励措施，科研评估体系改革取得了重大进展。本文从德国科研评价政策发展的历史演进出发，论述了德国科研评价机制体制构建的主要特征，并进一步提出在域外经验基础上探索符合本国国情的制度安排。

关键词：公共政策;科研评价体系;德国;卓越战略

[中图分类号] G322 [文章编号] 1673-0186（2024）012-0096-016

[文献标识码] A [DOI编码] 10.19631/j.cnki.css.2024.012.007

近年来，学术评价的政策导向成为社会各界密切关注的热点话题。在中共中央办公厅和国务院办公厅《关于深化项目评审、人才评价、机构评估改革的意见》、科技部《关于破除科技评价中 “唯论文”不良导向的若干措施（试行）》、教育部和科技部《关于规范高等学校SCI论文相关指标使用树立正确评价导向的若干意见》等一系列文件出台的大背景下，学术界关于同行评议的讨论越发热烈。德国是一个高度重视学术研究的国家，在很多领域的研究都处于或曾经处于世界的领先地位，这些都与德国结构完整、分工明确、协调一致的科研体系密不可分。考察德国科研评价政策的历史演进与制度逻辑，对于当前我国制定符合国情的科研评价政策有着积极意义。

一、德国科研机构组建的主要组成

德国拥有世界上较为密集的科研机构、高等院校和完整的科研体系，从研究范围来看，各类研究机构涵盖了从基础研究到应用研究的各个方面。总的来看，德国科研机构主要包括三个部分。

一是高校，主要包括研究型大学，应用技术大学和科学院。德国高等教育的整体状况主要来自德国大学校长联席会议（HRK）的信息门户网站，这里发布来自国家认可的德国大学的有关其学术交流和学位机会以及国际合作等信息。德国高等教育索引数据库的开发始于1994年，是欧盟发起的计划中的欧洲数据库项目的一部分，HRK致力于开发针对德国大学系统的数据库。自 1998 年上线以来，高等教育索引数据库经历了不断的发展，已成为德国高校科研与招生的可靠信息来源。

二是独立研究机构，比如马克斯·普朗克学会（MPG）、德国亥姆霍兹联合会（HGF），莱布尼兹科学联合会（WGL）等。MPG的研究机构主要专注于基础研究，同时也特别强调跨学科研究领域。作为德国最大的研究机构，HGF的研究旨在为人类的基本生活条件提供长期保护。HGF致力于对国家和社会有直接经济效益的应用研究。WGL的研究领域十分广泛，涵盖了各科学领域，包括跨学科的多个科研领域：人文科学与教育研究、经济和社会科学、航天科学、生命科学、数学、自然与工程学以及环境科学研究。

三是企业科研机构，如德国联邦工业合作研究会（AIF）等。德国科学基金会（DFG）和德国学术交流中心（DAAD）是德国研究和学术领域的重要机构。DFG作为一个独立的资金管理组织，支持从基础研究到应用研究的各个方面。其资助计划包括一般项目、大型研究项目、青年科学家资助、研究基础设施、学术交流以及科学奖项等，旨在促进科学家之间的独立研究和跨学科合作，特别关注青年研究人员的成长，并确保研究设备和实验室的现代化和高效运行。

DAAD是德国大学的独立管理组织，负责实施德国的对外文化政策、高等教育和研究政策，以及大学领域的发展合作。DAAD的资助范围广泛，涵盖科学、研究、语言、教育和艺术等多个领域。通过奖学金和资助项目，DAAD促进了德国与其他国家的学术交流与合作，为外国学生和学者在德国学习和研究提供了机会，也为德国学生和学者出国留学提供了机会。DAAD还组织各种学术活动和研讨会，以促进全球知识的共享和传播。

为了提高科研机构的运营效率和创新活力，德国政府引入了第三方评估机制和激励措施。评估委员会由国内外专家组成，对非营利性科研机构进行评估，并提出改进建议。这些措施旨在激发研究机构的创新潜力，提高科研成果的质量和影响力，同时确保研究经费的合理使用，避免资源浪费。

二、德国科研评价机制的功能与职责

学术评价机制是学术系统的重要组成部分。随着新自由主义理念的全球扩散，以绩效为导向的学术调控政策在一定程度上导致了学术评价过分地偏重于量化指标[1]。追求效率的审计文化使得对科研人员的考核标准过于单调，缺乏学术评价整体设计。

作为现代大学制度发源地的德国，也经历了一个学术评价机制的转型过程。20世纪80年代之后，德国的学术环境发生了许多本质性的变化，也导致关于学术评价的诸多争议。随着政府财政拨款的缩减，第三方经费发挥着越来越重要的补偿作用，同时也变成一项绩效指标，其分量在德国科学体系的各个领域得到显著的增长。同时大学的排行榜和评估程序化的盛行，强化了德国的学术体系以指标为导向的绩效竞争，特别是在21世纪，文献计量在科研资助分配和学术评聘中发挥的显著作用，使得德国一度陷入“发表洪流”[2]。

德国科研评价方法主要有两种导向，即以同行评议为基础和以量化指标为基础，德国更加倾向于使用同行评议，而将量化指标作为辅助手段[3]。总的看来，德国科研评价体系还处于多样性发展阶段，16个州采取的方法都不尽相同，全面的科研评价体系没有形成[4]。为了有效地改进这一局面，德国最大的学术资助体系，即德国科学基金会（DFG）和德国最具有权威的科学政策咨询机构德国科学委员会（WR），发出了“质量而非数量”的学术评议转型倡议，从评价方法和内容两个维度提出了精细化的操作意见，目的是扭转唯论文的不良影响。通过这些规定，希望抵消多年来与科学出版物相关的定量因素日益重要的影响。从实践中看，质量而非数量的学术评议转型倡议一定程度上推动了学术生态体系良性回转。

（一）完善同行评议的具体程序，发挥基础性作用

同行评议作为一种具有主观性观点的学术评价方法，最早被认为出现于英国皇家学会的审稿程序中，后来这一方法被广泛地运用于各学术评价领域，特别是对于期刊文章的评审。同行评议，作为学术界内部一种制度化的自我控制，最有可能来判断研究质量，也被认为契合科学研究的多样性和复杂性。然而，同行评议也具有明显缺点。比如由于缺乏协调，不同评估程序，时间间隔太短，同行评议所需要的资料和材料常常难以统一，负责机构需要承担很重的负担[5]。服务管理很难跟上评审工作量，总体分配不均匀，还会导致一小部分专家评审任务过重。同时，同行评议容易受到个人和机构声誉的影响，评审的时候也有倾向于在判断中引入自身研究偏好，往往容易得出同质化判断，阻碍创新研究。

因此，德国的做法是从三个方面进行改进。首先，由于同行评议动用了大量的资源，因此充分说明理由，让负责机构认识到组织同行评议的必要性和可行性，以便做好准备工作。其次，同行评议与其他方法一样，由于存在缺陷，所以应当不断地反思评审程序来做好质量的保障工作。最后，在评审中注重纳入国际评审和青年学者。理事会专门强调同行评议应纳入不同职业发展阶段的学者，特别是青年学者这有利于实现评审任务的合理分配，保障评审成员具有充足的评阅时间，以提升论文的评审质量[5]。对于青年学者而言，通过评审工作也进一步获得了学习机会，以便更好地融入学术共同体，这样有利于提升同行评议的整体质量。

（二）制定量化指标并提供专属性解释，发挥辅助性作用

量化指标在学术竞争中虽然发挥了明显作用，但是以数量为衡量标准会给学者带来发表压力，并不能为评估高质量学术工作提供适当的基准，同时科研活动数量的增长特别存在着“边际效应递减”现象，这显然并不是人们所期待的学术质量的提升。为了避免量化崇拜，德国的做法是针对量化指标建立专属性认知与应用体系，在这个体系中具体包括五类量化指标：一是文献计量，二是申请项目额度和项目列表，三是博士毕业和获取教授资格数量，四是科研奖项和大会发言，五是专利收益。

为了避免在科研评审环节过分关注“已有研究基础”，德国科学基金会针对文献计量指标提出进一步的改进意见。首先，这样的指标适用于评价比较大的单位或直观反映绩效，随时间变化情况，对于评价个人或较小科研团队，评审必须阅读其发表的科研成果，并将与其他个人和团队的知识贡献进行批判性比较。其次，虽然单位时间内的成果可以反映学术生产力，但该指标不能代表原创性和对知识增长的贡献，因此基金会发布了《质量而非数量：资助申请与结项报告中有关发表物的新规定》，明确限制发表物的数量，且限制在少数特别重要且有说服力的出版物上。在新规定中，德国科学基金会将申请者的发表物分为个人简历中的代表作和与项目主题直接相关的发表物，以及申请书、正文参考文献三类，并针对每一类提出限制性条件，由此引导申请者合理使用发表指标。

（三）综合拓展学术评价内容，成为破除唯论文的重要保障

德国科学委员会认为，研究并没有一个简单的定义[6]，但无论学科具体来说，“好”研究的一些原则是明确的。

一是研究本身就是一种实践，一种认识论实践，它首先遵循的是寻求真理的逻辑。它的先决条件是，参与者的主要灵感来自新颖性和对未决问题的研究，并以发现新事物的喜悦为导向。

二是除了在熟悉的理论和方法背景下研究特定主题和问题之外，好的研究还具有原创性和相关性。它还要求我们愿意质疑自己，质疑自己的假设、理论、方法和数据，并不断重新审视它们的意义。

三是在成果和公开交流方面，好的研究既要坚持自己的理论和方法质量标准，又要接受第三方的监督;它所记录和展示的成果是其他研究人员可以理解和复制的，它的结论是透明的，并对公众负责。

四是真实和互信是良好研究的基础。它既不能与欺骗相容，也不能与可容忍的疏忽相容。在这方面，科学家群体是第一控制主体;此外，向公众说明理由也是一项不言而喻的责任。追求知识的客观性是核心管理原则。除了学科特有的理论和方法标准外，它还意味着一种科学伦理，即首先要遵守良好科学实践的规则。

拓展学术评价内容的主要做法是拓展“学术成绩”的概念，除了知识生产之外，强调科研服务的重要性，比如主持科研项目、科研基础设施建设、编辑出版工作、学术委员会工作，等等。在2019年，德国科学基金会结合良好学术实践倡议[7]提出评价学者表现的多维方法，即“成果评价首先基于质量标准，而数量指标则根据具体情况和经过甄别后才能进入整体评价当中”。除规定类别外，若自愿说明简历反映的个人特殊情况也被纳入评估过程。

针对多维的学术评价，基金会提供了具体参考项目。首先，高质量学术工作以学科标准为基础，要考虑各学科的特点和传统。其次，除知识生产之外，学术评价还包括对教学学术资质、公共关系知识和技术转让的贡献，对社会整体利益的贡献，学者的学术态度（如认知的开放和风险承受能力等）等。最后，因个人家庭或健康状况而耽误的时间应在评估中予以考量。由此可见，这样一个多维的方法倡导了学术综合评价，强调学术知识价值以外，还凸显学术工作的社会价值，特别兼顾了学者个人职业发展的状况，反映出对个体需求的尊重。

三、政府规制下的德国科学委员会评价机制

德国科学委员会成立于1957年，负责评估德国大学和研究机构的科研绩效。其主要任务包括对外科研究机构、大学及其内部机构进行系统评估，以及研究评估方法和计量经济学。2000年，德国科学委员会成立了评估委员会，作为负责评估任务的专家组的管理机构。

（一）成立评估委员会管理技术评估事务

评估委员会的主要职责是任命评估工作组成员，监督整个评估过程，制定相应的标准或就评估工作的方法和量化提出具体意见。评估委员会成员由来自不同研究领域以及联邦和州政府的代表组成。轮值主席为科学委员会学术委员会成员，任期不超过6年。评估委员会的工作包括组织专家对大学以外的科研机构、莱布尼茨科学联合会等机构进行系统评估，以及对大学和内部机构进行评估。此外，评估委员会还负责研究和评估与质量保证相关的评估方法和指标。

德国科研评价政策发展的功能职责、制度逻辑及对我国的启示

经典小说推荐

杂志订阅

友情链接