新时代高等教育评价改革政策工具研究
作者: 刘声涛
摘要: 当前已有多份旨在贯彻落实《深化新时代教育评价改革总体方案》的政策文件出台,为了切实推进改革,有必要从组织行为学及政策工具理论的视角对这些政策文件的有效性进行研究。分析高等教育领域贯彻落实《深化新时代教育评价改革总体方案》的四份政策文件的政策工具,结果显示政策文件中权威及象征和劝诫工具使用过溢,激励、能力、学习工具使用不足,这和高等教育评价改革的真问题不匹配,并有压抑政策执行者积极性、使评价局限于象征性评价及阻碍质量文化建设等消极影响。未来的高等教育评价改革政策制定需重视高校主体地位,避免过度依赖权威及象征和劝诫工具,加大对激励、能力、学习工具的使用,以提高教育评价改革实效。
关键词:高等教育;教育评价改革;政策文件;政策工具
中图分类号:G640 文献标识码:A 文章编号:1672-0717(2022)01-0081-08
一、问题提出
2020年10月30日,中共中央、国务院印发《深化新时代教育评价改革总体方案》(以下简称《总体方案》),确立了深化新时代教育评价系统性改革的行动纲领。面对教育评价这一世界性、历史性、实践性难题,改革如何落地成为研究与实践的重要议题。作为改革的指导,政策文件无疑对改革成效有重要影响。当前已有多份旨在贯彻落实《总体方案》的文件出台。然而,政策文件出台并不代表政策目标达成,政策文件难以落地的现象比比皆是,此类事实提醒我们必须深刻反思:若要促进政策目标达成,政策文件制定需注意什么?
回答上述问题的一个角度是政策工具选用。政策工具即政府和行政部门为推动政策目标达成而使用的手段和机制,是治理范式下政府公共管理的重要依托[1]。本文基于政策工具理论,结合组织行为学观点分析当前高等教育领域贯彻落实《总体方案》的重要政策文件中政策工具使用特征及其对深化新时代高等教育评价改革目标达成的影响,并对未来教育评价改革政策的工具选用提出建议,以期为推进新时代高等教育评价改革提供参考。
二、理论基础和研究设计
(一)理论基础
20世纪80年代以后,政策工具研究迅速发展于欧美的经济、环境政策等领域,随后为教育领域借鉴使用[2]。政策工具研究的核心议题之一是政策工具分类,以往学者依据不同标准对政策工具进行了分类。施奈德和英格拉姆(Schneider & Ingram)根据政策制定者对政策执行者行为的假设将政策工具分为权威工具、象征和劝诫工具、激励工具、能力工具、学习工具[3](P510-529)。
政策的意图在于影响政策执行者,使政策执行者采取政策期待的行为以达成政策目标。施奈德和英格拉姆的政策工具分类优势在于聚焦政策制定者头脑中对政策执行者行为的假设,研究者可进一步分析这些假设是否符合事实,据此预测政策工具使用的效果与长期影响。欧文斯(Robert G. Owens)将其对教育组织行为学的论述建立于假定、信念与行为的关系之上,在其享有盛誉的《教育组织行为学》中,开篇即指出:“每种文化背景中的人都会接受某些隐含的基本假定……这些基本假定决定了我们的信念和价值,乃至我们对待他人的行为方式……这些基本假定,虽不可见,被视为理所当然,以至于很少被想到,更少被谈及。”[4](P3)我们要真正理解行为,就需要洞悉行为背后隐含的假设;要改变行为,也需要改变行为背后隐含的假设。基于此,本文选择施奈德和英格拉姆的政策工具分类作为分析框架。
(二)研究设计
1.研究方法
本文采用内容分析法对政策文件进行定量分析。首先,选择当前高等教育领域贯彻落实《总体方案》的重要政策文件,对政策文件的内容进行编码;然后,根据政策工具理论将政策文件内容归入不同类别的政策工具,并分类别进行频数和百分比统计;最后,在定量分析的基础上剖析新时代高等教育评价改革政策工具使用特征,继而提出改进建议。
2.文本选择
文本来源于教育部官网上自《总体方案》发布后,由教育部等中央部委发布的主标题中含“评价”或“评估”且适用于高等教育领域的政策文件,共包括五份政策文件(截至2021年7月),分别是教育部、财政部、国家发展改革委印发的《“双一流”建设成效评价办法(试行)》(教研〔2020〕13号,以下简称《“双一流”建设评价》);教育部印发的《普通高等学校本科教育教学审核评估实施方案(2021-2025年)》(教督〔2021〕1号,以下简称《本科审核评估》);国务院教育督导委员会办公室印发的《全国专业学位水平评估实施方案》(国教督办函〔2020〕61号,以下简称《专业学位评估》);教育部印发的《关于破除高校哲学社会科学研究评价中“唯论文”不良导向的若干意见》(教社科〔2020〕3号,以下简称《破除“唯论文”》);国务院学位委员会、教育部印发的《学位授权点合格评估办法》(学位〔2020〕25号)。由于《学位授权点合格评估办法》主体内容为评估流程,是对评估过程的规定,缺乏使政策执行者达成政策目标的其他政策工具,因此,该政策文件未被纳入内容分析过程。
3.分析维度
施奈德和英格拉姆认为政策制定者头脑中有对政策执行者行为的假设,即政策执行者不采取政策期待的行为可能主要出于下述原因:没有权威的指示、没有必要的激励、没有必要的能力、不认同政策中隐含的价值观和信念、问题不明确或(及)没有现成的解决方案[3](P510-529),不同行为假设导致不同政策工具选用。根据施奈德和英格拉姆的观点[3](P510-529),本文将其五大类政策工具的概念、行为假设、具体工具及其优缺点整理如下:
权威工具即规范政策执行者的强制性规则,具体表现形式主要有规定、许可、禁止。权威工具的使用者假设政策执行者忠于职责,遵从权威,遵守法律,没有切实回报也能按政策要求行动。权威工具的优点在于针对性强、约束力强、成本低、见效快,缺点在于变通性、灵活性低,易抑制政策执行者的主观能动性。
象征和劝诫工具即推动政策执行者因政策符合其价值观和信念而行动的工具。象征和劝诫工具假定在下列三种情况下人们更可能促进政策目标达成:(1)目标和行动是政府官员提出来的重要、优先的事项;(2)目标和行动与人们的价值观、信念、偏好一致;(3)目标和行动与正向的符号、标签、形象、事件联系在一起。基于上述假设,人们可以分别用宣告声明、基本原理、贴标签的方式推进政策实施。象征和劝诫工具的优点在于成本低、适用广,缺点在于当执行者的价值观和信念不同于政策倡导的价值观和信念时政策实施难以见效。
激励工具系通过提供有形的正向的回报或负向的惩罚来引导政策执行者行动的工具,具体表现形式主要有正向回报、收费和制裁。激励工具的使用者假定政策执行者追求效用最大化,追求正向的回报,并力图规避负向的惩罚。激励工具的优点在于能在短时间内激发外部动机,缺点在于难以激发内部动机。
能力工具是用于提高政策执行能力的工具。该类工具聚焦于提供信息、教育培训及其他资源。能力工具的使用者假定政策执行者不缺乏行动的动机,缺乏的是识别和解决问题的能力,需要依靠信息、教育培训及其他资源来提升能力。能力工具的优点在于切实开发了人力资源,缺点在于周期长、见效慢且结果具有不确定性。
学习工具即政策相关群体遇到不知道或者不确定的情况时使用的工具,具体表现形式主要有研究探索、互动协商。学习工具的使用者假定人们能通过探索或协商解决问题。学习工具的优点在于直面未知或不一致,缺点在于周期长、见效慢、实施难度大且结果具有不确定性。
三、政策文件内容分析
(一)政策文件内容编码
本文以句子为单位对所选取的四份政策文件(不包括指标体系附件)进行内容编码和归类统计,编码规则为“政策文件编号—章节—具体条款—句子”,表1为政策内容编码一览表(限于篇幅,仅举数例)。
(二)政策工具使用情况
本文对四份政策文件共计167个编码单元进行政策工具归类,得到政策工具使用情况(如表2所示)。
表2显示,权威工具使用比例最高(48.73%),其中大部分为“规定”(42.13%),少部分为“禁止”(6.6%),“许可”未得到使用。“规定”对政策执行者的行为做出明确的指示,如《“双一流”建设评价》规定“每轮建设中期,开展建设高校自我评估”。这类表述在四份政策文件中最为常见。“禁止”明确了不被接受的行为。四份政策文件中,《破除“唯论文”》使用“禁止”的次数最多,它以十个“不得”,严格哲学社会科学研究评价的底线要求。
象征和劝诫工具使用比例(38.58%)仅次于权威工具,其中大部分为“宣告声明”(30.46%),有少部分的“贴标签”(7.61%)与极少数的“基本原理”(0.51%)。“宣告声明”直接宣布政府认为重要、优先的事项,如《“双一流”建设评价》宣布要“推进评估分类,以评促建、以评促改、以评促管、以评促强”。这类表述在四份政策文件中仅次于“规定”。“贴标签”在四份政策文件中表现为使用一些特定的言简意赅的短语,使人印象深刻,以达到劝告效果,如“唯论文”“阳光评估”等。“基本原理”对政策期待行为进行精心解释或辩护,该工具在四份政策文件中仅出现一次。《破除“唯论文”》的“提高思想认识”部分具体阐述了高校在多项工作中存在多种形式的“唯论文”不良导向,指出这些不良导向导致多方面系统性危害,以此劝告政策执行者破除“唯论文”。
能力工具、激励工具、学习工具的使用比例都很低,分别为5.08%、4.57%、3.05%。能力工具中,主要使用的是“教育培训”(3.55%)。具体表现在:一是加强指导,如《本科审核评估》“组织管理”部分明确教育部负责“指导监督各地各校审核评估工作”;二是经验推广,如《本科审核评估》“反馈结论”部分指出教育部要“做好经验推广,示范引领”。
激励工具中,以“制裁”工具使用为主。四份政策文件中,《破除“唯论文”》使用“制裁”工具的次数最多,对破除“唯论文”落实不力、违规等行为,采取约谈、通报批评、公开曝光、责令整改、追究责任等处理。“正向回报”工具出现在《“双一流”建设评价》中,体现为对“实施有力、进展良好、成效明显的建设高校及建设学科,加大支持力度”。
学习工具在所有的政策工具中使用次数最少。除《专业学位评估》外,其他三份政策文件都有两条编码使用“研究探索”工具,用于鼓励加强研究,以寻求解决方案,如《“双一流”建设评价》呼吁“研究建立建设高校分类体系,完善分类评价办法”。我国教育改革中常用“试点”来“研究探索”,如《本科审核评估》中要求“开展第二类审核评估试点”。“互动协商”主要在不清楚参与者想法时用于收集信息,或者参与者意见不一致时用于协调。四份政策文件内容分析中均未发现“互动协商”工具的使用,但是政策文件制定过程中使用了该工具,如《本科审核评估》是“经过两年多的研究和多方征求意见”而形成[5](P7-13)。
四、政策工具使用中的问题及其消极影响
本文基于施耐德和英格拉姆的政策工具分类框架,分析四份贯彻落实《总体方案》的高等教育评价政策文件中政策工具使用的深层结构。表2显示,总体来看五大类政策工具得到不同程度的使用,但比例悬殊。权威工具、象征和劝诫工具占据了绝大部分的比重,两者使用比例之和达到87.31%。形成鲜明对照的是,能力工具、激励工具和学习工具所占比例均很小,仅略大或低于5%。这种深层结构和新时代高等教育评价改革面临的真问题不匹配。
施奈德和英格拉姆指出,政策制定者可能会将政策实施不力归因于政策执行者没有权威的指示、没有必要的激励、没有必要的能力、不认同政策中暗含的价值观和信念、问题不明确及(或)没有现成的解决方案。依据这些行为假设,当政策文件中大量出现权威工具、象征和劝诫工具,而仅少量出现能力工具、激励工具和学习工具时,也意味着很可能政策制定者头脑中隐含的假设是:需要花大力气去解决没有权威指示以及政策中暗含的价值观和信念没有得到认同的问题,而不需花大力气去解决没有必要的能力、没有必要的激励、问题不明确以及没有现成的解决方案的问题。发布权威指示及引导政策执行者的价值观和信念是重要也是必要的。教育评价归根结底是一种工具或手段,要满足价值主体的价值追求。权威工具、象征和劝诫工具是政府传递价值追求的重要方式,也为高等教育提供了方向和范本。但反观现实,推进高等教育评价改革最大的障碍其实是政策执行者缺乏动力、能力,缺乏对问题的深入理解以及高质量的解决方案。从动力来看,高校很想在各种评价中有优异表现,以获取相关资源,但对评价本身经常是应付的甚至是抗拒的。从能力来看,我国高等教育工作者总体而言评价素养有待提高。另外,由于教育评价本身很复杂,加之我国高等教育评价研究和实践的时间不长,很多评价工作目前并无高质量解决方案,处于探索阶段。政策工具选择的综合模型认为,当国家能力强,且政策子系统复杂程度高(社会行为者类型和数量多)时,决策者更加愿意使用自愿性工具,在需要管制的时候以管制能力作为保障[6]。我国国家能力强,且高等教育评价主体、方式、对象类别层次多元多样,评价系统复杂程度高,按政策工具选择的综合模型,高等教育评价改革适宜选择自愿性工具,也即非强制性、在自愿的基础上解决问题的工具。这样的工具应着眼于政策执行者的动力、能力、对问题本身的理解以及问题解决方案。总之,高等教育评价改革政策不仅要通过强制规定或引导劝诫将政策制定者的意图自上而下地传达给政策执行者,还要花大力气借助政策工具支持政策执行者排除执行障碍,也即需要更多应用激励工具、能力工具、学习工具。