教育评价能力与其能力结构的拟合研究

教育评价能力与其能力结构的拟合研究0

摘要：21世纪以来，教育评价能力构建及评价能力发展受到世界银行和联合国开发计划署以及国际社会诸多学者的高度重视，并对此进行了深入的研究。与之相比，我国的教育评价实践还缺乏此方面的研究，更缺乏教育评价能力与其能力结构的拟合研究，致使教育评价常常失去其有效性，导致教育评价质量的低下。从评价环境、评价系统、评价质量三个维度循证教育评价能力结构，是提升教育评价能力的出发点，任何一个维度及其要素的遗失或其功能的衰退，都会影响教育评价的效果。因此，可以从优化教育评价系统、正视教育评价的网络关系、动态认识教育评价对象的行动过程等方面入手，提高教育评价能力与其能力结构的拟合性，达到提高教育评价质量、为教育决策提供优质服务的目的。

关键词：教育评价；教育评价能力；教育评价能力结构

引用格式：杨颖秀.教育评价能力与其能力结构的拟合研究.[J].教学与管理，2024（16）：1-6.

中国共产党第二十次全国代表大会将完善教育评价体系作为科教兴国战略的重要内容。然而，在教育评价改革的过程中，人们未给予“为什么评价”“谁来评价”“怎么评价”“评价效果如何”等与教育评价能力因素相关的问题充分的重视，因而虽破了“五唯”，但又有“六唯”“七唯”……“N唯”，或显性“无唯”而隐性“有唯”等评价乱象的出现。这样的问题说到底是教育评价能力的匮乏导致教育评价质量低下的结果。

教育评价能力是正确实施教育评价的前提，无论是对学生能力的评价还是对教育其他方面的评价，没有较高的评价能力就保障不了评价的质量，也无法达到评价为决策服务的目的。为提高教育评价能力，21世纪以来致力于评价能力构建的研究大量涌现，使之成为评价领域的研究热点[1]。世界银行（The World Bank，WB）和联合国开发计划署（Unite Nations Development Programme，UNDP）通过教育案例研究等方式对评价能力构建（evaluation capacity building，ECB）和评价能力发展（evaluation capacity developing，ECD）进行了系统研究，为提高教育政策的制定效果和组织决策效果提供了参考。国外有学者通过研究发现，2000-2019年，评价能力构建的研究集中在能力构建的维度、背景和实践等方面，并通过对6本评价杂志的文献计量分析，揭示了评价能力构建研究的学术群体及其相互关系[2]。也有学者通过对这段时间发表在主流评价杂志上（如American Journal of Evaluation等）关于评价能力构建的文献分析，发现此方面的研究可以分为案例应用、评价能力或评价能力构建研究、主要观点概括、框架描述、非正式文献综述等方面[3]。

与之相比，我国学者对教育评价能力的研究还十分薄弱。使用CiteSpace软件，对20世纪90年代以来教育评价研究的综述[4]，基于大数据的教育评价研究综述[5]，以及对2000-2020年的教育评价研究综述[6]，其关键词突现率图谱均未出现“教育评价能力”一词。由此可见，深入探讨什么是教育评价能力、其结构由哪些因素构成、哪些方面尚存不足、教育评价能力如何与能力结构拟合等一系列问题，是我国提高教育评价能力、保障教育评价质量的必然选择。这些问题也是本研究要回答的问题。

一、教育评价能力及其结构的理论基础与模型构建

始于测量时代的教育评价经历了一个多世纪的发展进程，每一个阶段表现出的典型特征都反映着教育评价能力的基本状况。因此，对教育评价典型特征的认识成为认识教育评价能力及其结构的重要依据。

1.教育评价能力及其结构的理论基础

关于什么是评价，有三种比较有代表性的观点，一是认为评价是对评价对象进行价值判断的过程。如美国评价标准联合会将评价定义为：“评价是对某些对象的价值（如优缺点）的系统调查。”[7]本杰明·布鲁姆（Benjamin Bloom）也指出：“评价是指基于准则和标准作出判断。”[8]二是认为评价是提供评价信息的过程。如美国全国评价研究委员会将评价定义为：“评价是一种确定、获取及提供叙述性与判断性信息的过程，这些信息涉及研究对象的目标、设计、实施及结果的价值与优缺点，以便指导如何决策，如何符合绩效的要求，并增加对研究对象的了解。”[9]三是认为评价是一种共同建构的过程。共同建构是指通过对各类与评价有利害关系的人的需求、关注点和问题的应答，并通过解释性辩证环节进行对话和协商，逐步使双方达成共识，形成结论，呈现评价结果[10]。这三种不同的解释是从评价的价值准则、评价的信息效用和评价的行动特征来认识教育评价的行为本质的。也就是说，价值、效用、行动特征是评价的基本要素，不同的价值取向带来不同的行动特征，会收到不同的评价结果。

自20世纪初期以来，教育评价先后以“测量”“描述”“判断”“响应”和“协商”为行动特征，经历了五个发展阶段。“测量”是以考试分数作为原始数据对学生学习成绩进行的评价技术，这种评价的导向作用是强化基础知识训练和追求效率，学校被视为加工学生的“工厂”，考试是学生升学的基本程序。“描述”源于拉尔夫·泰勒（Ralph W. Tyler）1933年开始的8年项目研究。项目评价者的作用在于描述特定目标的优点和缺点，“描述”则成为项目研究的评价技术。“判断”是应教育者希望评价者承担裁判员的责任而出现的评价技术。20世纪60年代中期以后，出现了一系列以“判断”为导向的评价模型，如CIPP模型、以效果为导向的无目标（Goal Free）模型（或目的游离模式）等。20世纪70年代中期以后出现了以“响应”和“协商”为技术手段的建构式教育评价。建构式教育评价强调环境对评价对象的影响，重视评价对象在评价过程中的自我感受，以及他们对评价议题的“主张”“焦虑”及“争议”。这种评价将评价对象视为评价过程中的参与者，认为评价要从评价对象的角度出发，关注他们提出的“观点”“担心”和“不同意见”，尽力规避他们面临的各种风险，并在此基础上确定评价议题，实施评价行动[11]。

从对教育评价的认识和教育评价发展的行动特征来看，教育评价的价值属性、工具属性、目标属性或效果属性是教育评价具有的基本属性。围绕这些属性衡量教育评价的有效性，就要求评价者要有对价值进行判断的能力、正确使用评价工具的能力、实现评价目标或为决策提供参考的能力。

2.教育评价能力结构模型构建

从教育评价的含义和教育评价发展的典型特征来看，评价能力是提高教育评价质量不可或缺的基本条件，决定着教育评价的效果。因此，评价能力构建成为21世纪以来评价讨论的热点和评价研究的新领域[12]。

世界银行早在1987年就开始了对评价能力构建的研究，旨在帮助发展中国家提高评价能力。世界银行认为这是一项有意识的工作，旨在使持续创建和维持有质量的评价及其使用成为常规的整体组织流程[13]。特别是1998-1999学年开始的持续3个学年的研究提炼出了许多成功的经验和案例，包括在拥有40所学校约42，000名学生的独立学区进行的根植于学生、教师、课程等评价能力构建的案例研究[14]。大量的经验和案例使之构建了可持续的评价系统，以确保评价的实施和精致地使用。世界银行将评价能力的成功解释为：如果一个国家能够提高监测信息和评价结果的可用性，但其若得不到应用，那么评价能力的构建也是无用的。例如，可通过提供替代政策、计划和项目的可能收益及成本信息，启发并支持政府决策和规划[15]。也就是说，评价能力构建的目的在于对评价结果的有效使用。

联合国开发计划署将能力定义为“个人、机构和社会以可持续方式履行职能、解决问题、确定和实现目标的才能”[16]，并认为能力发展是一个过程，在这个过程中，能力随着时间的推移而得以获得、加强、适应和坚持 [17]。评价能力也是如此，要在时间的推移中逐渐提升。而要促进评价能力的发展，就需要了解评价能力的基本组成部分和要素，在此基础上构建评价能力系统。所以，评价能力构建与评价能力发展均成为与评价能力息息相关的评价领域的研究主题。根据联合国开发计划署对能力及其发展的解释可以认为，教育评价能力是教育评价主体以可持续的方式履行教育评价职能，解决教育问题，确定和实现教育培养目标的才能，是有效实施教育评价的必要条件。世界银行在对学生评价系统的构建过程中，也充分地考虑了教育评价能力及其效果问题，认为学生评价系统主要包括两个维度：一是评价类型或目的，包括课堂评价、考试、大型的系统层面的评价等。二是质量驱动，质量驱动考虑的关键因素不是提供一个可参考的学生评价系统的理想概况，而是评价活动个人的和综合的质量，即以评价活动生成的恰当信息支持决策活动。因此，质量维度应包括提供可能的环境背景，关照系统联盟，使用恰当的评价工具、过程和程序等。在对这两个维度充分分析的基础上，提出了构建更有效的学生评价系统的矩阵框架，写入《学生评价体系什么最重要》的框架文件中[18]。从对这一框架的解释来看，提供有质量的评价信息以支持决策既是构建学生评价系统的出发点，也是其目的。

美国斯坦福大学Guillermo Solano-Flores教授采用并扩展了上述评价框架中的质量驱动维度，从三个方面提出衡量评价能力的基本框架。第一，支持或有助于评价活动的有利环境，具体指一个国家在多大程度上已经发展或能够开发和使用技术健全的评价工具；第二，评价活动和工具与教育系统的其他组成部分保持一致，具体指一个国家在多大程度上已经建立或能够建立和维持评价系统与教育系统的其他组成部分保持一致；第三，使用已有的评价工具进行评价的质量，具体指一个国家能够在多大程度上利用评价工具和评价系统提供的信息对其政策和实践产生影响[19]。

此外，还有加拿大渥太华大学的学者认为，以往对组织评价能力维度的研究并不清晰，因此试图通过对最高国家政府组织评价能力关键方面的实证研究阐明组织的评价能力维度。研究认为，组织的评价能力由人力资源、组织资源、评价规划和活动、评价素养、组织决策、学习效益六个维度组成，每一个维度又分为不同的子维度。组织在这些维度和子维度上的评价能力可以分为低、发展中、中等和具有典范性四个层面，组织的评价能力不仅在不同维度之间存在差异，而且在不同的子维度之间也存在差异[20]。

上述研究不仅揭示了与教育评价及其能力相关的概念，也揭示了教育评价能力的基本要素。这些研究均出自于权威的国际组织或世界著名大学的权威专家，其研究方式来自于大量的实地研究和案例研究，这表明其研究的过程和结果都是真实的、准确的。在此基础上，我们所获得的研究信息当然也是可靠的，是具有信度和效度的。使用内容分析法依据扎根理论对上述研究信息进行编码，可以归纳得出教育评价能力要素的交集，并揭示教育评价能力结构的基本维度。具体信息见表1。

综合人们对教育评价的认识及其在不同阶段表现的行动特征和世界银行、联合国开发计划署以及相关学者对教育评价能力及其结构的研究，我们可以得出教育评价能力涉及的基本要素，即教育评价的价值、内容、利益相关者，以及教育评价工具、教育评价对政策制定或决策实践的影响等。这些因素可以归结为以价值、内容以及利益相关者为支撑的教育评价系统，以工具为内核的教育评价环境，以评价结果的应用程度为标志的教育评价质量三个方面，每一个方面的建设情况以及与其他组成部分的关系都可以表现出不同的水平，三个维度的综合结果构成教育评价的整体能力，其具体的能力结构可以用模型来表示，如图1所示。

图中的第一个维度是教育评价系统，衡量这个系统的能力高低取决于它与教育系统其他组成部分保持一致性的程度。如果评价者已经建立或能够建立和维持教育评价系统与教育系统其他组成部分以及其他相关系统保持一致、形成联盟，则表明这个评价系统具备了一定的评价能力；教育评价系统与教育系统其他组成部分以及其他相关系统的一致性越高，则表明教育评价能力越强。

第二个维度是支持或有助于教育评价的环境，环境指向教育评价工具的拥有、开发和使用情况。如果评价者（包括政府、学校、教师、评价的委托者等）具有了技术健全的教育评价工具，或有能力开发或使用技术健全的教育评价工具，则意味着这个评价者具备了一定的教育评价能力；具备、开发、使用教育评价工具的程度越高，则说明教育评价能力越强。

教育评价能力与其能力结构的拟合研究

经典小说推荐

杂志订阅