智能教育时代的评估创新:人机协同教学评价体系构建

作者: 张笑墉 李玉斌

智能教育时代的评估创新:人机协同教学评价体系构建0

摘要:本文旨在构建适用于人机协同教学的教学评价与评估方法体系,以应对传统教学评价方法在新型教育模式中的局限性。作者在研究过程中确立了构建评价体系的原则与框架,通过层次分析法构建判断矩阵,并进行权重计算与一致性检验,同时运用模糊综合评价法,将定性评价定量化,生成各指标的综合得分,最终形成完整的评估体系,为教育管理者提供了科学的决策支持,能够助力优化教学资源配置、提升教学质量。

关键词:人机协同教学;模糊综合评价法;层次分析法;教学评价体系

中图分类号:G434  文献标识码:A  论文编号:1674-2117(2025)07-0107-06

引言

近年来,随着教育信息化的迅猛发展,人机协同教学作为一种新兴的教育模式逐渐引起了广泛关注,在“人工智能+教育”的国家战略背景下,人机协同教学在各类院校中的应用愈发广泛。传统的教学评价与评估方法,虽然在一定程度上能够反映教学质量,但往往忽视了人机协同教学中技术与教学的深度结合所带来的复杂性与多维度影响。因此,构建适应人机协同教学特点的评价与评估方法体系显得尤为必要。

人机协同教学评价是一个融合了人类智慧与机器智能的复杂过程,旨在通过科学的评估方法,全面、准确地反映教学活动的质量和效果。在国内,人机协同教学评价关注教学设计的科学性、教学实施的合理性以及教学支持的有效性,具体评价内容包括教学目标的明确性、教学内容的适切性、教学方法的多样性、教学资源的利用效率、教师教学水平、学生学习参与度、教学互动质量等多个维度,它还强调对技术支持的到位性、平台使用的便捷性、数据处理与反馈能力的评价,以确保教学活动的顺利进行。在国外,人机协同教学评价的内容也涵盖了类似的方面,但更加注重对学生个性化学习和创新能力的培养,评价过程不仅关注学生的学习成果,还重视学生在学习过程中的思维发展、创新能力以及团队协作能力的培养。国外的人机协同教学评价还强调对智能教学系统的性能、易用性和可靠性的评估,以确保系统能够为学生提供高效、准确的学习支持。综合来看,国内外的人机协同教学评价都致力于构建一个全面、客观、准确的评价体系,以推动教学活动的持续改进和优化。

人机协同教学评价与评估的具体方法

1.模糊综合评价法的引入

传统的评价方法难以适应人机协同教学的复杂性和多样性,尤其是在面对多维度、多层次的教学过程时,单一的定量或定性评价往往无法准确反映实际教学效果。模糊综合评价法的引入为解决这一问题提供了有效的途径。该方法通过模糊数学的原理,将定性评价与定量分析相结合,能够处理不确定性和模糊性问题,特别适合用于对人机协同教学的复杂评价。借助模糊综合评价法,可以更为客观和全面地评估教学过程中的各类因素,包括学生的学习表现、智能系统的辅助效果以及师生互动情况等。

2.人机协同教学评价的数据收集与处理

在人机协同教学评价中,数据的收集与处理是至关重要的环节,评价的准确性和科学性在很大程度上取决于数据的完整性和可靠性。在进行教学评价之前,必须首先建立完善的数据收集机制,确保能够获取全面、真实的教学数据。在人机协同教学模式下,数据的来源不仅仅包括学生的学习表现和教师的教学行为,还包括智能系统的运行数据、学习资源的使用情况以及学生与系统的互动记录等。

在数据收集过程中,必须充分考虑数据的全面性和代表性,在收集学生学习表现数据时,不仅要关注学生的学习成绩,还要收集其学习过程中的行为数据,如学习时长、学习路径、知识点掌握情况等。在收集教师教学行为数据时,除了关注教师的教学内容和教学方式,还需要记录教师与智能系统的互动情况,以及教师对学生个性化指导的情况。智能系统的运行数据同样不可忽视,通过对系统运行数据的分析,可以评估智能系统在教学过程中的实际效果,如个性化推荐的准确性、学习路径的优化效果等。

构建人机协同教学评价与评估指标体系

1.构建指标体系原则

第一,全面性原则。在人机协同教学模式下,既要考虑到传统教学中的核心指标,如学生的学习成果、教师的教学质量等,还要纳入智能系统的协作效果和人机交互质量等新兴因素。

第二,科学性原则。每一项指标的设置都应有其明确的评价目标和评价标准,并且要能够通过数据或事实进行验证。

第三,层次性原则。在人机协同教学评价中,可以将评价指标分为宏观、中观和微观三个层次。宏观层次的指标主要用于评估整个教学过程的整体效果,如教学目标达成度、教学资源利用率等;中观层次的指标则侧重于对具体教学环节的评价,如课堂教学效果、学生学习表现等;微观层次的指标则更加关注教学过程中的细节,如师生互动情况、智能系统的实时反馈效果等。

第四,灵活性原则。人机协同教学模式的多样化和不断变化的特性,要求评价指标体系具备一定的灵活性,能够根据不同教学场景和教学目标对其进行调整。

2.指标体系结构

由于传统的教学评价方法存在一定的局限性,难以全面反映多维度影响因素,因此,在构建人机协同教学评价与评估方法时,笔者基于真实应用的典型案例,提出了更符合现代智能教学环境的评价指标(如上页表1),以确保对教学效果进行准确评估。本指标体系通过量化各项指标和综合分析,可以准确识别教学过程中的关键问题,为改进教学设计、提升教学效率提供科学依据,进而支持更加精准的教学决策和策略优化。

构建评估流程

1.构建层次分析法两两比较矩阵

依据表1,可以建立层次分析法结构模型,以明确各因素在不同层级之间的隶属关系。利用Cij表示在同一一级指标下,两个二级指标ai和aj相对于所属指标Ux的重要性比例,要求Cij>0,且满足Cij=1,Cij=1/Cji。在评估过程中,采用了1~9标度法对数据进行处理。该标度法规定了Cij的值域为[1/9,9],其中数值1、3、5、7、9分别表示ai与aj相比的相对重要程度,分别为相同重要、轻微重要、明显重要、特别重要、极端重要;而数值2、4、6、8则表示两者之间的中间程度。基于这种量化的比较方法,可以构建一个科学合理的人机协同教学评估模型,为系统地评估教学设计、实施、支持、过程及效果奠定基础。

2.计算权重向量

在人机协同教学的评价与评估过程中,构建合理的指标体系和判断矩阵是至关重要的。在上述分析中,使用1~9标度法建立了不同层级的判断矩阵(C、C1、C2、C3、C4、C5)。为使评估结果更具实操性,可采用特征根法对各判断矩阵进行计算。在这一过程中,通过计算判断矩阵的最大特征根λk,并获得相应的权重向量Wj。

在本文中,判断矩阵为正矩阵,因此其最大特征根λk唯一且存在。利用Matlab软件对矩阵进行运算,得出各层级的最大特征根和对应的权重向量。最后,将权重向量进行归一化处理,以确定各因素相对所属层级的权重分布。

通过Matlab软件运算,矩阵C、C1、C2、C3、C4、C5对应的最大特征根分别为λ0=5.32,λ1=5.11,λ2=4.85,λ3=4.67,λ4=3.24,λ5=3.00,对应的权重向量分别为W=(0.42,0.25,0.18,0.10,0.05),W1=(0.35,0.30,0.20,0.10,0.05),W2=(0.40,0.30,0.15,0.10,0.05),W3=(0.45,0.25,0.15,0.10,0.05),W4=(0.50,0.30,0.20)、W5=(0.55,0.25,0.15,0.05)。

3.一致性检验

为确保评估结果的可靠性,必须对矩阵的分析结果进行一致性检验,以验证稳定性和一致性。在人机协同教学评价中,采用一致性指标CI和一致性比例CR来进行检验。CI的计算公式为CI=(λmax-n)/(n-1),其中,λmax为矩阵的最大特征根,n为矩阵的阶数。CR则通过公式CR=CI/RI进行计算,其中RI为对应阶数矩阵的平均随机一致性指标,如上页表2所示。若计算出的CR值小于0.1,则表明矩阵的一致性在可接受范围内;若CR值大于或等于0.1,则意味着一致性指标存在较大差异,可能需要重新收集数据进行评估。

根据计算结果,所有判断矩阵的CR值均小于0.1,说明矩阵的一致性可接受,如上页表3所示。

从表3中的一致性检验结果来看,各个矩阵的一致性均得到了有效验证,说明在评价指标权重设置过程中,各矩阵的判断矩阵具有较好的逻辑一致性。表中所有的特征根值都接近于其对应矩阵的维度值,这表明矩阵的构建具有合理性。对一致性指数CI和一致性比例CR的分析显示,各矩阵的CR值均低于0.1的临界值,尤其是C2和C3的CR值甚至为负值,这进一步验证了判断矩阵的一致性极好,在权重确定过程中,判断矩阵的内部逻辑自洽且无明显的判断偏差。虽然C4的CR值相对较高,但其仍然在可接受范围内,这意味着在3×3矩阵的情况下,该评价的判断逻辑仍然可靠,C5矩阵的CR值为零,表明这是一个完全一致的矩阵,权重分配没有任何不一致性问题。

模糊综合评价法评估

1.建立因素集与评价集

在进行人机协同教学的评价与评估时,需要明确准则层和指标层的影响因素集,以便系统化地进行评价。设定准则层的影响因素集为U,其中U={u1,u2,…,um},m表示准则层的因素数量。同时,对于每个准则层影响因素Ui,可以进一步将其细分为指标层的子因素,如u1={u11,u12,…,u1k},其中k为隶属于u1的指标数。为了有效地对这些因素进行评分,需要建立一个评价集V,该集定义了评判等级的范围,记作V={v1,v2,…,vn},其中n是评判等级的数量。

为便于评价操作,笔者将评价等级设置为优秀、良好、合格、差四个等级,分别赋予的得分为{90,75,60,30}。在实际评估过程中,依据这些等级对各影响因素进行打分,以反映其实际情况。

2.建立单因素模糊评判矩阵

在进行模糊综合评判时,构建单因素模糊评判矩阵是一个重要的步骤。单因素模糊评判矩阵的建立基于对各个评判因素的隶属度的计算。隶属度反映了每个评判因素在不同评价等级上的表现程度。通常,评判等级集(结论集)V包含若干个评价等级,从低到高依次排列,如“很差”“差”“一般”“好”“很好”等。对于每一个因素ui,需要依据这一评价等级集对其进行评分。

收集专家与评审人员对每个因素ui的评分数据,假设有m个专家参与评分,每个专家对因素ui的评分会落在结论集V的某个等级vj上,计算因素ui被评为vj的次数与专家总数之比,即为隶属度rij,这个隶属度rij表示的是因素ui在结论集V中被评为vj的概率或程度,数值范围在0到1之间。通过计算每个因素ui在不同评价等级vj上的隶属度rij,可以构建出一个单因素模糊关系矩阵Ri。这个矩阵的每一行对应一个因素ui,每一列对应一个评价等级vj,而矩阵中的元素rij则代表了因素ui在vj评价等级上的隶属度(如上页表4)。

通过以上步骤,得出了人机协同教学中的教学评价与评估的模糊综合评价结果。结果显示,该方法能够有效综合多种因素进行评价,为教学效果的改善和策略调整提供了科学依据。

结论

本研究通过构建人机协同教学的评价与评估体系,结合模糊综合评价法与层次分析法,对教学过程的各个环节进行了科学且定量的评估,研究结果揭示了该体系在评估人机协同教学中的各要素相对重要性及其实际表现方面的有效性,能帮助明确教学中的优势与不足。研究表明,信息化手段与传统教学方法的合理结合能够显著提升教学效率,通过该评估体系的应用,教育管理者可以更加清晰地了解教学中的关键因素,并据此进行针对性的改进,以优化教学策略和资源配置。

参考文献:

[1]秦丹,张立新.人机协同教学中的教师角色重构[J].电化教育研究,2020(11):13-19.

[2]王辞晓,徐珺岩,郭利明,等.多场景人机协同在线教学评价框架研究——基于层次分析法和熵权法的分析[J].现代教育技术,2023(01):74-82.

[3]余明华,王龚,卜洪晓,等.未来教师如何培养?——人机协同师范教育创新的理论模型与实践进路[J].现代教育技术,2024(01):117-126.

[4]毛刚,周跃良,何文涛.教育大数据背景下教学评价理论发展的路向[J].电化教育研究,2020(10):22-28.

[5]肖冬杰,刘瑞,申海峰,等.人机协同下职业教育课堂评价改革与实践[J].牡丹江教育学院学报,2023(06):16-19.

[6]吕寒雪.人机协同教学中教师身份认同的情感理路与提升路径:一个情感社会学的解读[J].电化教育研究,2023(12):108-115.

[7]袁伟,王娅,旷小芳,等.人机协同的“双师课堂”人工智能教学模式构建实践[J].华夏教师,2024(11):6-8.

[8]何文涛,张梦丽,逯行,等.人工智能视域下人机协同教学模式构建[J].现代远距离教育,2023(02):78-87.

[9]张家华,邓倩,周跃良,等.基于人机协同的师范教育实践改革与平台设计[J].教育发展研究,2021(01):6.

[10]方海光,李海芸.人机协同课堂教学理论与实践研究[J].中国现代教育装备,2022(04):4.

[11]寇军,张震堂,陈虹莉,等.“人工智能+智学”模式推动人机协同教学场域分析与框架建构[J].陕西教育:高教版,2022(12):38-40.

作者简介:张笑墉(2000—) ,男,汉族,江苏镇江人,辽宁师范大学教育学部在读硕士,研究方向为数字化学习;李玉斌(1975—),男,满族,河北承德人,通讯作者,博士,教授,博士生导师,研究方向为数字化学习。

基金项目:辽宁省教育厅重点攻关项目“面向国家教育数字化战略的中小学校长数字化领导力发展研究”(项目编号LJ112410165026)。

经典小说推荐

杂志订阅