基于课程成绩分析的高校学生评教结果识别与应用

作者: 马朝珉 李伟凯 袁晓东 孟军 吴秋峰

基于课程成绩分析的高校学生评教结果识别与应用0

摘  要:该文以某高校思政类必修课程的学生评教结果为研究样本,从评教分数(封闭式问题)和意见建议(开放式问题)两部分出发,分析课程成绩与评教结果的关系,识别评教结果的有效性,探索高校学生评教结果应用路径。研究发现,学生课程成绩与评教分数整体数据呈现不相关,个别课程出现负相关;在大多数情况下,课程成绩为“中”(70分≤中<80分)的学生评教分数有效性最高;大一年级课程成绩中等以上(≥70分)的学生评教分数有效性高于其他年级。运用K-means聚类算法对评教数据进行聚类分析,将学生评教样本分为高满意高收获型、高满意低收获型、低满意高收获型和低满意低收获型四个类别。在课程成绩分析基础上,提出高校学生评教结果合理应用的建议。

关键词:高校学生评教;课程成绩;评教结果识别与应用;思政类必修课程;K-means聚类算法

中图分类号:G642        文献标志码:A          文章编号:2096-000X(2023)28-0014-06

Abstract: Using the students' teaching evaluation results of ideological and political compulsory courses in a university as a research sample, the article analyzes the relationship between course scores and evaluation results, identifies the effectiveness of evaluation results, and explores its application path from two parts-closed question and open questions. The study found that the overall data of student course scores and evaluation scores are not correlated, and individual courses are negatively correlated; in most cases, students whose course scores are "medium"(70 points≤medium<80 points) have the highest effectiveness in evaluation scores; the effectiveness of evaluation scores for students with average grades(≥70 points) in the freshman year is higher than other grades. The article uses K-means clustering algorithm to cluster the teaching evaluation data, and the students' evaluation samples are divided into four categories: high satisfaction-high yield, high satisfaction-low yield, low satisfaction-high yield, and low satisfaction-low yield. Finally, the article puts forward some suggestions on the reasonable application of university students' teaching evaluation results.

Keywords: university students' teaching evaluation; course score; identification and application of teaching evaluation results; compulsory ideological and political courses; K-means clustering algorithm

学生评教是教学评价的常规方式,也是教学质量监控和反馈的重要手段。除教学因素外,其他非教学因素不同程度地影响学生评教结果。学术界对此展开深入研究,探寻评教过程及结果的优化路径。李盼道等[1]分析高校学生评教结果失效的影响因素,包括学生因素、教师因素、学校因素及课程因素,提出评教容易导致逆向选择并阐述了改善路径;盛艳燕等[2]认为教师职称、教师年龄、教师学历、学生年级和班级人数对评教分数有微弱影响,学生年级和教师职称对评教分数的影响相对较大,应挖掘非教学因素影响学生评教分数的调节变量。潘云华等[3]研究发现,性别、年级、学习成绩、对评教必要性的认知、对评教潜在作用的认知及评教态度是影响高校学生评教有效性的学生个体因素,且学生主观因素对评教有效性的影响大于客观因素。本课题组前期研究发现,教师的职称、性别、学历和年龄段,课程的学分、班额、属性及年级均对学生评教分数具有独立或交互作用,应完善教学安排、合理利用评教数据、改变职称评定导向。

在非教学影响因素中,教师背景、课程背景、学生背景可测量但难以改变;对评教意义的认知可通过宣传引导等措施改善,但较为抽象,难以实时测量;课程成绩可测量可筛选,与评教成绩几乎同时获得(同类研究中有“学习成绩、学习成果、考试成绩、考试分数”等描述,本文研究对象为课程最终的总成绩,包含平时成绩、考试成绩、作业等,以下统称为“课程成绩”)。因此一些研究者和高校教学管理人员重点关注学生课程成绩,试图通过课程成绩分析评定评教数据的有效性。有研究者认为应删除课程成绩差的学生的评教数据,原因有三:第一,对教师心存不满,故评教打分低,不够客观;第二,没有听懂课程内容,无法评论教师教课水平;第三,出勤率较低,未参加教学活动则不具备评价资格。也有研究者认为,无论课程成绩好坏,学生都有表达学习感受的能力和意见建议的权利,且若因教师教学安排和水平原因,学生未听懂而导致考试成绩差,这部分学生的心声更应关注,并有针对性地改进教学。基于以上讨论,本文在课程成绩分析基础上研究课程成绩与评教结果的关系,分析判断学生评教结果的有效性,并基于课程成绩因素提出评教结果的应用建议。

一  研究设计

(一)  数据来源

本研究的案例数据是某高校连续三个学期全校思政类必修课程的学生课程成绩与学生评教结果,课程包括思想道德修养与法律基础、毛泽东思想和中国特色社会主义理论体系概论(1)(2)、马克思主义基本原理概论和中国近现代史纲要。思政课在全校范围内开设且内容一致,不存在不同专业难度不同(如英语课)、不同专业内容不同(如数学课)等情况,便于共性分析。共回收评教问卷25 593份,其中有效问卷25 548份。

(二)  研究思路

本研究应用SPSS23.0和Excel统计软件,通过分析学生课程成绩与学生评教结果的关系,提出合理应用学生评教结果的建议。学生评教结果包含封闭式问题(closed question)和开放式问题(open question)。封闭式问题从教学效果、教学态度、教学内容、教学方法和教学表达五个方面考查学生对教师、课程的满意度,根据权重、选项自动生成评教分数;开放式问题需填写对教师、课程的意见建议。通过评教分数的应用分析,探索“课程成绩”与“评教分数”的相关性及“课程成绩”与“评教分数有效性”的关系,提出合理应用各分数段评教分数的建议;通过评教“意见建议”的应用分析,运用K-means聚类算法,根据课程成绩与评教分数两个变量对样本聚类分析,提出分类使用意见建议的路径。

二  评教分数(封闭式问题)分析

(一)  课程成绩与评教分数的相关性

Spooren P[4]运用交叉分类多层次分析发现,学生成绩对学生评教结果的影响并不大,Zabaleta F[5]研究发现,学生课程成绩与评教结果之间的关系比较模糊。朗本等学者研究发现,学生成绩和学生评教分数两者存在正相关关系[6]。对于这种正相关关系,有的学者认为是分数互惠、宽容评分导致,是一种潜在偏差来源。如赵颖[7]、孙鳌[8]、黄桂[9]等学者认为学生成绩和学生评教分数之间存在“分数膨胀”,在“教师利益与学生评教分数捆绑”背景下,教师存在“讨好”“宽松给分”现象。而有的学者认为,评教分数高的教师教学效果好,有利于学生获得知识、获取好成绩,认可度高,二者相互促进,教学相长,这种正相关关系恰好验证了学生评教的效度,符合“预期分数的内生性”。如森特拉等研究发现,学习成果对学生评教结果产生很大的积极影响[6]。简单而言,两种观点的分歧在于,学生评教分数高是源于教学收获多还是与教师“分数互惠”。基于此,本研究详细分析课程成绩与评教分数的相关关系,首先观察平均分的走势,然后在SPSS中分析全体样本的相关性,最后细化到一名教师教授的一门课程(以下简称为“一门次”),研究两者的相关性。

本文研究发现,在研究样本中依次删除课程成绩不及格、低于70分、低于80分的学生的评教结果,评教分数由92.47分依次升至92.48、92.51、92.62分,呈上升趋势,但幅度很小,可见“课程成绩差的学生普遍给教师评价分数低”这一观点不成立。同时,以教学班为单位,评教平均成绩并没有随着考试平均成绩下降而呈下降趋势。在统计的45门次课程中,课程成绩平均分在80分以下的有19门次(表1),其对应的评教分数排名在前10名中占据6位,基本可以判断不存在“普遍学生因教师给分低而在评教中故意打出低分”现象。

在SPSS中进行相关性分析,全部学生评教分数与全部课程成绩的皮尔逊相关系数为0.033,在P=0.01的水平上显著相关,但由于相关系数在0.3以下,接近于0,表示两者无相关性。

为进一步验证结果,排除教师教学因素影响,以门次为单位,分析课程成绩与学生评教分数之间的相关性。共分析45门次课程,其中2门次课程的皮尔逊相关系数绝对值大于0.3,为弱相关,其他均为不相关(表2列出的是绝对值大于0.1的课程)。2门次弱相关的课程皮尔逊相关系数分别为-0.43和-0.37,为负相关,即因变量值随自变量值的增大(减小)而减小(增大)。进一步说明,学生评教分数不会随课程成绩相应变化,甚至会出现相反情况。

(二)  课程成绩与评教分数有效性的关系

前文分析了课程成绩与评教分数的相关性,结果是整体不相关,个别存在弱相关,即课程成绩对评教分数基本不产生影响。以下通过确认评教结果有效性较差的数据在各课程成绩段(优≥90分,80分≤良<90分,70分≤中<80分,60分≤及格<70分,不及格<60分)的分布,分析课程成绩与评教分数有效性的关系。

1  确定教学质量较差的教师集

本文从两个方面获取教学质量较差的教师信息:一是课程成绩优秀的学生(成绩≥90分)中评教分数小于80分的数据。该部分学生成绩优异,知识获得量较高,基本不存在“因没学会而无法客观评价”或“因成绩不好打出报复性分数”的现象,该群体打出低分数主要与教学质量、教学感受有关,有效性较高。二是认真填写意见建议的学生中评教分数低于80分的数据。认真填写意见建议,在一定程度上排除了“一键评教”“应付性评教(随意快速勾选)”的可能性,有效度较高。低于80分评价信息的原因是,评教题目选项为四级量表“优、良、中、差”,若全部勾选为良,得分为80分,低于80分的所有评价中均有“中”评价,即认为该项指标感觉一般。由此获得较为准确的学生群体评价出的教学质量存在问题的教师集,再与督导评价出的低于90分的教师集(约为后30%)取交集,从而获取督导、学生一致认为教学质量较差的教师集。

在25 548份样本中,课程成绩大于等于90分的样本有5 609条,其中评教分数低于80分的541条;意见建议有5 906条,去掉标点符号、乱码、数字等无意义的评价,剩余有价值的意见建议5 869条,其中评教分数低于80分的362条。两者合计903条,去除重复项,剩余791条,统计得出以学期、教师编号、课程名称为观测点的76条数据。与督导评价信息比对,得出学期、教师编号、课程名称完全一致的12条数据;学期不一致,教师编号、课程名称一致的16条数据;涉及教师15人,编号分别为1010、1011、1014、1022、1024、1026、1029、1030、1032、1033、1034、1053、1054、1056、1058。

经典小说推荐

杂志订阅