国际科学课堂教学评估趋向:范式转型、典型案例与本土反思

作者: 张玉莹 杨钰雯 王晶莹

国际科学课堂教学评估趋向:范式转型、典型案例与本土反思 0

摘   要:科学的评价标准有助于促进学生全面发展,指导教师改进教学。文章以全球教学洞察教学质量框架和科学教学评估准则为例,探讨构建多维课堂评价标准的必要性。在梳理当代课堂评估与科学评价走向的基础上,总结我国典型的课堂评估标准,厘清我国科学评估标准与国际标准的差异,以期为我国科学课堂评估体系的构建提供建议。

关键词:课堂教学质量 科学评估 课堂观察

课堂教学评价是一把“双刃剑”,既有指导课程改革、促进教师发展、激励学生进步的正向功用,也有加剧趋同化、导致工具化与功利化的消极影响。长期以来,在“唯分数”评价理念的导向下,科学课堂评价倚重学生学科知识的获取,对师生情感体验与学生关键能力的发展关注不够。中国四省市(北京、上海、江苏、浙江)15岁中学生的阅读、数学和科学成绩在PISA 2018中位居全球榜首,但是幸福感得分较低。在全球教学洞察(GTI)视频研究中,上海仍有2/3的课堂处于低水平参与状态。[1]提高科学课堂教学质量,构建多元和有效的课堂教学评价指标势在必行。本文聚焦当代课堂评估与科学评价新趋向,系统分析我国当前的典型课堂评估标准,并与GTI教学质量框架与科学教学评估准则(Instructional Quality Assessment in Science,IQA-Science)进行比较,反思我国课堂评价体系的现状,以期为科学课堂评估体系的构建提供启示。

一、课堂教学评估范式转型及其典型案例

(一)课堂评估范式的转型

第一,理念转向:由工具理性到价值理性。传统意义上各国中小学课堂评价更多关注“对学习的评价”,即评价是检测学习效果的工具。随着认知科学的发展,学习的主动建构性得到广泛重视。“为了学习的评价”(形成性评价)通过外部反馈、“作为学习的评价”通过内部反馈,共同指向学生的发展,体现了从“评价即甄别”到“评价促发展”的理念转变。故国内外研究皆以“促学评价”为导向,促进学习的评价(assessment for learning)、作为学习的评价(assessment as learning)、学习导向的评价(learning oriented assessment)等课堂评估新范式陆续出现。[2]

第二,目标深化:由知识获得到素养提升。在全球化和数字化的时代背景下,社会对人才培养的要求由具备基本的知识与技能上升为具备高阶思维、能健康生活。素养评价分别在2008年、2017年起开始先后成为国外、国内的研究热点,故高阶思维能力和学生情感参与成为课堂评价的重点。例如,法国课程体现“科学素养、批判思维”等高阶思维能力,同时采用质性评价方式;美国提出了“基于证据的评估设计”理论以支持高阶能力测评等。

第三,方法革新:由单一到整合。在我国,听评课应用较为广泛;在国际上,通过教师自陈式报告描述班级教学较为广泛,主观性较强,很难提供课堂改进所需要的信息。此外,目前国际上的大规模测评多测评“教学活动出现频率”“教学策略强度”等量化维度,缺乏对“师生互动过程”的质性刻画。可见,无论是主观经验还是量化评价,都无法兼顾课堂教学的完整性与发展性。随着互联网与大数据的发展,科技赋能重构教育评价体系。从20世纪末的国际数学与科学趋势研究(TIMSS)到21世纪的GTI视频研究,视频技术一直是课堂教学研究中重要的方法论工具,通过人工智能、机器学习等对课堂教学视频进行动态捕捉与编码分析,可以获得实际教学中师生互动的丰富细节,辅以教学资料与学生作业以判断学生的认知深度,可以有效弥补定性研究与定量研究的不足。

(二)典型案例:GTI视频研究项目

经合组织为了弥补教师教学国际调查质性研究的不足,于第三轮调查中加入GTI视频研究项目。基于PISA学生问卷中关于教学质量的条款及TIMSS中关于学习动机的研究,GTI将课堂教学概念化为三个维度六个实践领域(见表1)。[3]其中,课堂管理指教师确保课程顺利开展所采取的行动;社会情感支持指积极向上的氛围及支持性学习环境;学科内容质量要求学习内容准确,师生就知识、知识的表征方式建立清晰联系;课堂话语包括促进认知推理的师生延展性对话和生生交谈;学生认知参与指学生有思考地分析、创造或评价;基于学生理解的评价及回应则强调教师基于学生理解调整教学以激发学生深度思考。

可以发现,GTI视频研究贯彻以学生为中心的发展理念,强调学生认知、行为与情感的高度参与和全面参与。具体体现在两方面:一是重视学生情感体验,将支持性课堂氛围、师生对话有效性等不直接影响学生成绩但影响学生学习兴趣的“边缘性”课堂教学维度作为一个观察维度,以评价为导向,引导学校、教师与家长关注学生学习的情感体验并给予支持;二是强调学生高阶思维发展,如学科内容质量维度特别关注教师激发学生认知参与程度,学生认知参与维度强调学生是否多视角、多方法解决问题。

GTI视频研究给我国课堂教学评价提供了新的范式,有必要将社会情感支持与基于学生深度参与的教学质量各维度纳入我国课堂评价体系。此外,教学评估受教学主题的影响较大,相较数学课堂,科学课堂更加关注学生对学科核心概念与跨学科概念的深入理解及科学实践能力,GTI视频分析框架并不涉及该部分的评估。因此,如果有意将GTI视频分析框架应用于科学课堂,还需借鉴其他科学评估准则并加以完善。

二、当代科学课堂评估的走向及其典型案例

(一)当代科学评价的走向:以美国为例

随着美国《K-12科学教育框架》(A Framework for K-12 Science Education)和《新一代科学教育标准》(Next Generation Science Standards,NGSS)的发布,美国针对科学课堂教学与评估进行了一系列改革,于2018年公布《新一代科学教育测评》。NGSS评估系统强调评估不仅是教学的一部分,评估本身也是一种学习,评估应该融入教与学中,即从“为学习评价”向“评价即学习”转变。因此,NGSS评估更关注学生高阶能力发展及学生对复杂知识与技能的运用。具体而言,NGSS评估系统具有以下特点[4]:一是强调学科核心概念、跨学科概念和科学实践的整合;二是关注概念与思维的进阶;三是通过科学与工程实践的表现任务揭示学生对概念的理解及技能运用水平;四是重视科学本质;五是面对全体学生,给予劣势群体学生更多关注。

这些特点给科学课堂教学评价带来了启示与挑战:第一,要评估学生需完成的表现型任务的广度与深度;第二,要评估学生围绕学科核心概念和跨学科概念所进行的科学实践的表现;第三,要评估随着教学的深入,学生对核心概念与跨学科概念的理解进阶;第四,要评估是否每个学生都得到了公平的学习机会。

(二)当代科学评价的核心:整合、进阶与公平

第一,以任务为基础,整合科学内容与实践。K-12科学教育框架强调科学教学必须为所有学生提供机会,在为学生学习创造的机会中整合科学内容和实践。学习机会是指在一定教学情境下,教师为学生呈现的学习内容或实践练习的机会[5],是国际上评估教学质量的重要指标。学生的学习机会受课堂分配到的科学任务的限制。任务是分配给学生的以课堂为基础的活动,它可以是一个项目、一项调查或一个问题,作为一堂课的一部分或跨越多堂课。学生在从事科学任务时,对学科核心思想与跨学科概念进行高水平思考并有意义地参与科学实践。可以说任务创造了学生思考主题的情境,提供了一个可定义和解释学生智力工作的分析视角,从而评估学生在科学实践中的表现。

第二,以认知为主线,关注概念理解的进阶发展。科学学习是认知不断丰富与深化的过程,学生基于头脑中已有的知识与经验建构新知,在新旧知识同化或顺应的过程中加深对新知识的理解。评估需要反映学习的进阶属性,刻画学生对于概念理解或实践能力由浅到深的个性化学习路径。NGSS评估系统是基于能力进阶的测评,教师会选择不同的表现型任务引导学生参与科学内容的学习,这些不同的任务需要不同层次和种类的学生思维。但是在实施过程中,这些任务对学生思维的需求往往会下降[6],此时教师的提问与讨论就发挥着重要的作用,故教师提问与学生讨论的有效性也是NGSS评估重点关注的方面。

第三,以学习机会为中心,强调教育公平。高质量的学习机会可以揭示教学的有效性,学生获得学习机会的均等性也可以揭示教学公平。如果部分学生没有机会学习规定的知识、发展实践能力或者没有机会展示学习成果、获得有效的评价与反馈,那么课堂评价结果的可靠性将受到质疑。有研究表明,教师在上课前对特定学生群体有具体的看法,这些看法会影响他们分配给学生的学习机会的类型[7],调查发现,教师往往不会把自认为较难的任务分配给成绩较差的学生,但是所有学生都喜欢参与复杂的任务并且乐于挑战。

(三)典型案例:IQA-Science

美国现有的部分教学质量指标存在一定局限性,没有注意到由科学探究到科学实践的转向。因此,美国佛罗里达州立大学的米拉伊·特库姆鲁—基萨(Miray Tekkumru-Kisa)团队开发了IQA-Science。IQA-Science由两个量表组成(见表2),包括5个评价维度。任务潜力的严格性这一维度主要评估学生在完成教学和课程材料中出现的科学任务时可能需要的思维水平和类型;任务启动的严格性主要评估教师设定的任务所描述的学生智力工作框架,因为科学课的开始通常会向学生介绍课程目标和他们将在课程中参与的活动,所以启动阶段在确定学生完成分配的任务需要的参与水平和思维方式方面发挥关键作用;任务执行的严格性是对大多数学生在整个课程内所从事的思考水平和类型的整体判断,其中激发学生思维、组织富有成效的话语、提出发人深省的问题等教学因素会维持或增加学生参与高层次思维的机会;讨论的严格性评估学生在讨论中的思维水平和类型,通过富有成效的谈话,学生可以交流思想,参与基于证据的主张和论证及科学的智力实践;教师期望的严格性主要评估教师在整个课程和作业中期望学生完成的智力工作的种类和水平。

横向来看,IQA-Science以任务作为整合科学内容与实践的载体,评估学生的表现与水平;纵向则按照任务设计、任务启动、任务实施、任务讨论的逻辑展开,评估学生认知需求变化,由浅入深,环环相扣。此外,课堂观察集与学生作业集作为证据,互证互补,建立了比较的共同基础,教师对学生作业的分类与评估标准则为研究教师对不同学生的看法如何影响教学任务分配提供了窗口。

三、对我国科学课堂评估标准的反思

(一)评估标准分类

由于我国大部分地区实行分科教学,关于科学课堂的评价标准有限,大多是直接运用外国的科学课堂评价工具或者基于外国评价标准进行改进,也有学者基于我国科学课堂现状提出符合我国学情的评估标准。按照来源,将其分为国外改进和本土构建两大类(见表3)。

对于国外课堂评价标准的改进,主要呈现两方面的特征。一是由于国内外课堂文化的不同,在实证研究的基础上,删除某些观察指标,如课堂反思在我国科学课堂出现相对较少。二是由于课堂评价工具的一般性,考虑到理科特有的实验活动而新增实验维度,包括演示实验、学生实验及教师指导下的实验。本土构建比较有代表性的是刘恩山教授基于核心素养提出的科学课堂评估范式——内容知识、能力、教学知识、科学和探究的性质(content knowledge,capacity,pedagogical knowledge,nature of science and inquiry,CCPN),其中理科属性维度强调科学探究与科学本质的评价,是重要的学科特征维度。

(二)国际比较与不足

1.评价理念坚持素养导向,但对情感体验重视不够

整体来看,我国本土构建的科学课堂评价指标都包含了科学探究、态度责任、活动体验等要素,体现了对学生素养发展的关怀。可见,新课改以来,我国的评价理念已经逐步发生转变,但是整体框架方面对师生情感体验重视不够,虽然标准里涉及该部分的评价,但往往作为课堂文化的子维度,并不作为必须的观察要点。

2.评价内容局限于表面互动,而非对背后规律的探究

通过对各评价标准的二级指标分析发现,各评价标准都更加关注学生在课堂中的主体地位,但这种关注往往停留在师生互动的频率及教学策略的恰当与否,难以指明教学需要具体改进之处,对教学指导作用有限。故课堂评价应关注教师的教对学生的影响及影响背后的规律,关注学生在从事探索现象或解决问题的科学任务时,对学科核心思想与交叉概念的高水平思考及参与科学实践的程度。

经典小说推荐

杂志订阅