TIMSS-2023数学测评框架介绍及其对我国义务教育阶段数学教育评价的启示
作者: 魏亚琴 王靖雯 罗玛
摘 要:TIMSS-2023数学测评框架从内容维度和认知维度进行目标分析,主要指向评价学生对数学知识内容的掌握情况以及学生对解决数学问题的认知能力.其与《义务教育课程方案(2022年版)》以及《义务教育数学课程标准(2022年版)》的相关要求具有一致性.分析TIMSS-2023数学测评框架内容维度的主题构成、主题领域的分布比例以及认知维度的“知道”“应用”和“推理”三个领域,揭示其“框架趋于稳定”“全数字化测评”“重视问题解决”“探究性任务”等特点,可以为我国义务教育阶段数学教育评价中的评价任务设计、评价手段采用和评价质量提升等提供很好的启发与帮助.
关键词:TIMSS-2023数学测评框架;TIMSS-2019数学测评框架;数学教育评价
TIMSS (the Trends in International
Mathematics and Science Study) 是迄今为止国际上规模最大、持续时间最长的大规模数学和科学教育国际测评项目,由国际教育成就评价协会发起和组织.自1995年起,每4年进行一次,主要衡量四年级和八年级学生数学、科学两门学科的知识和能力.
《义务教育数学课程标准(2022年版)》(以下简称“《课程标准》”)在“评价建议”中专门增加了“学业水平考试”部分,对考试的性质和目的、命题原则、命题规划、试题命制都提出了清晰的要求. TIMSS作为国际范围内的大型测评项目,对数学教育及其评价具有举足轻重的影响.下面,笔者将2021年12月国际教育成就评价协会官网上最新公布的TIMSS-2023数学测评框架(以下简称“TIMSS-2023”),与TIMSS-2019数学测评框架(以下简称“TIMSS-2019”)进行对比分析,揭示其变化和主要特点,以期对我国数学教育评价有所启示.
一、TIMSS数学测评框架概述
为了探索不同国家地区教育系统中各相关因素对成绩的影响,TIMSS先在宏观上建构了“课程框架”,将“课程框架”划分为预期课程(对应社会文化背景)、实施课程(对应学校及社区背景)和实现课程(对应个人背景),然后利用这些课程共有的内容、表现期望和观点三部分,构成了TIMSS 数学测评最初的目标分析框架[1].从2003年开始,TIMSS数学测评的目标分析转变为内容维度和认知维度.其中,内容维度指向测评的主题领域,主要评价学生对数学知识内容的掌握情况;认知维度指向测评的思维过程,主要评价学生对解决数学问题的认知能力.
(一)内容维度
自TIMSS-2007数学测评框架起,内容维度开始根据学生年龄和经验的不同按照年级分开阐述,四年级和八年级的同一内容采用螺旋上升的方式展开,侧重点有所不同[2].各年级的内容维度都对数学评价的内容和范围进行了明确划分,不仅包含了多个主题领域,还将每个主题领域都细分成了若干主题.在构成上,各主题领域都有相应的占比.以下,笔者从内容维度中的主题构成和主题领域分布比例对TIMSS-2023展开叙述,并与TIMSS-2019进行对比分析.
1.内容维度的主题构成
TIMSS-2023内容维度的主题构成详见表1.其中,四年级的主题领域包括“数”“测量与几何”“数据”三部分,共含有七个主题;八年级的主题领域包括“数”“代数”“几何与测量”“数据与概率”四部分,共含有八个主题.四年级的“数”主题领域在八年级被拆分为“数”与“代数”两个主题领域.在小学阶段,“代数”虽不作为正式的课程内容来教学,但小学的“数”主题领域中已包含了如表达式、简易方程和数量关系等初步的代数概念,这实际上是在为将来正式学习代数思想奠定基础.此外,八年级一方面将四年级的“几何”与“测量”两个主题合并,将评价重点放在几何图形上,另一方面又将四年级中与数据相关的两个主题“阅读和呈现数据”“解释、合并和比较数据”合并为“数据”主题,体现了对学生良好数据分析意识的新要求.
从纵向年度来看,TIMSS-2023与TIMSS-2019在主题构成上几乎完全相同,仅在四年级“数据”主题领域的主题上有所不同,二者对比详见表2.由此可得,TIMSS-2019更侧重于评价学生对数据的应用能力,即学生能否从多种已知信息中运用数据解决问题,而TIMSS-2023则更侧重于评价学生对数据本身的处理能力.
此外,每个内容维度不仅包含多个主题,且每个主题又通过具体的目标作进一步的说明.以四年级的“数”主题领域为例,TIMSS-2023以五方面的评估目标对学生提出了相关要求,具体如下:(1)认识六位数的位值制,联系数的表示(文字、符号、数轴模型)比较数的大小;(2)加减法(最高到四位数相加减);
(3)乘法(最高到三位数乘一位数和两位数乘两位数)和除法(最高到三位数除以一位数);(4)解决包含奇偶数、因数与倍数、约数(最高到10的幂)或估算的问题;(5)合并含有两个以上共同性质的数或运算过程来解决问题.
2.主题领域的分布比例
在TIMSS-2023中,各年级内容维度的主题领域都有明确的占比分配:四年级中,“数”“测量与几何”“数据”主题领域占比分别为50%、30%和20%,八年级“数”“代数”“几何与测量”“数据与概率”主题领域占比分别为30%、30%、20%和20%.“数”主题领域在四年级占了一半的测评比重,是小学数学学习的基础,而“数”与“代数”主题领域在八年级的总比重为60%,由此可见,这一领域一直处于数学测评的核心位置.此外,与四年级相比,八年级中的“几何与测量”主题领域占比下降了10%,“数据与概率”主题领域占比不变,可见这两部分虽都是数学测评的重要组成部分,但其重要程度不及“数”与“代数”主题领域.
从纵向年度分析,TIMSS-2023与TIMSS-2019相比,在内容维度的主题领域占比上没有变化(详见表3),体现了一定的稳定性.
(二)认知维度
TIMSS-2023的认知维度由“知道”“应用”和“推理”三个领域构成,包括选择和实施步骤、应用知识解决问题、进行逻辑推理和解释假设等.第一层次“知道”,指学生需要知道的事实、概念和解决步骤;第二层次“应用”,关注学生应用知识和概念理解一系列数学情境的能力;第三层次“推理”,包含学生运用有逻辑、系统化的思考来产生和证明解决问题的方法,作类比并厘清数学对象之间的关系.这三个领域逐层递进,学生对数学知识的掌握程度以及对数学概念的理解水平,在一定程度上决定着其能否熟练地调用数学思维或在情境中推理论证.
1.知道
“知道”领域主要评价学生是否熟悉数学概念、掌握数学技能,以及能否熟练应用概念或技能解释数学情境.学生能回想起来的关联知识和概念越多,他们就越有可能顺利解决一系列数学问题.在TIMSS-2023中,认知维度的“知道”领域包括“回忆”“辨别”“排序”“计算”四个层级,对每个层级都结合相关内容给出了具体的描述.
与TIMSS-2019相比,TIMSS-2023“知道”领域由“回忆”“辨认”“提取”“分类/排序”“计算”“测量”六个层级减少到四个层级,详见表4.通过对各层级的具体描述,我们可以发现,TIMSS-2023有如下变化:其一,将“辨认”与“提取”两个层级合并为“辨别”层级,使该层级的描述更为简洁明了;其二,删去了“分类/排序”层级名称中的“分类”,同时在该层级的具体描述中增加了“排序”的新要求,可见测评重点更偏向于对各类数学研究对象进行有序整理;其三,删去了“测量”层级,一方面是因为“测量”层级可与“辨别”层级进一步合并,另一方面这体现了测评更强调运用工具或特定程序来解决整体问题,而不仅仅是解决个别问题.
2.应用
“应用”领域主要评价学生能否在一系列情境中应用数学知识.问题解决是这个领域的核心,学生需要选择合适的运算策略或工具来解决问题.许多以真实生活情境为背景的问题都需要学生先从数学的角度构想解决问题的思路,再实施解决方案.在这些问题中,学生需要应用事实、技巧和解题步骤等数学方法或相关概念去创造表征方式.观念表征是数学思考和交流的中心环节,而创造表征方式的能力是学生能否在数学学科取得成功的基石.TIMSS-2023认知维度的“应用”领域包括“规划”“实施”“表征”三个层级,对每个层级都结合相关内容给出了具体的描述,与TIMSS-2019的比较详见表5.
3.推理
“推理”领域主要评价学生观察推测及基于具体假设、法则进行逻辑演绎并证明结果合理性的能力.数学推理强调逻辑和系统化思考,包括学生运用解决问题的模型和规律进行直觉与归纳推理的过程.TIMSS-2023认知维度的“推理”领域包括“分析”“整合”“概括”“论证”四个层级,对各层级也依次有相应的具体描述.
与TIMSS-2019相比,TIMSS-2023“推理”领域删去了“评价”和“结论”两个层级,将“整合/综合”更改为“整合”,详见表6.如此,既使该领域的层级及描述变得简洁凝练,又强调对学生推理过程的考查.
二、TIMSS-2023的特点
通过以上对TIMSS-2023的分析及测评设计的梳理,笔者发现以TIMSS-2023为代表的最新国际数学测评具有以下特点.
(一)框架趋于稳定
自TIMSS-2007数学测评框架以来,TIMSS框架在内容维度和认知维度均保持了一定的稳定性,而将TIMSS-2023与TIMSS-2019纵向对比后可以发现,很多框架构成都趋于一致.在内容维度方面,四年级的主题领域均为“数”“测量与几何”“数据”三个领域,八年级则包含“数”“代数”“几何与测量”“数据与概率”四个领域,且近两次测评框架各领域的占比完全一致.这体现了数学测评在内容上对知识的连贯性和科学合理性的注重,以避免重复测评、测评内容太简单或过于繁难等现象的发生.在认知维度方面,虽然“知道”“应用”“推理”三大领域的占比也保持不变,但其具体行为表现一直在修订,强调准确刻画学生的思维特点和认知层次.这主要体现在层级数量与具体含义更为简洁清晰,层级呈现顺序更符合各认知领域的思维过程等方面.由此我们可以推断,测评的知识体系框架正逐渐完善.
(二)采用全数字化测评
不同于以往的纸笔测验,TIMSS-2023延续TIMSS-2019以来使用的计算机辅助测评技术,采取全数字化手段.基于信息技术优势,测评可以采用多种互动系统,增强利用数字环境吸引学生的功能,让学生积极参与互动.TIMSS-2023的重要目标是充分利用信息处理方式,组建一个包含新型优化处理方法的全数字化试题生成系统,并提高知识库容量.这能极大地革新测评项目的发展并影响当下的测评框架.全数字化测评可以实现如下功能:其一,通过线上测评系统中可交互的虚拟仿真品或工具,学生可以生动地感受数学模型的动态变化,发展直观想象能力;其二,通过将一些程序性和辅助性的运算任务转移给计算机,学生能更好地专注于对解题策略和数学问题的思考;其三,学生的作答过程能及时地反馈给大数据处理程序,这能帮助教育者更好地了解学生的问题解决策略、错误观念和应试手段;其四,数字化测评所带来的丰富多样的试题呈现与反馈形式能让学生更积极主动地参与测评.
(三)重视问题解决和探究性任务
以往的TIMSS数学测评框架对于是否要在真实情境中呈现试题没有作出明确要求.通常,每个内容维度中至少有一个主题会包含问题解决,也就是说,内容维度的一些试题会被放置在现实情境中.同时由于测评中的所有试题也会被认知维度的三大领域划分,因此在一个问题解决情境中有60%~65%的题目需要借助应用和推理等相关认知能力.而TIMSS-2023更加重视问题解决与探究性任务,突出考查在真实世界和实验室环境中调动已有知识和技能解决数学问题的能力.框架明确规定了每个内容维度的主题领域中大约有85%的测评题目要在问题解决的情境中进行.这与《课程标准》中首次提出“真实情境”,强调情境创设应多关注学生的生活现实,要求学生能够“在探索真实情境所蕴含的关系中,发现问题和提出问题,运用数学和其他学科的知识与方法分析问题和解决问题”相一致.此外,为了考查认知负荷可能产生的影响,框架中也有至少15%的题目是在没有问题背景的情况下呈现的.