幼儿园综合课程实施背景下儿童发展评价指标体系的建构
作者: 章丽 夏萍萍 石慧
一、问题提出
综合课程深化改革与实施中希望根据"儿童学习"动态建构课程,这需要教师藉日常课程实施情境中观察评价儿童表现(不能依赖量表)调适课程和生成后续课程。因此,在课程实施中教师需要一套在本园综合课程框架与情境下建构起来的儿童发展参照指标体系。儿童发展评价是学前教育工作中的重点和难点,它是依据儿童教育目标以及与此相适应的儿童发展目标,运用教育评价的理论和方法对儿童身体、认知、品德与社会性等方面的发展进行价值判断的过程[]。2001年,教育部印发《幼儿园教育指导纲要(试行)》,强调学前儿童发展评价是了解教育适宜性、有效性,调整和改进教育工作,促进每一个儿童发展,提高教育质量的必要手段。随着时代发展,形成性评价的重要性日渐凸显。2020 年以来,中共中央、国务院与教育部相继发布《深化新时代教育评价改革总体方案》《中国儿童发展纲要(2021—2030年)》《幼儿园保育教育质量评估指南》等,明确要强化过程性评价,综合发挥评价的导向、鉴定、诊断、调控和改进作用。
建构清晰的评价指标体系,且转化为教师观察理解儿童行为的内在参照标准是评价实践的关键。1983年起,(下文简称“实幼”)率先在全国开展“幼儿园综合课程"改革,20世纪90年代从“动作与健康”“语言与认知”“情感与社会性”三大块面,自主建构“三原色”儿童素质发展目标。随着《3\~6岁儿童学习与发展指南》(下文简称"《指南》")的颁布,21世纪育人期待的更新,原有目标体系已无法满足当下园所儿童发展的需要,且大部分教师只是目标的执行者,对自上而下既定的目标体系理解和认同也存在困难,难以转化为科学评估儿童的内在标准。这是幼教界普遍存在的困境。教师评价时常常依据自身主观意识、经验、认知方式及期望等“另一套"经验化的、零散的标准开展评价[2,缺少对标符合实际情况的科学评价体系的意识,没有运用科学的评价工具,导致评价的片面与刻板[3]。
一些国家和地区已形成较成熟的目标体系。在教育理论方面,多元智能理论强调关注儿童多智能领域表现,尊重个体智能组合差异,实施持续动态评价[4]。全人教育理论主张从多维度综合评价儿童认知、情感、社交、品德[5]。主动学习、深度学习等多种教育理论,强调评价的过程性、情境性、个性化、动态性、整体性,要关注儿童主动活动与主动学习,注重让儿童在与周围环境互动的过程中构建知识]。在目标内容组织上,国际知名的学前儿童学习与发展评估工具COR,将目标分为学习品质,社会性和情感发展,身体发展和健康,语言、读写和交流,数学,创造性艺术,科学和技术,社会学习,英语语言学习9个维度,设8个连续发展水平层级,助力个性化教育干预7。《指南》从健康、语言、社会、科学、艺术等5个领域建构目标,针对不同年龄段提出发展期望。山西省幼儿教育中心研制的《3\~6岁儿童发展评估工具》(2016),从7个领域评估,将学习品质与数学领域单列[8]。
综上,当前国内外综合课程的目标评价指标体系包括了儿童全面发展,涵盖学习品质、个性与社会性、语言、健康与运动、艺术、数学、科学与技术等多方面。但还应考虑儿童发展的个性化、动态性、整体性,制定“去年龄化"的连续性发展水平等级体系。虽然幼教领域不乏评价指标,但是多自上而下制定,大多数一线教师作为执行者对目标的理解与内化存在困难。由此,组织全体教师参与目标体系重构,以期形成指向完整儿童发展的科学的发展目标及评价参照指标,从根源上解决教师目标理解的难点,支持教师将其转化为观察评价的内在视角。
二、形成性评价参照标准的建构方法及过程
(一)行动研究
从2019年9月起,实幼利用2年时间,组织全体教师协同反思,共研共建儿童形成性评价参照标准,即“五维”儿童素质发展目标,并持续通过实践来反哺参照标准的研制。目标建构采用U-G-S,即“大学-政府-中小学(university-govermment-school)”协同模式,在《幼儿园教育指导纲要(试行)》《指南》等国家纲领性文件引领下,汇聚高校专家智慧及一线教师实践智慧共研。
目标建构主要可划分为两个关键阶段:一是基于文献分析以及自身经验整合的评价参照标准框架搭建阶段。在此阶段,教师深入剖析相关领域文献资料,全面梳理并融合自身过往所积累的各类经验,搭建起一套相对完整且具有科学性的评价参照标准框架,目标框架下蕴含5大维度,14个子维度,36个关键经验,每条关键经验下进行发展目标描述。为了确保对目标理解的一致性,教师结合自身教学实践经历回溯到能体现目标的儿童学习与发展案例中,在36个关键经验下,描述发展目标发展进程中的3个台阶,每个台阶下又细化出若干条“典型表现”,增强教师对儿童学习与发展情境的敏感性。此外梳理出每条目标中儿童进阶的“发展脉络”,帮助教师明晰目标进阶的一般方向。
二是以真实情境中目标的使用状况以及结果反馈为重要依据的参照标准修正完善阶段。在这一阶段,教师以日常生活中儿童的真实表现和典型情境为依据,充分考量应用过程中所呈现出的种种表现以及所产生的各类结果,持续反思目标的全面性、科学性。这一阶段,主要通过教师日常观察实践、每周的班组评价例会、每两周一次的全园课程组教研三层次活动检验目标框架。在儿童学习和游戏的真实场景中,教师观察群体及个体儿童的行为表现,以初步搭建好的“五维”目标框架为参照,研判幼儿行为背后的学习与发展意义,以及框架是否能涵盖儿童发展的关键经验、表述是否适切,并依据这些反馈信息对目标框架进行修正与完善,使其能够更加契合实际需求,具备更高有效性。在这一阶段,针对教师在评估中出现的问题,按照个体教师—班组教师一全园教师的联动模式,在不同范围内协同审议,寻求解决策略,达成共识。同时,通过课程组教研观摩儿童活动现场,不同教师对同一情境下的儿童行为表现进行研讨,纠正评价感知中的认知偏差,并协同补充能体现目标的“评价案例”,帮助教师在生动、多样、复杂的教育情境中,达成对目标理解的具象化、准确化,使目标更具实操指导价值。
本文为全文原貌 未安装PDF浏览器用户请先下载安装
原版页码:xqjy20250408.pd原版全文
经过两轮的框架修正,实幼确定了综合课程目标体系的初步框架,形成了“学习品质与创造”“运动与健康”“语言与认知”"个性与社会性”“审美与表现"5大维度,下设14个子维度,36个关键经验的“五维”儿童素质发展目标体系,并且根据儿童在每一个关键经验上发展的方向与规律,在每一个具体目标下都设定了3个发展台阶(I、ⅡI、II),补充出“发展脉络”“典型表现”“评价案例”。
(二)德尔菲专家意见征询
德尔菲法(Delphimethod)又被称为"专家调查法”,被认为是一种可靠的定性研究方法,主要是指按一定的程序,采用匿名的方式收集专家意见,之后经研究者的客观分析,进行多轮征询和反馈,最终使专家意见逐渐趋于一致,从而得出科学合理的预期结果的方法。
在本研究当中,我们首先建构了形成性评价参照标准。在此基础上,采用德尔菲法对目标体系展开验证工作。以专家对该体系的认同度来反向证明评价参照标准的合理性,并依据反馈结果不断对参照标准进行修正。
1.意见征询对象
专家的选择直接关系到征询意见结果的科学性与准确性。在选择德尔菲专家时,需要考虑参与者的专业背景、工作经历、判断力等相关因素,参与者应该十分了解学前领域对儿童发展的评价,拥有自己的见解,或者是在儿童教育一线教学的教师,拥有进行儿童发展评价的能力9。综上,本研究将专业背景、工作经历、评价经验等作为专家选择的标准,兼顾理论与实践层面。征询结果分析显示,专家权威程度为 CR=0.85(>0.7) ,专家积极系数为 100% ,指标数据表明本研究的专家征询结果可靠,可继续开展后续分析。
对于德尔菲专家人数的选择,有学者指出:“专家人数过多,不利于数据分析和专家意见协调。”[0]当专家人数达到13及以上时,误差降幅不明显[]。因此,本研究采取非概率"主观抽样"的方法,从高校、教研机构、园所中邀请29位征询专家,他们主要从事学前教育、教师教育等学科专业研究(专家基本信息详见表1)。

2.征询问卷的编制
针对本研究的评价指标体系编制第一轮专家意见征询问卷,采用李克特五点计分法,具体为:“非常不重要"到“非常重要"五个等级,依次计1\~5分,得分越高表明指标在评价体系中的重要性越高。专家需要对各级指标的重要性、判断依据和对调查内容的熟悉程度按赋值标准进行打分。第一轮专家意见征询问卷以网络问卷形式发放。本轮共发放29份专家问卷,有效问卷29份,问卷的回收率和有效率均为 100% ,专家积极系数 p=100% ,指标数据表明专家组成员对本研究的参与积极性非常高。
在分析第一轮专家意见征询结果的基础上综合专家意见对初建指标进行修订,再编制第二轮专家意见征询问卷,对修订后的各级各项指标的“重要性”予以评定,第二轮专家意见征询问卷仍采用李克特五点计分法,分为"非常不重要"到"非常重要"五个等级,依次计1\~5分,得分越高表明指标在评价体系中的重要性越高。第二轮专家意见征询问卷再次以网络问卷形式发放。本轮共发放 29 份专家问卷,有效问卷29份,问卷的回收率和有效率均为 100% ,专家积极系数 p=100% ,指标数据表明第二轮专家组成员的参与积极性非常高。
3.意见征询情况(1)第一轮征询结果
通过分析第一轮回收的数据并根据专家修改意见对指标进行修订,以均值、差异系数和满分率为筛选、确定指标和标准的统计量。均值表示专家对该指标的认可程度,值越大认可程度越高;差异系数说明专家对该指标相对重要性的波动程度或者说是协调程度,值越小表明专家们的协调程度越高[2;满分率是对该指标完全认可的专家比例。首先是一级指标的征询结果分析与修订。从集中程度来看,5项一级指标的均值处于 4.75~5.00 之间,众数大于4.75,总平均值为4.66,大于4.50;从分散程度来看,5项一级指标的标准差处于0\~0.51之间,均小于标准数值1;从专家意见协调程度来看,变异系数处于0\~0.11之间,均小于标准数值0.25。“语言与认知”和"审美与表现"的满分率均为 79.31% “学习品质与创造"满分率为 93.1% ,“运动与健康"满分率为 100% ,“个性与社会性”的满分率为 89.66% ,由此可见,专家意见协调程度较高,保留所有一级指标,同时根据专家提出的修改建议对指标名称进行修改:将“运动与健康”修改为“健康与运动”,突出健康是幼儿发展的第一前提,是一切运动的最终旨归;将“语言与认知”修改为“认知与语言”,突出认知对儿童发展的重要作用,强调认知引领语言发展,语言促进认知提高。
其次是二级指标的征询结果分析与修订。数据显示,二级指标的平均值处于 4.66~4.97 之间,总平均值为4.796,大于4.50;从分散程度来看,14项二级指标的标准差处于 0.19~0.55 之间,均小于标准数值1;从专家意见协调程度来说,变异系数处于 0.04~0.12 之间,均小于标准数值0.25。二级指标的满意率大多都在 75% 以上,低于该数值的指标分别为"运动与健康"下的"动作发展”,满意率为 72.41% ,“审美与表现”下的“感受与欣赏”,满意率为 68.97% ,由此可见,专家意见协调程度较高,保留所有二级指标并根据专家修改意见将“认知与语言”下的指标顺序从“语言发展”“科学探究”“数学思考"调整为“科学探究”“数学思考”“语言发展”。
最后是三级指标的征询结果分析与修订,首先专家对“不在‘学习品质与创造'的二级指标中进行三级指标添加"的决定表示赞同,认同学习品质是高度概括且对各领域具有引领作用,认同学习品质不应该过于细碎导致与其他领域交叉,背离学习品质理念,因此三级指标共有36项。从数据的集中程度方面来看,三级指标的平均值处于4.31\~4.72之间,总平均值为4.56,大于4.50;从分散程度来看,36项三级指标的标准差处于0.8\~0.98之间,均小于标准数值1;从专家意见协调程度来说,变异系数处于0.17\~0.22之间,均小于标准数值0.25。36项三级指标的满分率均在 50% 以上,专家意见协调程度较高,保留所有三级指标,同时根据专家建议,将“健康与运动一生活习惯”下的“生活卫生”修改为“卫生习惯”,达到增强三级指标针对性的目的。
本文为全文原貌 未安装PDF浏览器用户请先下载安装
原版页码:xqjy20250408.pd原版全文