教育数字化背景下信息技术与幼儿园课程整合的评价指标体系构建研究
作者: 于开莲 贾甜甜 吴红霞
【摘要】本研究综合运用文献分析法、访谈法、德尔菲法构建了信息技术与幼儿园课程整合的评价指标体系,包含信息技术本身的适宜性、信息技术使用的合理性、信息技术使用的有效性3个一级指标,以及9个二级指标和35个三级指标,并运用该评价指标体系对40次信息技术与幼儿园课程整合的集体教学活动进行评价。研究者基于研究结果提出改进建议。
【关键词】教育数字化;信息技术;幼儿园课程;课程整合;评价指标
【中图分类号】G610 【文献标识码】A 【文章编号】1004-4604(2024)7/8-0003-06
近些年,随着云计算、人工智能与区块链等新一代数字技术的发展与应用,以数字驱动变革与发展已经成为世界性的主题。〔1〕许多国家发布了一系列教育数字化发展战略与计划,全方位推动教育领域的数字化变革。在这样的教育数字化背景下,学前儿童作为“数字原住民”,接触和学习数字技术不可避免,学前教育领域的数字化应用也势不可当。有研究发现,实践中一些教师不考虑信息技术使用的必要性,在一些用传统教学方式就能够达成目标的教学环节或教学活动中,使用信息技术代替,取代幼儿的直接操作,非但没有达成活动目标,反而起到负面作用。〔2〕有学者指出,当前教育活动中信息技术使用频率过高、单次使用时间过长、教师过度依赖信息技术开展活动等现象,造成教育活动和游戏活动过程“电子化”,导致幼儿使用信息技术时间过长,在一定程度上影响幼儿的身心健康。〔3〕由此可以看出,信息技术在实践中的运用还存在诸多问题。本研究尝试建立科学的信息技术与幼儿园课程整合的评价指标体系,对幼儿园的信息技术运用、信息技术与幼儿园课程的整合情况进行评价与监督,以指引幼儿园有效筛选信息技术,合理运用信息技术,促进信息技术与幼儿园课程的有效整合,最终促进幼儿获得有益的学习经验。
一、信息技术与幼儿园课程整合评价指标体系的构建
本研究首先运用文献分析法和访谈法,进行评价指标体系的初步构建,之后运用德尔菲法开展专家咨询,请专家对各项指标的合理性和重要性程度进行筛选判读,再依据专家咨询结果修订评价指标体系,最后对评价指标体系的内容效度以及内部一致性信度进行检验,确立评价指标体系各项内容。
(一)初步构建评价指标体系
通过对已有文献和相关评价工具的分析,确定评价指标体系主要涉及信息技术使用的必要性、使用方式及其对幼儿学习的作用等方面。通过对北京市教育信息化融合应用示范基地园的园长、教师共10人的访谈,进一步了解一线实践工作者对评价指标的看法,最后将信息技术本身的适宜性、信息技术使用的必要性、信息技术使用的合理性和信息技术使用的有效性4个方面作为评价指标体系的一级指标,并参考相关文献,初步确定包含13个二级指标、77个三级指标的指标体系。
(二)评价指标修订
为了验证评价指标的科学性及可行性,本研究运用德尔菲法开展两轮专家咨询,判断各级指标的合理性及重要性程度,并在对咨询结果进行量化分析与质性分析后修改指标条目。研究共选取16名专家组成专家组。第一轮德尔菲咨询有13名专家给出了具体反馈,分别是高校教师9人,幼儿园管理者3人,一线骨干教师1人,其余3名专家仅提出了大方向的修改意见。第二轮德尔菲咨询16名专家全部给予反馈,分别是高校教师11人,幼儿园管理者4人,一线骨干教师1人。
质性分析是指请专家直接对各指标的合理性提出意见和修改建议。量化分析则主要通过对各指标的均值、满分频率、标准差和变异系数4个量化值的统计分析,使用界值法对评价指标进行删减。均值代表专家对指标的认可度。均值越高,代表专家对指标的认可度越高。满分频率是指给某一指标打满分的专家占比,可以作为均值的补充指标。标准差代表专家对某一指标的意见一致性程度,标准差越低,代表专家分歧越小。因为均值和标准差之间会存在不完全一致的现象,所以需要用变异系数进行判断。变异系数是标准差与均值的比值,反映专家对该指标评价的协调程度。变异系数越小,代表专家之间对该指标评价的协调程度越高。〔4〕通常认为变异系数应小于0.25,说明专家对该指标的评价趋于一致。在本研究中,各指标的满分均为5分,均值的临界值为4,即当指标的均值大于或等于4时,认为该指标达标。
界值法以界值作为删减的标准,通过对指标的重要性评分进行统计,按照定量的方法删减指标,在一定程度上提高了指标筛选的准确性。界值法要求研究者在筛选过程中选取2个重要的参考值:综合指数和标准值。综合指数(Y)的计算公式为:Y=M×K÷CV,其中M表示各指标的均值,K表示每项指标的满分频率,CV表示每项指标的变异系数。因为CV又是标准差与均值的比值,所以计算公式还可以写为:Y=M 2×K÷SD。标准值的计算公式为:Z=-ΣSD,其中表示综合指数的均值,ΣSD表示各项指标标准差之和。在此基础上,界值=综合指数-标准值。若指标的界值小于0,则应当删除。为防止有些重要性程度高的指标被误删,研究者会将界值小于0的指标与专家再次进行讨论,根据科学性、全面性、独立性和重要性原则进行最终取舍。〔5〕
1.第一轮专家意见征询
第一轮专家咨询结束后,研究者对专家提出的修改意见进行整理,发现专家大多认为评价指标体系较为全面地评价了信息技术与幼儿园课程的整合程度,一级指标的划分比较合理,但二、三级指标存在诸多问题,比如逻辑关系不清晰、指标内容重复、指标表述不严谨、指标可操作性欠缺等。
对第一轮专家咨询结果的数据进行分析显示,四个一级指标均值均高于4,变异系数小于0.25。进一步使用界值法计算发现,在一级指标中,“适宜性”(A1)和“必要性”(A2)的综合指数小于标准值62.17,界值小于0,符合删除标准。不过,研究者考虑到德尔菲法本质上是定性与定量相结合的研究方法,故在数据分析的基础上再次与专家面对面交流讨论并结合已有的研究结果进行对比分析,最终决定保留“适宜性”(A1)这一指标。“必要性”(A2)与二级指标中的“对活动目标的促进作用”(B13)的表述内容相似,都是评价信息技术使用对活动目标达成的影响程度,故将这两项内容进行整合,删除“必要性”(A2)这一指标。
在二级指标中,第一轮专家咨询结果显示,除了“教师指导的合理性”(B10)之外,其余二级指标均值均高于4,且变异系数小于0.25。进一步使用界值法计算发现,二级指标中的“其他教学方式不可替代”(B5,综合指数18.37)、“幼儿感兴趣程度”(B6,综合指数18.37)、“体现积极的互动”(B8,综合指数21.34)、“教师指导的合理性”(B10,综合指数5.24)的综合指数均小于标准值25.03。因为在一级指标的界值筛选过程中已经将“必要性”(A2)删除,所以将归属于这个一级指标的二级指标“其他教学方式不可替代”(B5)直接删除。“幼儿感兴趣程度”(B6)、“体现积极的互动”(B8)和“教师指导的合理性”(B10)都是“合理性”(A3)的二级指标,故结合专家意见,重新划分“合理性”(A3)的二级指标,从环境、教师和幼儿三个方面评估信息技术的合理性,使逻辑关系更加清晰。其中,将“教师使用信息技术的合理性”(B9)和“教师指导的合理性”(B10)合并为“教师指导合理”;将“幼儿感兴趣程度”(B6)与“体现积极的互动”(B8)合并为“幼儿表现积极投入”。修改后,这些指标在第二轮专家征询时均通过。
因为三级指标重要性程度的专家评分差异较大,不适用于界值筛选,且专家均提出详细修改意见,所以三级指标的修改主要结合专家的修改意见,并随着二级指标的删减整合适当调整内容。
2.第二轮专家意见征询
整理第二轮专家意见发现,各指标之间的逻辑关系问题不复存在,没有出现指标间内容重复的问题,各指标相互独立,但个别指标的表述仍需要进行修正。有专家指出,评价指标的表述需要修改,二级指标虽然具有一定的导向性,但不应带有价值判断,因此将“设计界面友好”改为“界面设计的年龄适宜性”,“内容呈现适宜”改为“内容呈现的适宜性”,其他二级指标同理。还有专家对个别指标提出修改意见,如有专家指出,因为幼儿认字不多,很少会根据信息技术界面上的文字进行操作,所以“页面设计简洁明了,画面文字不影响幼儿理解与操作”(C2)的提法不合理。研究者将其修改为“页面设计简洁明了,画面色彩丰富,搭配合理”(C2)。最终,专家对指标体系的意见趋于一致,均认为合理。
第二轮专家咨询与第一轮专家咨询步骤相同,结果显示3个一级指标中,“合理性”(A2)的综合指数为16.81,低于标准值28.77,符合删除标准。不过,研究者与专家讨论后认为教师及学生对信息技术的合理使用是评价的主要内容,因此决定保留这一指标。“设计界面友好”(B1,综合指数13.31)与“环境创设安全适宜”(B4,综合指数8.74)2个指标的综合指数低于标准值,结合专家的修改意见,改为“界面设计的年龄适宜性”(B1)和“技术环境创设的适宜性”(B4)。所有三级指标的综合指数均大于标准值,予以保留。
经过两轮专家咨询后,所有指标的均值均高于4,变异系数均小于0.25,表明指标项趋于合理,专家意见达成一致。最终,评价指标体系包含3个一级指标、9个二级指标和35个三级指标,具体见表1。
(三)信效度检验
1.专家效度
研究者通过计算专家积极系数、专家权威系数、专家意见集中程度和专家意见协调程度来检验评价指标体系的内容效度。共计发放专家咨询问卷16份。
专家积极系数一般通过专家咨询问卷的回收率和有效率进行衡量,两轮专家咨询问卷的回收率均为100%,第一轮问卷有效率81.25%,第二轮问卷有效率100%,表明专家对评价指标体系研制的关注度与参与度较高。
专家的权威程度通过专家权威系数来界定,一般认为专家权威系数大于0.7时,专家权威程度较高。本研究两轮专家咨询的专家权威系数均值均大于0.81,说明第一轮和第二轮所选取的专家权威程度较高,咨询结果具有较高的可信度。
专家意见集中程度是指所有专家对于某一指标重要性评判的集中程度和一致性程度,通常用均值、满分频率表示。第二轮咨询结果显示,所有指标的重要性程度均值均高于4,指标满分频率在0.5以上的占所有指标的85%,说明专家对大部分指标的重要性程度表示认可,评判趋于集中和一致。
专家意见协调程度用于衡量多名专家对于某一指标重要性评分的判断是否存在显著差异,通常用变异系数表示。第二轮专家咨询结果显示,所有指标变异系数均小于0.25,说明专家之间的判断较为一致。
2.内部一致性信度
为进一步检验各指标之间的一致性,研究者运用评价指标体系对40次信息技术与幼儿园课程整合的集体教学活动进行评价,计算克龙巴赫α系数,对指标信度进行检验。一般来说,克龙巴赫α系数在0.70—0.80之间说明信度较好。统计结果表明,评价指标体系总体的克龙巴赫α系数为0.95,各指标的克龙巴赫α系数均大于0.70。这说明评价指标体系信度较高,题项间的内容一致性较高。
二、信息技术与幼儿园课程整合评价指标体系的实践运用
本研究采用活动分析法,运用构建好的评价指标体系对信息技术与幼儿园课程整合情况进行评价。信息技术与幼儿园课程整合涉及信息技术在幼儿园生活活动、游戏活动以及集体教学活动等不同类型活动中的应用。本研究主要选取集体教学活动,共搜集了40次信息技术应用于幼儿园集体教学活动的视频,包括小班活动5次、中班活动4次、大班活动31次。具体活动领域涉及健康领域活动2次、语言领域活动8次、社会领域活动3次、科学(含数学)领域活动19次、艺术领域活动8次。
研究者将评价指标体系改编为五点观察量表,并制订操作细则,按照活动情况与指标描述的符合程度进行打分(从1分到5分,分别是“非常不符合”到“非常符合”)。研究者还邀请1名学前教育专业研究生了解评价指标的内容及评价打分程序,作为另一名评分者进行评价。评分者之间的斯皮尔曼相关系数为0.83,且p<0.01,表明评分者的评分一致性信度较好,评价结果可靠。