学评融合:人工智能时代的教育评价
作者: 张生 魏宁张生
北京师范大学教授,博士生导师,发起并创立了中国教育技术协会教育测量与评价专业委员会,任常务副会长兼秘书长。
主要从事社交网络与教育评价、信息技术应用于测评的全过程(数据收集、数据管理与分析、数据可视化)等方向的教学科研工作。主持国家、北京市、北京师范大学自主科研重点资助课题多项,作为主要研究人员参与国家863项目、国家社科基金重大招标项目、教育部重大委托项目等多项。在《中国教育报》《中国电化教育》《现代教育技术》等报纸杂志上,公开发表学术论文多篇,核心参与国家多项信息化标准的制定。
魏宁
北京市东城区教育科学研究院研修员,《中国信息技术教育》杂志特约撰稿人/专栏作者。
人工智能时代评价的理念创新
魏宁:2020年,中共中央、国务院印发了《深化新时代教育评价改革总体方案》,明确指出“教育评价事关教育发展方向”,要求“系统推进教育评价改革,充分发挥教育评价的指挥棒作用,努力培养担当民族复兴大任的时代新人,培养德智体美劳全面发展的社会主义建设者和接班人”。在二十大报告中,也明确提出了“深化教育领域综合改革,完善教育评价体系”的要求。
当前,在党的二十大报告对新时代新征程教育事业作出的战略谋划下,我国教育领域正在全力奋进。张教授,您如何看待新时代教育评价的重要意义?
张生:近年来,教育评价在教育改革中的导向作用愈加凸显,刚才你提到的《深化新时代教育评价改革总体方案》,对教育评价改革做出了顶层设计和具体部署,但改革的关键在于落实。特别是随着以互联网、大数据、人工智能为代表的现代信息技术的快速发展,评价手段更为丰富、多样,为评价改革带来了新的契机。当然,这也迫切需要我们加紧探索,对新时代的教育评价给出有力的回答。
魏宁:您提到了新技术发展对教育的冲击,我想这对于教育评价来说既是机遇,也是挑战。《深化新时代教育评价改革总体方案》中就特别指出,“创新评价工具,利用人工智能、大数据等现代信息技术,探索开展学生各年级学习情况全过程纵向评价、德智体美劳全要素横向评价。完善评价结果运用,综合发挥导向、鉴定、诊断、调控和改进作用”。您如何看待人工智能时代的教育评价?
张生:人工智能时代的教育评价改革呼唤理念与实践创新。实践创新的根源在于理念创新,没有先进的理念引领,实践难免落入窠臼。21世纪以来,随着心理与认知测量技术的发展,评价也从“为了结果的测量”转向“为了诊断和改进”,“以学习为中心”的评价理念逐步成为共识。但受制于学习环境与技术条件,“以评促学”在教育实践中仍然存在不少问题。
当前,教育已经进入人工智能时代,在物理世界与数字世界双重发展的基础上,深入研究教育评价的新理念、新方法和新技术并运用新模式,是促进教育评价改革的关键。
魏宁:在以往“以评促学”的实践中,存在哪些问题?我们应当怎样解决这些问题?
张生:首先,是评价与学习分离的问题。为了实现对学习过程与结果的精准判断,评价就必须与学习保持高度的同步性。例如,在学习进入新的阶段前,应尽快发现并改进上一阶段存在的错误概念,以免影响后续的学习,这也是形成性评价出现的主要动因之一。但目前的评价更多是外在于学习过程的活动,这就导致评价给学生和教师带来了额外的负担,如过于频繁的测试、学习过程中提交的文件和照片等记录性数据。这些都是评价与学习分离带来的问题。
其次,评价对学生认知的影响有限。这表现在:一方面,评价主要指向学习的行为与结果层面,评价指标中包含了大量的成绩、奖状、证书类的结果性指标;另一方面,仍有大量学习过程游离于评价之外,特别是一些涉及高阶思维、开放性和主观性强的问题。这些都让当前的评价对学生认知的影响有限。
再次,学生尚未成为评价活动的主体。评价的目的是提供学习反馈,反馈只有被学生使用,并为其所吸收,才能起到改进学习的作用。在传统评价中,学生只是被动地接受评价。随着评价理念从关注结果转向支持学习,学生的自评和互评才逐步进入教育工作者的视野。但总的来说,学生在评价中的参与度依然较低。
我们认为,解决上述问题的关键是让学习和评价真正融合起来,树立并践行学评融合的理念。评价不仅是对目标是否实现的判定,更要通过评价中涉及的发现、检验、反思、评论、参与等过程直接促进学生高阶思维的发展。学评融合超越了对知识技能的学习结果及学习过程的测量,指向了更深层次的支持学习的“元学习”,也就是“学会如何学习”。学评融合是对学习过程评价和学习结果评价的融合统一,通过将评估要素融入学习活动,不仅能真实地反映学业成就,优化学生的学习,还能进一步助力学生未来的学习,促进终身学习能力的提升。
魏宁:您刚才提到了要让学习与评价融合起来,对于学评融合这一理念,能否给出更详细的解读?它的概念和内涵是怎样的呢?
张生:我们认为,学评融合是基于数字世界的教育。当前,数字文明信息极大丰富,人才培养目标不断转变,基于评价过程和结果运用提升个人、群体思维和数据决策等高阶思维能力,是教育评价理念革新的关键。学评融合理念是统筹评价的学习性和诊断性为一体,强调以多种方式促进学生主动发展的一种评价新理念。它强调通过数字世界将评价融入到学生的学习活动过程中,鼓励人人展示分享成果、人人参与系列评价活动,基于评价过程与评价数据不断反思改进,促进学生自身核心素养的发展;通过数字世界记录的学习过程数据和评价过程数据,建立各种模型来计算学生认知、社会性、心理等多方面素养的发展,再以可理解的方式呈现出来。
魏宁:相对于传统的教育评价,学评融合有哪些鲜明的特征呢?
张生:学评融合的评价理念有别于传统的评价理念,它至少在五个方面表现出鲜明特征:
一是强调评价的学习性和诊断性的融合。这是学评融合理念的首要特征,指先发挥评价的学习性功能,再基于学习过程数据进行数据建模评价,这不同于传统意义上先诊断再改进的评价理念。它的评价流程更简捷,更能指向学生核心素养的发展。它强调依托数字世界,将评价中的各核心要素融入到学习活动中,以学生为主体,鼓励人人参与展示、人人参与对他人的评价,让每一位学生都能在评价活动中提升自己的核心素养,通过评价反馈改进学习。
二是强调评价过程是一种高阶思维的学习活动。学评融合强调学生在原有认知展示基础上,在阅读他人作品、评价并提出改进意见的过程中,思维再次得到升华,思维的深度与广度得以发展。这个过程既是总结他人优势与不足、加深对同伴认识的“知彼”过程,又是通过对他人作品进行评价,逐步认识事物的多面性,进而改进自己作品的“知己”过程,通过“知己知彼”的评价活动,发展核心素养,提升思维境界。
三是强调基于学习过程的诊断评价。学评融合通过物联网技术、大数据挖掘技术和智能决策与可视化技术,建立学生的认知发展、学业发展、社会性发展等不同方面的计算模型,以及一系列决策预警分析模型,并基于不同地域和群体特征构建不同的学习者特征模型,可以实现动态诊断、决策反馈。不仅能够呈现学生当前的发展状况,还能对未来的发展状况进行模拟推演,从而提早采取措施调整教育教学。
四是强调对数字世界的运用。学评融合一定是基于数字世界开展的评价,只有这样才能充分发挥数字世界展示、分享、交流、评价、自动计算、智能决策和可视化的优点。在人工智能时代,数字世界的时空泛在、物理世界的时空拓展,让人人展示、同伴评价、个人反思与改进可以常态化地开展,学评融合的高阶思维特点可以得到常态化的训练和发展。此外,数字世界能够大规模、常态化、个性化地进行数据分析,不仅能为个人提供有针对性的学习过程报告,提出有针对性的建议,助力个性化学习,还能支持科学管理与决策,及早发现区域性、群体性问题,进而大幅度、大规模提升教育教学质量。
五是强调保持学生的好奇心。这是学评融合最关键的特征,评价的目的是让学生体验自身的进步和成功,保持与生俱来的好奇心。在传统评价理念下,评价与学习分离,整个评价过程完全由教师主导,学生则是被动地接受评价,这扼杀了学生的好奇心。而在学评融合理念下,人人都能展示自己的优点和不同,也可以发现他人的优点和不同,进而对事物保有充分的好奇,营造出积极向上的育人氛围。
魏宁:在践行学评融合这一新的评价理念的过程中,新技术无疑将发挥重要的作用,可以说,学评融合的落地有赖于全新的数字化环境,您如何看待技术对学评融合的常态化、可持续开展的推动作用?
张生:新技术对学评融合理念的落实有着重要的推动作用,这主要表现在三个方面:
第一,技术可以有力推动学评融合的日常化。学评融合中关键的自评与互评环节,就有赖于信息技术对物理学习空间的时空拓展。将评价活动内置于学习平台中,一方面让评价成为师生的“规定动作”,使其养成评价的习惯,另一方面支持了教师和学生的多样化选择,为师生的日常应用创造了更好的条件。此外,学生还可以随时随地在平台上对自己或他人的学习情况进行回顾总结、评价反思,如在学习平台上撰写学习日记,针对不同学科的不同知识点或内容进行自我评价,以文字形式评价自己是否达到了阶段性的学习目标,分析自己在学习中付出的努力,对当前的学习结果进行归因并提出下一步改进策略,等等。同学之间也可以随时进行交流与互评。
第二,技术可以有力提升学评融合的认知品质。通过信息技术对时间和空间的延展,学生有机会从大量的同伴表现中汲取可借鉴之处,拓展自己的思路,加深对主题内容的理解,这为学生创造了多元的评价机会,成为提升认知品质的重要手段。此外,在运用评价标准和对评价标准的内化过程中,学生的评估素养和学习能力将同步得到提升。通过为教师提供的将评价标准内嵌于平台的功能,要求学生在评价过程中必须明确自己的评价依据了哪一条标准。还可以通过设置评语最少字数、监测评语内容与评价标准相关性等方式,减少随意评价,让评价过程及内容紧紧聚焦学生认知与元认知的发展。
第三,技术可以有力增强学评融合的参与性。围绕核心素养的学评融合,本质上是一种高阶思维的学习活动。同伴互评产生的质疑、争辩、论证等交互行为,不仅能促进学生的反思,而且能激发群体互动的氛围,使学生深度参与到学习和评价活动中来。因此,网络学习平台必须具备允许被评价者依据反馈对评价者做出回应和质疑的功能。因为,能够引发被评价者回应与讨论的评语往往是高质量的评语,支持对评语的再评价或反馈,是对提升评语质量的一种鼓励,是对发展学生高阶思维能力的促进,要鼓励学生给出切实、中肯、有针对性的评语。还可以创造更丰富、更具选择性的技术环境,如让学生自主选择评价对象或选择自己被哪些人评价,从而建立起学生对评价活动的积极预期,增加对学习及评价任务的认知和情感投入。
人工智能时代评价的实践形态
魏宁:通过您的描述,我们了解了学评融合理念下的教育评价的基本样貌,这种以数字世界的运用为基础的新型评价理念,在教学过程中是如何开展的呢?
张生:学评融合在实践中的运用,重点强调评价的学习功能和诊断功能。在实际操作中,评价作为一种高级思维的学习活动,包括生成与展示、参与评价活动、反思与改进三个核心阶段。
其中,学生思维的生成与作品的展示是学评融合理念落地的基础,它强调教师要利用数字世界重构育人环境,优化学与教的方式,强调学生从消费为主转变为生成为主,从而形成为了生成而消费的新型教与学方式。在学生生成的基础上开展人人展示,展示可以在物理世界中进行,但我们更强调的是让常态化展示和分享发生在数字世界中。
以人为核心开展自评或他评的学习活动是学评融合理念落地的关键,我们倡导跨学科的教研方式,核心就是评价一定要以人为出发点。不论自评还是他评,都是学生在主动参与评价,通过多种方式的评价,促使学生不再停留在原有的简单认知上,进而萌发出对事物更深层次的理解。
及时性和迭代性的反思与改进是学评融合质量的提升要求。不论是从评价还是从支持自我调节学习方面看,目前大多数的研究还未能聚焦反思阶段,而学生利用评价行为表现信息在反思阶段做出改进是至关重要的。在参与评价活动后,学生将发现很多相似或完全不一样的作品,从而拓展思考问题的角度和方式,以此为基础的反思和改进将是认知水平的又一次提升。