大数据驱动下大学英语教学模式与教学策略探讨
作者: 唐冬梅
[摘 要] 数字时代的到来为大学英语教学带来了重要的机遇,大数据及其分析技术与传统手段相结合将大力推动大学英语教学的发展。通过借助超星泛雅与雨课堂教学平台,构建了数据驱动的教学模式,其中各环节所产生的数据为教学研究全过程中的质量控制和客观公正的教学评价提供了数据支持。采用随机森林算法对学习成效影响因素进行了分析,为大学英语教学策略的研究提供了理论依据。实践表明,基于数据驱动的大学英语教学模式与教学策略能够显著提升教师的教学质量与学生的学习成效。
[关键词] 大学英语;数据驱动;数据挖掘;超星泛雅;雨课堂
[基金项目] 2019年度江苏省高等教育改革研究一般项目“三方协作构建大学英语第二课堂的实践研究——思政课程的角度”(2019JSJG340)
[作者简介] 唐冬梅(1981—),女,江苏连云港人,学士,江苏师范大学科文学院讲师,主要从事大学英语教学研究。
[中图分类号] G423.04 [文献标识码] A [文章编号] 1674-9324(2023)13-0000-04 [收稿日期] 2022-11-21
引言
上世纪下叶,传统模拟电子主导的技术逐渐被以数字电路为基础的新科技所取代,同时也拉开了数字时代的序幕。伴随数据存储、处理、分析体量的飞速增长,一个被称作大数据(Big Data)的时代已悄然而至。与通信、航天、商业、金融、国防等所有其它领域一样,在大学英语教学这个传统的领域中,数字科技正在掀起一场新的变革,涌现了一大批新平台和新手段[1]。2019年末的特殊事件的发生更是催生与汰选了一些优良的在线教学平台,如超星泛雅、雨课堂、钉钉、腾讯会议等[2]。此类在线教学平台的应用,一方面解决了各阶段学生可以足不出户就能学习的问题,同时也在诸多方面弥补了传统线下教学的“短板”。
然而,在这种新媒体大数据的时代背景下,如何兼百花之长,充分融合数字科技与传统教学的优势并没有得到深入的探讨。主要体现了两个方面的问题:一是在教学模式设计中,未全方位引入数据采集分析手段;二是尚未将数据挖掘等人工智能技术应用到教学策略的研究之中。基于此,本文将从数据驱动的教学模式设计和基于数据挖掘的教学策略研究两个方面进行探讨。
一、数据驱动的教学模式设计
各类在线教学平台的运行都是以数据的收集、传递、分析、报表为技术框架,教学过程中的全部信息都以数据库的形式加以管理[3]。以超星泛雅平台与雨课堂为例,预习视频的浏览量、课堂出勤与随堂测试结果、弹幕投稿的参与频度乃至课后作业和测验的统计都以表格形式存储在雨课堂的后台数据库中,从而在教学综合评价和课程总结中可以做到有迹可循、有据可查,保障评价的客观性与公正性,提高教学质量与效率。
下面以大学英语教学为例,基于超星泛雅和雨课堂在线教学平台探索数据驱动的教学模式,如图1所示。
该教学模式分为教学准备、教学过程、教学总结三个阶段。其中,教学准备包括前期准备和资源建设两个模块,教学过程分为课前、课中和课后三个环节,教学总结主要是基于教学数据的教学评价与总结报表。事实上,该模式下各环节的具体教学活动都需和在线教学平台的后台数据库持续地进行信息交换。以前期准备为例,该环节旨在对本轮教学对象进行调查研究,了解学生高考成绩、中学时代英语学习状况、存在的“短板”和未来的期许等,并根据调查结果对现有的教学内容进行适当的调整,甚至在需要的时候针对性的组织教学团队。前期准备环节中,数据驱动的具体形式为学生相关数据的采集和分析。例如,可通过主成分分析方法(Principal Component Analysis,PCA)对多数学生的英语学习障碍和大学阶段的目标期许进行分析。
该教学模式中教学过程的课前、课中与课后环节都是基于数据展开的。例如,通过超星泛雅平台可以在课前环节中布置预习视频,启发学生对下节课相关背景的了解和相关问题的思考,而每一个学生的浏览次数和时长都被平台记录了下来,成为教师全过程质量控制的重要“抓手”。再例如,基于雨课堂的课中环节中可以设计预习检查、复习检查和随堂测验等教学活动,从而科学有效地检查学生对上堂课知识的掌握情况和这堂课内容的预习情况,均布于课中时间的随堂测验更能够督促学生全神贯注,紧跟课堂节奏。相较于传统教学,学生课堂反应更积极,气氛更活跃,精神更集中,其原因正是学生明白每一项活动中每个人的表现都将以数据的形式存储下来,成为结课评价的客观依据。
教学总结是该教学模式的最后一个阶段,也是即成数据的综合分析阶段。通过对过程和结果数据的梳理归纳形成学习与教学评价报告[4]。以雨课堂为例,在课程结束时,学生的弹幕投稿、加分、不良标签、答题成绩、出勤情况等相关数据都被汇总于一张报表之中;同样,超星泛雅平台中预习视频的浏览量、课后作业与期中测验成绩、投票讨论等活动的参与度等数据也都收于后台数据。基于上述过程数据与结果数据的融合,即可对学生的学习成效进行客观、公正、有效的评价,生成学生学习评价报告。与此同时,同一课程组中不同教师的教学数据中还可提取相关信息用作教师评价的数据基础。
二、基于数据挖掘的教学策略研究
多种在线教学平台与社交媒体的广泛应用提供了海量的教学数据,不仅为教学管理、活动组织、总结评价提供了客观的依据,同时也可以通过对相关数据的挖掘获取有价值的信息,为研究教学策略提供数据支持,下面举例说明[5-6]。
近来,在大学英语的“教”与“学”中,部分师生有如下疑问或有待商榷的看法:(1)一些教师想知道进入大学阶段1到2年后学生的英语水平在多大程度上仍然受中学时期英语基础的影响,同时还想了解不同地域之间教育水平的差异是否还在影响着学生的英语成绩;(2)有的学生进入大学阶段后有一种观点,认为在大学英语的学习方面存在所谓的“瓶颈”或“天花板”,再努力也难见成效,这导致了他们消极懈怠的学习态度;(3)个别学生在观看英文电影的过程中,在一定程度上锻炼了听力,了解了英语国家的文化,也积累了一些口语化的词汇,从而坚定地认为观看英文电影基本可以替代常规的英语学习,故大幅减少了背单词、读课文等传统学习环节的时间。为了解决教师的上述疑问以及验证学生的这些看法,笔者通过腾讯共享文档于所在学院的大二学生中开展了一次小型调查活动,目的是研究大学英语考试成绩的综合影响因素,统计数据包括120名学生的性别(Gender)、年龄(Age)、省份(Province)、高考英语成绩(Score_of_college_admission_exam)、每日学习英语时间(Time_on_english_study)、是否晨读(Morning reading)、晨读时间(Morning_reading_time)、是否喜爱英语(Fond_of_english)、是否有学习规划(Having plan)、是否使用单词背诵APP(Using_words_reciting_app)、是否爱看英文电影(Like_watching_english_movies)、是否已通过英语四级(Passed_cet_4)、上学期期末英语成绩(Score_of_last_semester)等内容。采用随机森林(Random Forest)算法分别以是否已通过英语四级和上学期期末英语成绩为预测目标(Dependent),以其它数据为预测依据(Predictors)进行了分类与回归分析研究。
随机森林是在决策树(Decision Tree)算法的基础上发展起来的[7]。决策树是一种树状结构模型,包括根节点、分节点和叶节点。样本数据自根节点开始按照不同属性分类,不断在各个节点按照属性进行分类,形成新的分支,直至落入标明类别的叶节点中。随机森林,顾名思义,是很多决策树的有机组合,从原有样本数据中有放回地每次抽取相同数量的样本,由单一决策树进行个体分类。众多决策树形成了随机森林,通过投票表决形成最终的分类结果。本文中,随机森林的算法实现是在Statisitica 12.0中实现的。
首先进行以是否已通过大学英语四级(Passed_cet_4)作为预测目标的分类研究,生成了如图2所示的各属性重要度分级表。
从图2中可见,影响大学英语四级是否通过的因素中,前期基础占居首要位置,从很大程度上了说明了英语学习的长期性和连续性。其次,生源身份也是重要的影响因素,这表明不同地区之间的英语教学水平存在显著的差异,且仍然在影响着学生的英语成绩。高考英语成绩已成为历史,生源省份非个人随意能够选择,因此这两个因素对学生而言属于外在的客观因素,然而接下来的三个属性参数,即每日学习英语时间(Time_on_English_study)、是否晨读(Morning reading)、晨读时间(Morning_reading_time),不仅具有较高的重要度,而且完全可为学生的主观能动性所改变。相较而言,是否喜爱英语(Fond_of_English)、是否有学习规划(Having plan)、是否使用单词背诵APP(Using_words_reciting_app)、是否爱看英文电影(Like_watching_English_movies)等因素却并未如预期那样能够起到显著的推动作用。
通过对大学英语学习影响因素的分析,需要承认中学时期的英语基础与地域之间英语教育水平的差异对大学阶段英语学习的长期影响,但更应当看到通过充分发挥学生的主观能动性,在语言学习上投入更多的精力,那么最终英语综合水平的提高将是“水到渠成”的。同时,通过分析也可以发现一些本末倒置的做法是收效甚微的。比如,一些同学试图通过大量观看英文电影来代替常规的学习方式。参考上文图2的分析结果,是否喜爱观看英文电影这一因素对英语成绩的贡献度并不突出,以其作为了解英文国家文化的窗口、学习间隙的消遣和口语专项研习或许是适宜的选项,而让其占据英语学习时间的主体部分则并不可取。
如图3所示,在对近期英语考试成绩的回归研究中发现各因素的重要度排序与图2较为相近。高考英语成绩的历史因素和生源省份的地域因素在对近期英语成绩的影响中仍然占据首要位置。包括是否晨读、晨读时间、每日学习英语时间等在内的主观能动因素在对近期英语成绩的预测中的贡献度也较为显著。与对大学英语四级通过情况的分类研究不同,学生的性别因素稍显突出。这是由于进入大学阶段以来,相较男生而言,女生更能潜下心来投入到英语的学习中去。语言学习是一个漫长的过程,不会一蹴而就,因此具有沉稳淑静、孜孜以求特质的女生在大学英语学习阶段更易崭露头角。与图2类似,是否喜爱英语、是否喜爱观看英文电影、学生年龄、是否使用百词斩、墨墨背单词等App、是否有英语学习规划等因素也未如人们一贯认为的那样会显著的给大学英语的学习推波助澜。
通过对调查所获数据的上述分类与回归研究,彻底解决了部分教师先前的疑问,高考成绩的历史因素与教育水平差异的地域因素的影响依然存在,同时也证伪了部分学生选择“躺平”的理由与看电影可以代替日常学习的错误理念。基于数据挖掘所得的这些结论,可以在“教”与“学”的策略中做一些针对性的调整:(1)面对历史与地域因素,教师应因材施教,对相关学生进行专门指导,甚至特别选材;(2)让数据讲话,使学生明白大学英语的学习是一个渐进的过程,耕耘必有收获,鼓励且让他们相信只要足够努力,终将实现英语综合水平的提升;(3)承认观看英文电影等辅助学习方式的积极贡献的同时,也需要认清其局限性,不能本末倒置,让其在英语学习中挤占主导地位来躲避背单词、读课文等“痛苦”的环节,而只能将其定位为有益的学习辅助手段和时不时的休闲方式。
与此类似,通过对相关数据的“挖掘”还可以对其它因素与教学成效的相关性进行比较研究。例如常见的翻转式、启发式、满堂灌的教学方式对学生学习成效的不同贡献度,再如课堂上教师授课中英语与汉语的应用比例为多少更有利于学生英语水平的进步,活跃的与严肃的课堂氛围哪一种更好等等。基于数据挖掘将获得这些问题的科学解答,从而让教师能够对教学策略进一步优化。
结语
大数据的时代背景下,大学英语教育应与时俱进、顺势而为。本文借助超星泛雅、雨课堂等在线教学平台设计了数据驱动的大学英语教学模式,其中各环节所产生的数据为大学英语教学的全过程质量管理和教学评价提供了客观的数据支持。数据挖掘算法的运用便于教师从教学相关的大数据中提取有效信息,为教学策略的调整提供理论依据。将这种基于数据驱动的教学模式与教学策略应用于教学实践,显著提升了教学质量与学习成效。
参考文献
[1]唐冬梅.大学英语线上线下混合式教学中思想政治教育探索[J].教育教学论坛,2022(9):153-156.
[2]张健,刘飞.基于“泛雅”教学平台的“数值分析”混合式教学模式探索[J].中国建设教育,2019(6):6.
[3]张敏洁,杜化俊.混合式教学实施现状及研究趋势分析[J].中国教育信息化,2020(1):82-85.
[4]朱燕华,陈莉萍.大学英语智慧课堂教学评价指标体系构建[J].外语电化教学,2020(4):9.
[5]洪常春.人工智能时代大学英语生态教学模式构建研究[J].外语电化教学,2018(6):29-34.
[6]王哲,张跃.大数据方法与外语教学创新研究:以“2015年百万同题英文写作研究”为例[J].外语电化教学,2015(5):6.