职业教育数字化成熟度的价值审视与模型构建
作者: 张栋科 郑子艳
摘 要 职业教育数字化成熟度是指职业教育数字化转型的完成度和实现度,能够从动态视角表征职业教育数字化转型的进程。职业教育数字化成熟度模型是职业教育数字化成熟度评估的基础性工具,能够为具体评估指标体系构建提供依据。研究利用基于词对的BTM主题模型,分析职业教育数字化成熟度文本语料库,得到战略规划、数字设施、数字应用、教学变革、数据治理等五个职业教育数字化模型的要素主题,进而尝试构建包含成熟度等级、成熟度框架和成熟度工具在内的职业教育数字化成熟度模型,以期为职业教育数字化转型进程评估提供参考。
关键词 职业教育数字化;成熟度;价值;模型
中图分类号 G719.2 文献标识码 A 文章编号 1008-3219(2024)31-0047-08
当前,教育数字化转型已经成为世界各国教育变革的实践焦点与未来路向。2022年全国教育工作会议明确提出实施教育数字化战略行动,推动实现教育数字化转型。同年,教育部职业教育与成人教育司在其年度工作要点中明确指出,要大力推进职业教育与继续教育数字化升级,促进职业教育高质量发展。职业教育数字化转型作为国家教育数字化战略的组成部分,既是数字中国战略下产业数字化转型发展的迫切需要,也是教育强国战略下职业教育高质量发展的必然要求。职业教育数字化成熟度能够从动态视角表征职业教育数字化转型的进程,因此如何构建职业教育数字化成熟度模型,已成为研判转型现状、规划转型路径和提高转型效益进程中亟待解决的热点和难点问题。综上,本研究基于词对主题模型(Biterm Topic Model,BTM)分析当前涉及职业教育数字化转型的相关政策、文献和报道,尝试构建职业教育数字化成熟度模型,进而为职业教育数字化转型实践提供参考。
一、职业教育数字化成熟度内涵解析及价值审视
在职业教育数字化转型的时代背景下,数字技术成为职业教育持续发展的内驱力,不断推动职业教育治理方式、运行机理、育人模式等产生深层次、系统性变革[1]。职业教育因其具有教育与产业场域叠加的“跨界”属性,使得职业教育数字化转型成为产业和教育领域变革协同驱动的结果[2],这种协同不仅体现在宏观的政策导向上,也深入到微观的教育实践中,即体现在职业教育数字化转型的实践场域中。职业教育数字化成熟度能够代表职业教育组织数字化转型实践的进程。基于此,本研究解析职业教育数字化成熟度的内涵,从制度同构理论、文化堕距理论和限制因子定律三个视角,审视职业教育数字化成熟度的应用价值。
(一)职业教育数字化成熟度的内涵解析
成熟度最初是一个生态学概念,用于说明自然生态系统从早期到成熟阶段的发展状态[3],现被逐渐应用到多个学科领域,泛指“完美或者准备就绪的状态”[4],并蕴含了主体与环境不断相互作用的适变性、阶段性、内驱性、柔韧性与差异性。近年来,数字化成熟度的相关概念逐渐确立,从组成内容的视角,数字化成熟度是组织在数字化转型中获得产品、服务、技能以及掌握变革过程的能力[5];从类型差异的视角,数字化成熟度分为数字化就绪度和数字化强度两个维度[6];从时序演进的视角,数字化成熟度是一个动态的概念,需要采用持续发展的视角伴随时间推移对组织的数字化进程进行动态评估[7]。数字化成熟度最先应用在计算机科学领域,用于衡量软件过程能力,并逐步拓展到教育领域,用于评估教育数字化转型的具体进程。职业教育数字化转型是在职业教育领域全面应用数字技术,以价值转型为导向、数据要素为驱动,实现系统变革的持续创新过程,旨在推动职业教育的高质量发展和现代化进程[8][9]。因此,职业教育数字化成熟度即职业教育数字化转型的完成度和实现度,能够从动态视角表征职业教育数字化转型的进程。
(二)职业教育数字化成熟度的价值审视
1.标识职业教育数字化转型行动变量
在数字经济背景下,职业教育通过数字化转型来提高技术技能人才的培养质量,进而提升在数字社会中的适应性。职业教育数字化转型的本质是职业教育生态系统重构,归根结底是制度变革[10]。制度环境持续影响着职业教育数字化成熟度,表现为来自制度的强制压力、规范压力和模仿性压力[11]。这些压力源于政府对数字化职业教育的规划、市场对职业教育规范的制约以及不同职业教育组织的模范效应。职业教育数字化转型是在这三种压力机制下实现自身的发展变革,而数字化成熟度则是标识职业教育数字化演进的过程变量。职业教育需充分认识外部制度压力及其指向要素,并将外部压力指向要素转化为转型行动变量,通过构建数字化成熟度评估模型,研判数字化转型行动变量发展现状,推动职业教育数字化转型进程,最终促进职业教育高质量发展。
2.建构职业教育数字化转型融合理念
在职业教育数字化转型过程中,人工智能、大数据、虚拟现实等数字技术迅猛发展并逐步应用到职业教育领域中,通过开发基于数字技术的数字学习工具来为学习者提供个性化、多元化的学习方式。然而,与新的学习方式相适应的职业教育教学理念、教学方式等教育文化集丛范畴中的要素变革还处于某种程度的滞后状态,即职业教育领域的文化堕距现象[12]。文化堕距影响学习者的数字化学习程度,制约职业教育数字化的发展进程。为了有效推进职业教育数字化转型进程,须注重与传统教育理念及方式的融合衔接,以实现数字化教育与传统教育理念的有机融合。
3.识别职业教育数字化转型限制因子
生态系统中生物的生存和繁衍依赖于各种生态因子的综合作用,其中的一种或少数几种因子是限制生物生存和发展的关键性因子,即限制因子,或称主导因子[13]。在职业教育数字化转型进程中,其数字化成熟度受到多方面因素的影响,其中任何一个或多个因素都可能成为限制因子,如资金投入不足、技术人才缺乏、数字化资源不足、数字化应用场景不够丰富等都可能限制职业教育数字化的发展。因此,要识别职业教育数字化转型现状与理想状态的偏差,第一步就是正确分解构成职业教育数字化转型的生态因子,即关键领域,进而识别构建职业教育数字化成熟度模型的限制因子。针对识别出的限制因子,制定相应的策略,并在实施应对策略的过程中,对职业教育数字化进行监测与评估,判断应对策略是否有效,及时发现新的限制因子,动态调整职业教育数字化转型步向,从而保持职业教育数字化的生态平衡。
二、职业教育数字化成熟度模型的要素分析
职业教育数字化成熟度模型是评估职业教育数字化成熟度的工具,具有基础性和引导性,能够为评估指标体系构建提供依据。构建职业教育数字化成熟度模型,首先要确定职业教育数字化转型的实践场域,理清筛选模型构成要素的逻辑遵循。职业教育数字化成熟度的三重应用价值,分别指向职业教育数字化转型的“信息社会”“职业教育”“数字技术”等属性。信息社会属性是指职业教育与社会生产劳动紧密联系,持续为社会提供具备数字素养的实用人才,以及在人才培养中形成的思维方式、价值观念等精神和文化产品;职业教育属性是内在的价值主张,即技术和数据双轮驱动教育流程重塑,生成职业教育新范式;数字技术是外显的技术存在,即技术如何促进职业教育数字化发展。基于此,本研究确定了职业教育数字化转型的实践场域,搭建了职业教育数字化成熟度的模型要素筛选逻辑框架,选取官方网站上总领性陈述的相关政策文件,从文献库中筛选关于职业教育数字化转型具体实践路径的期刊文献及职业教育数字化转型重点领域的权威报道,形成语料库,以便进一步挖掘和提取职业教育数字化成熟度的模型要素,见图1。
(一)职业教育数字化成熟度模型要素分析方法
在自然语言处理中,主题模型常用来解决语义分析和文本挖掘问题,如按主题对文本进行收集、分类和降维。Blei等于2003年提出的隐含狄利克雷分布模型(Latent Dirichlet Allocation,LDA),是目前最常用的主题模型[14]。然而,当文本文档较短时,LDA由于较少的词语数量和上下文的限制,在进行单词主题分配时,数据维度容易大于数据样本量造成数据稀疏问题,从而影响主题预测的准确率。为解决以LDA为代表的传统主题模型对短文本内容分析适配性不足的问题,Yan等于2013年创造性提出了词对主题模型(Biterm Topic Model,BTM)[15]。BTM克服了LDA的数据稀疏性问题,其核心思想在于并非单独分析每个短文本,而是基于整个语料库中聚集的文本信息来生成词对,即将语料库中两个临近出现且具有语义关联的有意义词语组成一对共现词对,记作b=(w_i,w_j),进而以词对来挖掘短文本的主题。这种方式不仅保持了词汇间的关联性,还可以捕获多个主题的梯度变化,挖掘普通文本时的效果也优于LDA,见图2。基于此,本研究选择BTM模型对职业教育数字化成熟度的模型要素作进一步主题分析。
(二)职业教育数字化成熟度模型要素分析过程
根据职业教育数字化转型实践领域的离散性特点,结合BTM数据挖掘和文本共现网络数据可视化的优势,本研究设计了基于BTM的研究框架,共分为数据收集、数据预处理、主题聚类与识别、主题可视化与编码四个研究步骤,见图4。首先,从官方网站、权威媒体和文献库中搜索并筛选与职业教育数字化“信息社会”“教育本质”“数字技术”等基本属性相关的表述形成原始语料库。其次,在python开发环境中使用jieba分词库、正则表达式等对实验语料库进行数据预处理,并去除停用词和实验文本噪声。再次,进行BTM主题建模,利用困惑度确定最优主题个数,并获得“主题—词”概率分布和所有主题概率分布。最后,绘制最优“主题—主题”间距离图进行主题可视化,基于语料库中前200个高频词构建文本共现网络语义图,结合主题关键词及文本共现网络进行主题人工编码。
以“职业教育”“信息化”“数字化”等组合为关键词,在教育部官方网站进行高级检索,检索结果涉及155条政策结果,通过人工筛选后,得到87条有效政策文本,随后又在文献库和权威媒体搜索职业教育数字化的相关案例,得到34篇文献和38条权威报道,进而形成共计159份案例的原始语料库。原始语料库经进一步清洗去除相关性较低的文本数据后,得到33篇文献数据、78条官方网站数据、31条权威媒体数据,形成共计142份文本数据的实验语料库。数据收集过程见图5。
在模型初始化时,BTM主题模型的参数可以根据经验进行设置,将α设为50/K,β设为0.01,迭代次数为1000,预设主题数量K为6,并抽取每个主题下概率最大的前25个词语。随后将预处理后的数据集输入BTM模型中,运行程序进行主题学习训练。模型训练完成后,调用困惑度计算函数,将数据拆分为训练集和测试集来衡量模型拟合程度,分别计算1~8共8个模型的困惑度,以期直观反映BTM主题模型的泛化能力,一般来说更好的模型具有更低的困惑度。困惑度实验结果如图6所示,随着主题数增加,困惑度一直降低,当主题数为5时,主题—困惑度得分处于最小值并达到拐点。
将BTM结果作为输入,借助python的pyLDAvis包绘制交互式的教育数字化转型主题聚类结果可视化图谱,见图5。pyLDAvis是python中对主题模型算法进行可视化的模块,将主题以气泡图的形式可视化,气泡的大小代表主题出现的频率,不同气泡间的距离远近表达了多维空间映射到二维空间的主题之间接近程度。气泡距离采用的是JS散度(Jensen-Shannon Divergence,JSD),用来度量两个概率分布的相似度,体现了主题间的差异度。需要说明的是,气泡重叠表明这两个主题里的特征词有交叉。
从图7、图8两个不同主题数可视化结果图对比可以看出,当主题数为5时不同主题所代表的气泡略大于主题数为6的主题气泡,即将聚类主题数设为5时,各个主题出现频率均较高,且主题气泡间距离较远、主题间的特征词较少交叉。综合主题困惑度得分和主题可视化结果最终确定主题数K=5。
(三)职业教育数字化成熟度模型要素分析结果
由于BTM主题聚类后的关键词均为离散状态,可读性较差。为探寻每个主题所表达的意思,本研究针对实验语料库前200个高频词作进一步的语义网络分析,构建不同词语之间的共现网络关系图。模块化数据后可以看出聚类主题数为5,与BTM主题模型聚类最优主题数相同,不同主题根据模块化信息设置不同颜色,调整节点布局后得到关键词共现网络关系图,见图9。