基于大语言模型的职业院校区域间发展差异比较研究
作者: 文玉锋 周亚杰 李通
作者简介
文玉锋(1971- ),男,西北师范大学管理学院副教授,研究方向:数据分析与数据挖掘,情报分析(兰州,730070);周亚杰(2000- ),女,西北师范大学管理学院硕士研究生,研究方向:技术经济及管理;李通,西北师范大学管理学院
基金项目
甘肃省教育厅产业支撑计划项目“基于产教融合的‘大数据会计’专业特色及智慧平台建设研究”(2121CYZC-59),主持人:赵雪梅;甘肃省社科规划项目“渭河流域横向生态补偿政策绩效评估研究”(2021QN009),主持人:杨阳
摘 要 鉴于中国地域辽阔、经济发展不均衡的国情,识别职业教育在各地表现的差异性对于科学统筹全国职业教育的高质量发展意义重大。利用大语言模型ChatGPT,通过Python程序调用API,对北京市和甘肃省职业院校发布的质量年度报告进行本体关系构建,深入对比分析两地区在人才培养与产教融合方面发展的相似性与差异性。结果显示,北京市凭借其丰富的教育资源,更加注重教师团队、课程设置等关键资源的投入,以增强职业院校的建设水平和创新能力;而甘肃省则更加侧重于学生在校的学习质量保障,就业所需的实际技能,致力于培养适应当地社会经济发展需求的实践性人才。
关键词 大语言模型;职业教育;职业院校;区域发展差异;本体关系;知识图谱
中图分类号 G719.2 文献标识码 A 文章编号 1008-3219(2024)21-0023-06
对于一个国家或地区的持续发展而言,职业院校的竞争力对其整体实力的影响至关重要。我国非常重视职业教育的发展,不仅在法律层面颁布《中华人民共和国职业教育法》,而且在教育投入方面也给予了巨大支持。2023年现代职业教育质量提升计划资金预算下达312亿元,相较于上一年度增加了10亿元。这些举措共同促成了世界上规模最大的职业教育体系的成功构建,并显著提升了中国职业教育整体实力[1]。但是,我国区域发展的不均衡性影响了各地职业教育的资源配置,具体体现在政府扶持力度、行业指导深度、校企合作紧密度以及资源聚合效应等方面。特别是在中西部地区,由于经费紧张和企业发展滞后等限制因素,所需的配套教学设施、实习实训器材等难以全面到位,致使建设水平明显滞后于东部地区[2]。
为了探讨不同地区职业院校的发展现状,通过对比分析各地区职业院校公开发布的质量报告,利用大语言模型抽取质量报告文本内容的主体关系,揭示各院校在人才培养和产教融合方面的独特优势和策略差异。
一、研究设计
(一)样本数据的选取
鉴于全国数据规模的庞大性,本研究采用对比分析的方法,聚焦于具有代表性的地区进行深入探讨。在样本筛选过程中,严格剔除了质量报告不规范的语料,确保所选院校的质量报告具备高度的规范性和内容模块的统一性,以便于进行不同模块间的对比分析。数据选取了东部地区北京市18所院校的质量年报数据;西部地区选择甘肃省11所院校的质量年报数据。基于这些样本数据,进一步提取质量年报中关于人才培养和产教融合关键部分的内容,作为构建本体关系的语料基础。
(二)大语言模型框架
本研究选取全球大型语言模型的典范——ChatGPT作为本体关系构建的工具。由OpenAI开发的ChatGPT,依托先进的无监督学习技术,对海量文本数据进行深入分析,提炼出深层知识并掌握语言的规律。这使得ChatGPT能够准确识别和理解文本中的各类实体及其相互关系,从而生成自然、连贯且流畅的文本。在构建本体关系时,ChatGPT首先通过上下文分析和模式识别,识别出文本中的关键实体和概念,从而构建出结构化的本体关系。这一过程的自动化和高效性,使得ChatGPT在知识管理、信息检索和自然语言处理等领域中得到广泛应用。无论是构建知识图谱,还是进行复杂的语义搜索,ChatGPT都能显著提高工作的效率和准确性。
在自然语言的表达中,主谓宾结构占据着至关重要的地位,是语句构建的核心框架。主谓宾结构明确而精准地界定了语句中的三个关键元素:行为的执行者(主语),行为本身(谓语)以及行为作用的对象(宾语)。这种结构提供了一种清晰、直观的方式,来理解句子中各个部分如何相互作用,共同构建出一个完整且有意义的语句。
本文借助ChatGPT提取文本中的主谓宾结构,构建“主语—谓语—宾语”的本体关系三元组。通过在Python程序中调用大语言模型API的方式完成质量报告的本体关系构建。见表1。
(三)知识图谱
Neo4j是NoSQL图形数据库,凭借其独特的属性图模型和卓越的性能,成为处理复杂图形结构数据的首选工具。不同于传统的关系型数据库,Neo4j专注于存储和查询图形数据,灵活的图存储结构能有效存储和管理数据结构较为复杂、动态关系变化较快的海量数据,解决了关系型数据库在存储图结构数据时出现的空间浪费等问题[3]。
知识图谱的基本组成结构包括节点、关系和属性。在构建知识图谱时,利用Neo4j将大语言模型抽取的<subject>和<object>实体创建为对应的节点,同时为其添加`type`属性以区分主体和客体。<action>代表了主语和宾语之间的关系,通过创建表示关系的“Relationship”对象,将<subject>和<object>节点连接起来。
将质量报告中的大量文本内容通过大语言模型抽取的主谓宾三元组数据转换为Neo4j中的知识图谱。这可以直观地展示实体及其关系,使得复杂的数据结构化、可视化,更易于理解和分析。同时,通过Neo4j的图数据库技术,可以高效地执行复杂的查询和分析,快速发现数据中的潜在关系和模式,从而提升信息检索和决策支持能力。
(四)度中心性
在网络分析中,度中心性被确立为一项关键指标,用于精准地量化节点在网络结构中的重要性。具体而言,度中心性旨在刻画一个节点对其直接相连的其他节点所产生的影响力[4]。当某个节点在网络中拥有更为密集的直接连接关系时,其度中心性的值便会相应提升,这一提升直接反映了该节点在整个网络体系中的核心地位与重要性。换言之,节点的度中心性越高,意味着该节点在网络中扮演着更为关键的角色,其影响力及信息传递能力也更为显著。
二、结果分析
(一)人才培养分析
1.度中心性分析
经过对北京市与甘肃省职业院校质量报告中人才培养部分的内容进行分析,可以清晰地观察到两者在度中心性排名前列的关键词存在较明显的差异,见表2。这种差异不仅凸显了地域发展不均衡的现状,也揭示了两者在职业教育发展道路上各自独特的策略与侧重点。
北京市是我国的政治、经济、文化中心,地处科技发达的东部地区,其职业院校的发展策略倾向于全面且深入的体系建设。在此背景下,“教师”与“课程”在排名中占据核心地位,彰显了北京市在人才培养中对教师队伍建设和课程体系完善的重视。同时,“专业群”“专业建设”及“课程建设”的显著地位,体现了北京市对专业深度与广度的关注,以及对专业课程持续探索、完善与优化的决心。这不仅为北京市的教育质量提升提供了坚实支撑,也为其他地区提供了宝贵的建设经验。此外,北京市的职业院校还积极投入资源,建设丰富的资源库,以拓宽学生的知识面,增强其实践能力。
而甘肃省在度中心性分析中,“活动”与“校园文化”成为人才培养的关键要素,这表明其更加注重学生实践能力和综合素质的培养。通过积极向上的校园文化,熏陶和提升学生的素质。同时,“社团思想建设”与“思政理论学习”的强调,显示了甘肃省对学生思想文化教育的重视,旨在培养学生的社会责任感和团队协作能力。
对比两者,可以明显看出两个地区在教育资源和策略上的差异。北京市凭借丰富的教育资源,更加注重教师、课程和资源的整合,以探索和完善职业教育的发展路径,把握职业教育的核心要点。而甘肃省则更加侧重于学生的实践能力培养,致力于培养适应当地社会经济发展需求的实践性人才。
2.本体关系分析
本文利用ChatGPT大语言模型,从相关人才培养的文本语料中,精准地抽取并构建出以“主谓宾”结构为基础的本体关系三元组。经过数据处理,成功构建了共计7345条关系数据,这些关系数据各自独立,共同构成了7345个独特的本体关系网络。由于篇幅所限,本文仅展示其中的5条作为示例,见表3。
尽管这5条三元组数据均围绕着“育人”这一核心主题展开,但所呈现的主体与关系却各不相同。从学院的宏观角度出发,构建了与新时代相匹配的人才培养体系;而从学院团委的层面来看,则致力于打造一个全新的文化育人阵地,以丰富和深化学生的文化素养。在专业群层面,力求探索出一种综合性的育人模式,以满足多元化的人才发展需求。在制定人才培养方案时,严格依据国家的相关政策文件、专业标准以及专业简介,确保方案的科学性和有效性。另外,在校史馆这一特殊的文化空间中,充分发挥其独特的育人功能,让每一位学生都能从校史中汲取智慧与力量,实现个人与学校的共同成长。
3.知识图谱分析
(1)北京市
根据度中心性数据,可以清晰地观察到北京市职业院校对教材发展的高度重视。在构建的知识图谱中,由于数据量较大,图谱不易看清,如图1所示,则选择性地聚焦于教材的部分知识图谱中,见图2。
从学院主体出发,北京市职业院校积极鼓励教师开展教材研究与创新工作,旨在推动教材建设的持续迭代与品质提升。这些院校不仅组织国家规划教材的建设、遴选与推荐,还不断修订教材管理办法,确保教材内容的前沿性和实用性。此外,北京市职业院校还致力于一体化开展课程、教材和专业建设,推动教育体系的整体优化。
在教材形式方面,北京市职业院校也展现出了创新精神,推行了活页式、工作手册式、融媒体教材等多种新型教材形式。这些创新不仅丰富了教材的表现形式,也提高了学生的学习兴趣和学习效果。另外,这些院校的教材建设工作取得了显著成果,有多部教材入选了国家职业教育优质教材,并成为了教育部首批“十四五”职业教育国家规划教材书目,充分证明了其在教材建设方面的卓越成就。
(2)甘肃省
根据度中心性数据,可以观察到甘肃省职业院校对开展活动的高度重视。
甘肃职业院校致力于塑造青年志愿者服务活动的品牌效应,通过一系列精心策划的活动,弘扬和传承优秀的文化精神。如图3所示,这些活动包括“铁山精神”的传承教育活动,弘扬坚忍不拔的奋斗精神;“礼敬中华优秀传统文化”系列宣传教育活动,强调对传统文化的尊重与传承;“最美人间四月天,青春读书正当时”大学生读书月活动,鼓励学生通过阅读提升自我;“职教生心中的二十大”活动、“悦读伴我成长”职教学生读党报活动,引导学生关注国家大政方针,培养学生的政治敏感度和社会责任感;“一校一品”传承红色基因创建活动,打造具有学校特色的红色文化教育品牌。
此外,学校还举办了“云上活动周”“线上逛校园”“网上开放日”等线上活动,将文化育人的理念融入空间、活动和平台等多个载体。学校精心策划并开展各类活动,旨在通过文化熏陶和实践体验,全面培养学生积极向上的品质,增强他们的社会责任感和历史使命感。
(二)产教融合分析
1.度中心性分析
如表4所示,对北京市与甘肃省在产教融合领域关键词汇的度中心性进行排名发现,两者在多个方面既呈现出显著的共性,也存在一定的差异。首先,共性体现在双方均高度强调“校企”合作的重要性。作为产教融合的核心要素,校企合作关系的构建对于推动职业院校与产业发展紧密结合具有不可替代的作用。无论地域发展水平如何,加强校企合作始终是推动职业教育与产业发展深度融合的关键路径。
此外,“实践”作为另一共性词汇,在两地均得到了充分体现。北京市与甘肃省均致力于构建一系列实训基地和实践中心,为学生提供一个将理论知识转化为实际操作的重要平台。这样的举措有助于提高学生的实践能力,为他们未来的职业发展奠定坚实基础。
在共性之外,两地也存在一定的差异。北京市在注重校企合作和实践的基础上,更加注重人才培养模式的创新。通过不断优化人才培养方案,提高学生的职业技能和就业竞争力,为学生未来的职业发展创造更多可能性。同时,北京市还积极扩充院校的行业资源,为学生提供更加多元的就业机会。