在线互联网课程平台模式下的知识图谱建设初探
作者: 陈羽 刘志明 王斌杰
[摘 要] 随着信息时代的发展,教育行业中的线上课程平台大量诞生,知识图谱从一种信息手段逐步融入教育教学中。以国家级一流课程“轨道车辆装备”课程为例,探索了在线上课程平台模式下,通过学校和互联网企业合作开发建设课程知识图谱的路径及方法,并针对建设过程中遇到的问题提出了经验和建议,探索了在线上线下混合式教学中采用知识图谱引导学生学习的有效途径,取得了较好的建设成果,是在新时代背景下利用知识图谱开展新型教学模式的有益探索,有助于在新工科人才培养过程中实现新突破。
[关键词] 知识图谱;大学教学;在线课程
[基金项目] 2023年度北京交通大学虚拟教研室建设项目“车辆工程专业(轨道车辆智能运维方向)虚拟教研室建设”(275206529025)
[作者简介] 陈 羽(1987—),男,山西太原人,硕士,北京交通大学机械与电子控制工程学院实验师,主要从事高速列车虚拟仿真技术研究;刘志明(1966—),男,江西南昌人,博士,北京交通大学机械与电子控制工程学院教授,博士生导师,主要从事结构疲劳可靠性研究;王斌杰(1979—),男,山西交城人,博士,北京交通大学机械与电子控制工程学院教授,博士生导师,主要从事结构载荷谱研究。
引言
当代大学生成长于互联网时代,获取知识的途径更加多样化。特别是进入移动互联网时代和信息流时代以后,碎片化时间和碎片化信息成为学生获取知识的重要手段[1]。大学生更倾向于碎片化学习,在这种学习方式下,大学生可以在生活中随心、随时、随地通过手机、电脑等多种终端,借助多种媒体对知识进行片段化的消化吸收。学习方式的变化对于教师和学生来说都是新的挑战。一方面,在互联网海量的信息知识的冲击之下,大学课程知识具有体系性、连贯性、严谨性和学术性的特点,教师须要对学生自主学习的内容和过程加以引导;另一方面,碎片化的学习方式占据了学生更多的业余时间,增大了学生的学习投入,对学生的自律性和主动性提出了更高的要求。
自我国高等教育开始MOOC建设以来,已有一大批线上课程平台发展成熟,大量商业资本纷纷涌入。特别是在2020—2022年期间,各个平台的用户数和活跃度都有了飞跃式的增长。线上课程平台主要分为以下几类。
(一)开放式在线平台(MOOC类)
MOOC平台的最大特点是开放和自主,面向全社会。主要平台有中国大学MOOC、iLAB-X实验空间、清华学堂在线、edX、网易公开课、人民网公开课等。
(二)校内线上平台(SPOC类)
SPOC平台面向校内或跨校选课学生,主要平台为各个高校与公司合作建设的线上教学直播平台。
(三)商业课程平台
商业课程平台大多数为收费平台,一般由商业公司建设,主要有考研类、外语类、职业资格类、IT技能类、中小学类网课,商业课程平台根据培训领域不同有非常多的种类,知名平台有新东方在线、学而思、沪江网校等。
2019年,教育部开始推进实施一流本科课程建设[2]。随着高等学习教育教学改革的深化,广大教育工作者和一线教师总结思考长期以来在传统知识体系和传统课堂,向学生传授知识过程中出现的局限和弊端,掀起了高等教育课程建设改革的新高潮。本文以国家级一流课程“轨道车辆装备”为例,探索了在线上课程平台模式下,开发建设课程知识图谱的路径和方法,以及在线上线下混合教学中用知识图谱引导学生学习的尝试,取得了较好的建设成果。
一、知识图谱的结构
知识图谱的概念由谷歌提出,最早用于优化其搜索引擎算法,将知识点以关系的方式彼此连接,形成网状的结构[3-4]。与此类似的概念还有思维导图。传统由人工梳理的知识结构多为树状,而通过互联网搜索引擎等自动爬取关联并扩展的知识结构通常为网状。
树状的知识结构更加符合人脑对于事物认知的归纳整理方式,十分适合于范围广而须要分类记忆的知识,使概念更加清晰。常见的层次结构文件管理、生物分类法都是此种方式。缺点是树状结构须要严格遵守父—子的层次关系,所有知识点必须纳入上一层的父级关系,不允许有游离的知识点存在,因此,在梳理知识点时较为费力,无法纳入严格分类的知识点会被抛弃。
网状的知识结构可以比作一个星系,里面包含大量的恒星系统、行星系统,一部分流浪天体、宇宙尘埃等,这些天体之间具有一定的层级关系,按照相对固定的空间区域划分,而且它们之间又有许多超越层级关系的直接关联,比如空间扭曲、虫洞等。这些丰富而有所区别的关联关系相互交织成网状,能够包容关系复杂、相对离散的知识点,更加适合现阶段知识图谱的结构。
近年来,随着互联网速度的提升和计算机算力的提高,AI技术也随之发展。同时,以大数据技术为代表的数据智能挖掘和深度挖掘也促进了知识图谱的生成方式更加自动化与智能化。
二、“轨道车辆装备”课程线上知识图谱的构建
(一)课程特点和主要内容
“轨道车辆装备”课程是面向高等学校车辆工程专业和铁道机车车辆专业开设的一门专业类课程,主要介绍轨道车辆电气系统组成和车内电气装备工作原理,课程内容以结构组成、工作原理介绍等客观性知识为主,涉及辅助供电系统、空调系统、照明系统等10多个电气设备子系统,以及CRH1、CRH2、CRH3、CRH5、25T等5种车型,学生须要记忆掌握的知识点非常繁杂,且需要理解其中的区别和联系,这种知识结构的课程非常适合知识图谱的建设。
基于OBE的工程专业学生培养理念,将“轨道车辆装备”课程知识图谱体系自上而下分成了“3+1”层图谱体系,分别是能力图谱、问题图谱和知识图谱(见图1)。依照专业培养目标和课程大纲,提炼出7大能力、98条问题、84个知识点,并在各个知识点内采用AI技术挂载了494个精选的相关教学资源,形成了结构和内容相对完整的知识图谱体系。
课程知识图谱的理念并不复杂,但其背后往往涉及庞大的信息筛选和数据整理工作,当今采用AI技术等智能化手段对信息资源的自动筛选,效率远超于教师人工整理。目前,已有部分高校研究了用专业工具搭建学科知识图谱的本体模型,但视觉展示效果欠佳[5]。因此,要想使知识图谱在建设完成后达到学生好用、教师好维护的水准,学校教师(教研室)与商业教育平台合作是最佳途径。教师对所教课程最为了解,而商业平台拥有大量IT技术资源,二者相互结合,专业的事情交给专业的人来做,这样平台的搭建效率才能最高。
(二)课程教师建设内容
课程教师的建设工作主要在前期,即确定知识图谱的主干框架及整理课内资料等。
第一个层次为确定主干框架。基于OBE理念,以目标为导向,反向设计、正向实施,即按照培养目标最末端的学生能力,先确定能力图谱。能力图谱一般与该门课程的教学大纲能力要求一致,如图2所示,对学生的知识、技能、素养、道德等多方面能力提出了全面的要求。
第二个层次为确定问题图谱。学生须要带着问题去学习课程的知识,有目标地理解知识点中的重点与难点。须要注意的是,问题图谱中的问题不是课程目录结构的简单罗列,也不是课程中专业名词定义的简单重复。问题不能过于宽泛,让学生无法回答;问题的答案要结合课程中具体的知识点,最好能跨多个知识点体现出它们之间的关联。例如,问题1“轨道车辆装备是什么?”显然不是一个好问题,它的提问太模糊,概念太大,对于学生学习这门课程的知识也没太大帮助。如果把这个问题改成“我们在‘轨道车辆装备’课程中研究的车辆子系统有哪些?”,才会引导学生从宏观上梳理课程的章节内容、研究对象等。
第三个层次是提取知识地图,这是整个知识图谱中最重要的内容,需要教师和平台方反复沟通与确认。知识地图相当于是树状的知识点结构,而网状的知识图谱结构要在基础的树状结构下进行丰富,知识地图中的每个叶子节点就是知识图谱中的知识点节点。知识地图的梳理工作量较大,可以在课程教材的章节结构下,由平台方代为梳理。此时,教师须进行审核确认,着重注意以下几个方面。
1.注意筛选知识点的重点主次。平台方梳理的知识点内容往往重要度都一样,教师须要根据课程讲授的实际环节进行设计,确定知识点的主次,并删减一些不重要的知识点。
2.控制知识点在各章节中的密度。平台方梳理的知识点有以下特点:教材中像定义类等结构规则的内容,列出的知识点较多,而分析类、计算类等不容易区分定位的知识则容易被忽略,而每一章节中的分析计算往往是对于学生能力培养更重要的知识。因此,教师在审核中须要合理调整知识点的密度,不让分类定义等概述性知识占比过大。本课程一共梳理出8个大类的知识点(见图3),除了按照教材章节提出的6个大类以外,针对课程要求学生须要对不同车型各个系统的特点进行横向比较,单独提炼出一个横向知识点比较的大类以及思政案例的大类。
最后是课内资料的整理。知识图谱每个知识点对应的学习资源包括课内资料和网络资源,由于课内资料的体系性和权威性,学生在利用知识图谱学习时会花费更多时间在课内资料上。教师须整理的内容包括课程视频(MOOC、微课、课堂录像)、电子教材、教学PPT、教学大纲、教学日历等,以满足学生对各个知识点的基础学习;对于一些重点章节和知识点,可以有针对性地整理演示动画、练习题库、虚拟仿真平台链接等补充资源。最后,由平台方将资源分解并精准对应至各个知识点。
(三)平台方建设内容
在教师和平台方合作建设的模式下,平台方承担了知识图谱建设的主要工作,包括运营平台的搭建、知识体系的梳理、关联、完善等。
1.提供成熟稳定的知识图谱线上平台,包括硬件平台和软件平台。硬件平台即网站服务器的部署及网络环境,主要有两种方式:第一种可以将服务器部署在社会公共机房或云机房,使用公网接口,由平台方公司长期负责网站代码、IP、域名等的维护管理。这种方式对于课程教师和学校来说不需要太多专业的网络技术,有利于网站长期安全稳定运行,但需要一定的维护费用。第二种方式是将服务器部署在学校内部,使用教育网接口及内网穿透ip和域名,好处是硬件部署在本地,没有公司关闭网站关闭的风险,缺点是技术门槛较高,维护复杂。
在软件平台方面,须要提供代码成熟、架构符合时代、界面美观、用户易用的知识内容管理系统,提供用户管理、内容浏览、内容维护、学习管理等功能。需要注意:页面具备多种主流浏览器的兼容性、无插件安装要求,须保证平台在未来数年内能稳定兼容计算机系统的更新换代;教师和学生在使用过程中的易用性,即保证用户在正常的思维逻辑下点击页面各项链接的过程。
2.知识体系的梳理、关联、完善。主要分为四个步骤。步骤一:平台方根据课程教师提供的资料梳理提取课程地图,详细设计与呈现课程讲解逻辑,将内容划分为知识点和思政点等;步骤二:根据课程的教学特色定义知识关系字典,通用的关系例如包含关系、顺序关系、相关关系等,也可根据课程的学科特点建立自定义关系;步骤三:将课程地图的知识点和关系字典进行知识网状关联,通过平台引擎的展示,可以直观地呈现课程知识结构以及各知识点之间的联系,帮助学生按图索骥,进行个性化学习;步骤四:对每个知识点进行学习资源挂载,必选的内容包括课程教师提供的教材、PPT、课程视频,并精准定位到知识点对应的位置片段,另外,可根据AI引擎在外网抓取筛选相关词条的学习资源,例如百科词条、外校MOOC讲解、短视频等,通过丰富的资源挂载,让学生更充分地理解和掌握知识点。
(四)整体流程和注意问题
知识图谱的合作建设整体流程分为三个大模块、八个步骤,如图4所示。
此流程是以平台方为主的整体建设流程,课程教师在准备梳理准备资源时可以不完全按照此顺序,例如教师可以根据专业培养计划,按照“3+1”层体系提前梳理能力图谱和问题图谱,后续方便平台方进行知识衔接。平台方在建设过程中须要经常与课程教师保持沟通,及时听取教师的意见;课程教师也要尽量在建设前期及时将意见反馈给平台方,避免后期架构搭建完成之后内容难以调整。