基于创新应用驱动的高校数据治理研究

作者: 徐玲 黄晟

基于创新应用驱动的高校数据治理研究0

摘要:本文从高校大数据应用场景规划出发,提出了以创新融合应用驱动高校大数据治理策略,构建了教育大数据治理平台的整体框架,设计了六个跨业务、跨部门和跨层级的大数据融合应用场景,并通过建立跨部门协同的组织架构,探索数据治理建设路径,以此来提升高校科学决策能力,推进教育现代化发展。

关键词:教育大数据;数据治理;创新应用;治理框架;组织架构

近年来,国内很多高校已经开展了教育大数据治理工作,在促进教育数据共建共享、解决信息孤岛问题等方面发挥了重要作用。[1]研究表明,数据治理不仅能够提高教育数据质量,解决学校各业务系统的数据共享和融合发展等问题,更是全面提升协同育人、教师发展、学科建设、教学变革、领导决策等专题域的管理决策效能的基础。[2-3]

高校数据治理是一个长期、复杂的系统工程[4],在实施过程中仍然存在诸多问题,如数据质量差、数据标准不统一、数据权责不清、数据缺乏全生命周期管理等。[5]解决此类问题需要从高校业务需求和管理体制机制上建设数据治理平台。通过建立学校统一的数据湖及应用平台,提供数据汇聚、存储、治理、分析、服务、共享、应用和运管能力,夯实学校大数据智能化、运行管理智能化、业务作业智能化、教育管理智能化的应用基础支撑能力,构建跨业务、跨部门和跨层级的融合应用场景,形成企业“数智化”运行的智能中枢,实现运行状态的实时监测,运行数据的辅助决策、指标的智能预警预测,关键问题的智慧决策,打造学校运行管理闭环与智慧化决策能力。教育数据治理工作需要全景规划大数据融合创新应用需求,坚持“以用促建”,以创新应用为驱动,促进数据治理建设,发挥数据资产价值,推动管理决策由经验向科学的变革。

高校教育数据治理框架

高校教育数据来源于多个部门,属于多源异构的数据场景。数据治理需要各部门多方协作才能进行。因此,需要深入挖掘业务部门的应用需求,激励各业务部门深度参与数据治理工作,从数据的管控模式转变为数据的共建共享模式。数据治理涉及数据标准、数据存储、数据治理、数据安全、数据服务以及数据应用等多方面内容,建立符合高校现状和需求的数据治理体系架构,能够有效推动高校数据治理工作的开展。基于此,笔者构建了面向数据全生命周期的高校数据治理框架,如下页图1所示。

1.数据源

教育大数据平台汇聚了来源多样、类型繁杂、体量巨大的数据。按数据的来源可以将数据分为业务系统数据、物联网数据、API数据、电子表格数据、日志数据、互联网数据、文档资料等数据类型。按照数据的结构化程度,可将数据分为结构化数据、半结构化数据和非结构化数据。结构化数据包括业务系统数据、电子表格数据、API数据及物联网数据;半结构化数据包括文档资料和部分互联网数据;非结构化数据包括部分互联网数据和日志文件数据。

2.数据存储计算

数据存储计算平台主要包含数据仓储的建设、数据检索,以及数据融合计算等,以Hadoop数据仓库作为存储工具构建海量可扩展的存储仓库作为存储介质,提供分布式、高并发性的海量存储数据存储、访问、管理及检索,并提供多种计算框架满足实时计算、深度学习、图计算分析等复杂数据处理场景。

3.数据治理

数据治理贯穿元数据管理、数据标准化、数据质量管理、主数据管理、数据资产、数据安全、数据生命周期等从源端到数据中心再到服务端的全过程管理,通过数据治理,实现对数据资产的梳理和数据质量的管控。数据治理平台提供数据标准的统一管理,实现数据资源与标准的绑定。

4.AI中心

大数据应用依赖算法服务平台,需要建立一套完整的算法研发和优化机制。AI中心将人工智能技术模块化、组件化、可插拔化,实现人工智能能力的高效率生产和集中化管理,并向业务系统输出服务,实现智能化应用。AI中心实现算法快速开发、共享复用和高效部署管理,为高校部门融合应用提供服务,通过算法赋能提供决策支撑。

5.数据服务

数据服务从数据资源中心获取数据资产,依据各业务数据需求将数据资产封装成为相应服务,通过API提供给上层应用。数据服务为教育数据向教育应用的转变提供关键支撑,具体包括指标服务、标签服务、知识图谱服务、数据检索服务以及数据沙箱服务等。

6.数据应用

数据治理采取“以用促建”方式,拉动数据供应链条各个节点参与。围绕高校教学、科研、人事、学科、服务和监测等主要场景,规划设计包括协同育人、师生画像、教学评估、学科发展、师生服务、校情监测、风险预测、绩效考核等跨部门融合创新应用,推动信息系统深度整合。

高校教育数据的创新应用需求

围绕高校主要应用场景,笔者设计了六个跨业务、跨部门和跨层级的数据应用系统。通过瞄准教育大数据应用需求倒逼数据治理工作,可以先选择一到两个业务应用场景的闭环快速搭建起数据治理的各种能力,再按照全景规划依次迭代,逐步实现全局大数据的治理。

1.拔尖创新人才与协同育人

针对学生精准分类、精准服务及协同精准育人等人才培养过程中的难点问题,笔者设计了面向学生培养的综合服务系统(如下页图2)。其主要功能是汇聚学生在学校中的各类信息数据,提供统一化的数据汇集分析功能,如根据学生在校的行为数据分析学生的学习、生活等基本情况,实现学生画像、学生分类、精准奖助贷、异常预警以及多维教育评价等功能,助力“三全育人”,驱动人才培养模式改革。

2.教师发展与高层次人才培育

高校普遍存在教师耗费大量时间重复填写各类表格、教学科研以及相关成果数据收集困难等问题,因此,开发教师发展与高层次人才培育大数据应用系统,可完善教师发展与培育机制以及促进师资队伍高质量发展。该应用提供教师画像、教师教学学科科研成果汇总、教师个人发展数据统计分析等功能,能极大减轻教师工作负担,完善教师发展与培育机制。同时,基于大数据技术分析出教师的发展趋势以及未来走向,挖掘出相关学科领域的高层次创新人才,进行重点精准培育,促进师资队伍高质量发展。

3.学科动态监测与评估

该应用实现学科动态发展监测和学科资源全局优化配置与管理,解决学科评估中实时跟踪评估结果难,采集数据难,以评促建、以评促改难落地等问题。其主要功能是构建学科动态评估指标,数据填报线上化、自动化,自动生成学科评估报表,完成多维评估分析,实现学科规划与发展分析、学科前沿热点趋势分析以及学科发展的实时动态监测。

4.教学动态监测与评估

教学发展动态监测与评估应用可以实现教学运行关键业务指标实时监测、关键业务指标达成度分析、关键指标数据的多维度分析、数据填报自动化、数据多维分析及预测等功能。该大数据应用是教学质量动态监测和精准预测,以及教学管理决策科学性的重要支撑。

5.师生一站式服务

多端统一是提高师生业务办理效率、提升师生服务体验的基本途径。一站式服务系统可以实现一入口访问、一账号登录,部门业务一键搜索、一键办理、一键审批,一网多办、一网通办等功能集成,从而解决跨部门业务办理烦琐,服务周转成本高,服务质量低、时效慢等问题。

6.学校校情综合监测

校情监测主要面向学校管理决策,提高对教学质量、学科发展、科研成果、学院建设情况的主动式监管能力,加强对校情舆情的动态监管[6],解决各学院发展数据汇聚难、教学与科研数据时效性低、校情舆情被动式监管等难题。其主要功能包括教学质量统计分析、学院建设情况统计分析、科研发展汇总预测、校区动态监测一张图、沙盘演练辅助决策图等。

构建跨部门协同的校级数据治理组织结构

为了让各部门积极参与到数据治理工作中,实现数据的共建共享与自治,笔者所在学校构建了跨部门协同建设的校级数据治理组织结构,该组织结构分为决策层、管理层和执行层,强化了数据的管理制度和流程,充分提高了各部门业务人员的参与度。通过建立健全的管理体制,保障数据治理得到长期稳定的发展。

①决策层。网络安全和信息化领导小组是教育大数据建设的决策层,由分管信息化副校长负责。数据治理委员会建议由数据使用和数据分析相关的部门负责人组成。决策层负责领导和组织数据治理专项工作,确定指导思想、目标和任务,审议数据治理实施方案及总体规划,协调解决数据管理中相关的重大问题。

②管理层。数据治理管理小组是教育数据治理的管理层,由数据管理办公室和各业务部门管理小组组成。各业务部门管理小组由各部门负责信息化的领导组成。管理层负责建立学校数据治理的完整体系、实施计划、管理细则、技术细则以及编制管理规范。管理层需要定期召开数据治理管理例会,提升数据能力建设和数据质量管理水平,建立起数据治理的长效机制。

③执行层。执行层主要由学校各二级部门组成,是数据治理的主体单位,执行层在管理层的统筹安排下,定期召开数据治理执行例会,具体执行各项数据治理工作,推动数据治理各项流程与日常工作相结合。执行层深度参与数据治理工作,极大地调动了二级部门工作积极性。

高校数据治理的建设路径

高校教育数据治理按照“整体规划、分步实施、标准引领、应用驱动、融合创新、体验优先”的总体思路,统一全校信息的数据标准,以标准为引领实现数据收集治理,以创新融合应用为驱动,深度挖掘信息以促进教育发展,以提高师生服务体验为先导,建立以师生为中心的服务管理模式。

1.设立专业化的数据治理管理团队

设立专业的数据治理管理团队,从数据标准、监管数据质量、保障数据安全、规范应用开发、共享交换秩序及系统的运行与维护方面加强教育数据管理工作,制订数据管理制度,明确和规范数据管理组织体系和维护方法,保障数据标准的统一管理和应用。

2.建立统一数据标准

统一的数据标准是数据资源融合共享的前提和基础。综合各部门业务系统现状,以国标、教育部标准及校标为依据,遵循唯一性、合理性、可扩展性、简单性、规范性、适用性等原则,制订符合高校需求的统一数据标准。

3.构建数据管控体系

落实数据标准和管理体系,实现数据统一和规范管理。建立健全数据管控体系,实现对数据从发布到应用、维护的全生命周期管控。加强对数据质量的管控,在制度、组织、管理流程、人力资源等各个方面给予支持。

4.制订数据共享服务策略

数据共享服务是教育创新融合应用的关键支撑,可实现数据资产的价值。通过细化完善各部门数据共享制度(包括数据授权许可制度、数据安全保密管理制度、数据交换安全管理制度),规范数据实时共享的策略,以保证数据的安全性和有效性。

5.推进技术开发融合应用

建立大数据平台的AI中心,支持算法和可视化建模与交互式环境代码编写,支持PyTorch、Python、LightGBM等多种大数据计算框架,可以帮助开发人员高效分析数据和算法训练。AI中心促进了大数据与其他智能技术的融合,为大数据应用提供技术支持,提升业务系统的响应能力和速度,减少重复计算。

结语

数据作为学校的核心数据资产,是实现高校数字化转型的重要基础。教育大数据发展不仅需要从技术角度实现数据的采集、存储、交换和应用,更需要面向高校应用需求驱动数据治理,促进大数据技术与高校教育改革深度融合创新。

参考文献:

[1]张培,夏海鹰.教育领域数据治理的基本思路与实践路径[J].现代教育技术,2020,30(05):19-25.

[2]金玉梅,陈航.教育大数据挖掘的价值定位、现实限制与有效策略[J].教育理论与实践,2021,41(19):3-8.

[3]孟冬冬,张毅巍,才亚楠.大数据对高等教育的影响及应对策略[J].黑龙江高教研究,2020,38(01):34-37.

[4]周炜.大数据视域下高校数据治理优化路径研究[J].教育发展研究,2021,41(09):78-84.

[5]黄有福,黄中伟.基于业务驱动的高校数据治理应用研究[J].中国教育信息化,2022,28(02):111-116.

[6]沈霄,王秀成,杜忠锋.网络舆情监测与高校稳定对策建议——以云南为例[J].中国成人教育,2015(08):57-59.

作者简介:徐玲(1975—),安徽庐江人,重庆大学副教授、博士,硕士生导师,主要从事智能化软件工程研究;黄晟(1988—),浙江金华人,重庆大学副教授,博士生导师,主要从事计算机视觉研究。

经典小说推荐

杂志订阅