高等教育数据治理的未来趋势:构建统一数据模型
作者: 袁兴华 何林知
摘要:为了进一步提升高等教育数据治理水平,美国高等教育信息化专业组织(EDUCAUSE)于2024年发布了《2024地平线行动计划:统一数据模型》,从提升学生全面体验、加强数字素养培训、构建数据网格体系架构、建立行业互操作标准、实现全面学习记录五个方面,描绘了高等教育统一数据模型未来十年的愿景目标,从个人、部门、机构、跨机构合作四个层面,阐述了具体的行动方案。本文通过对该报告内容进行分析和解读,提出了可行的高等教育统一数据模型实施路径——健全组织机制和标准规范以强化顶层设计、完善法律法规和防护措施以确保数据安全、强化人员数据素养培训以塑造数据文化氛围、拓展数据技术应用场景以释放数据要素价值,进而构建育人为本、全员参与、开放共享的高等教育数据治理体系。
关键词:地平线行动计划;统一数据模型;数据治理;数据素养
中图分类号:G434 文献标识码:A 论文编号:1674-2117(2024)24-0101-06
引言
随着人工智能和大数据等信息技术日臻成熟,高等教育领域数据治理和数字化转型加速推进,数据资产的价值日益凸显。构建一致化、标准化的数据治理体系,发挥数据要素价值,成为推动高等教育现代化治理的关键。[1][2]
美国高等教育信息化专业组织EDUCAUSE在2023年以数据治理为主题发布了专题报告——《2023地平线行动计划:数据治理》(2023 EDUCAUSE Horizon Action Plan:Data Governance),描述了高等教育数据治理的未来目标和行动方案。[3]
在此基础上,EDUCAUSE发布了《2024地平线行动计划:统一数据模型》(2024 EDUCAUSE Horizon Action Plan:Unified Data Models,以下简称《2024行动计划》),提出了高等教育数据治理面临的数据协同障碍、数据孤岛问题、数据应用不足以及数据隐私与伦理等问题,并给出了构建统一数据模型的未来目标和实施计划。[4]本文分析解读《2024行动计划》,旨在洞察国际高等教育领域数据治理和统一数据模型的发展前沿和未来方向,为我国高等教育数据治理和教育改革提供参考。
总体框架
《2024行动计划》基于高等教育领域的9位专家组成的专家小组的观点,借鉴并调整了未来研究所(IFTF)的前瞻方法论。首先,专家组基于《2023 地平线报告:全面学生体验版》(2023 EDUCAUSE Horizon Report:Holistic Student Experience Edition)提出的发展趋势、技术实践、应用场景,描绘他们对统一数据模型的未来愿景,识别出可以促成未来愿景的机遇和危及理想未来的威胁,针对这些机遇和挑战集思广益,提出了具体行动方案,并给出了未来规划图景。[5]其总体框架如下图所示。
数据收集和数据分析已日渐成为高等教育机构的核心职能。数据分析入选2024年EDUCAUSE十大焦点问题之一,在《2023年地平线报告:全面学生体验版》中,将“基于统一数据模型的学习分析”列为将对未来高等教育产生重大影响的关键技术之一。高等教育机构数据战略与数据资源的不匹配成为亟待解决的问题,其对学生数据隐私和安全、全面学生体验以及学生入学率和在学率都产生了影响。通过汇总分析《2024行动计划》中高等教育统一数据模型的发展现状和未来规划,高等教育机构可以深入了解构建统一数据模型的重要意义,及面临的机遇和挑战,并及时规划未来发展路径,这样有助于汇聚数据资源、发挥数据价值,实现机构数据战略,服务学生全面成长,进而促进高等教育治理能力现代化。
未来目标
专家组从提升学生全面体验、加强数字素养培训、构建数据网格体系架构、建立行业互操作标准、实现全面学习记录五个方面,描绘了高等教育统一数据模型未来十年的愿景目标。
1.提升学生全面学习体验
首先,教育机构以学生全面成功为中心,构建数据治理的文化、流程和体系,充分利用公平、包容、以人为本的数据治理实践,提升学生教育体验。制订并实施有效的数据治理政策,保障学生的数据支配权,其中包括访问控制、隐私保护、数据安全及赋予学生适当的自主权(如提供细粒度的同意或选择退出的流程)。此外,教育机构设立专职团队,持续审查学生数据在收集和使用过程中可能存在的伦理和隐私风险。数据治理人员以数据治理为首要考量,审慎评估新技术带来的潜在机会和挑战。数据使用者积极参与,持续发掘数据需求,并在管理和教学各个层面充分挖掘数据效能。最后,教职工利用机构内的数据资源,优化教学方法,实现教学目标,并为学生提供有针对性的、建设性的反馈意见。
2.为师生提供数字素养培训
所有数据利益相关者(教师、学生、数据治理人员、管理者等)能够理解数据收集、使用、存储及保护的每一个环节。一方面,学生学习如何获取自身教育数据,从而掌控自身学习情况;另一方面,教育机构为教职工提供数据技能培训,帮助他们建立利用数据进行日常决策的能力。同时,数据使用者能够使用自然语言进行数据查询和数据可视化呈现,并通过讲述有意义的数据故事,分享工作成果。
3.构建数据网格体系架构
数据网格体系架构作为一种创新的数据管理框架,可以促进不同数据源的统一与整合。各业务领域专家负责各自领域内(如教务、财务、科研等)的数据治理,负责构建和维护用于定义、清理、验证和发布数据集及数据产品的业务框架。同时,不同领域数据通过虚拟管道技术进行无缝连接,或存储在机构数据仓库中,供传统应用场景利用。采用集中的全局数据治理方法,使用户能够跨职能领域实现数据导出、集成、分析和可视化。
4.建立行业互操作标准
数据字典和数据管理的行业互操作标准,为跨功能领域乃至跨机构整合数据提供必要的基础设施。这些标准通过细粒度的、基于属性的数据访问控制,确保利益相关者能够获取所需数据,同时尊重个人隐私并降低数据安全风险。
5.充分利用综合学习记录系统
该系统为学生提供全面、纵向的学习记录,目前已演进至“CLR2.0”版本。除单一机构的数据记录外,CLR2.0还整合了学生从K-12到高等教育、替代证书(如微证书、认证)以及工作场所的学习经历,其终端用户(特别是学生)能够运用先进的AI工具分析、总结和报告学习数据。同时,CLR2.0通过提供更全面的数据资源,帮助教育机构理解学生需求,有针对性地规划学生学习,提高入学率和在学率。
行动计划
专家组从个人、部门和单位、机构、机构间合作四个层面,分别制订了一系列行动方案,以实现未来十年的愿景目标。
1.个人层面
一是注重数字素养提升。个人应培养好奇心和终身学习的态度,积极参加数据伦理相关培训,以便在工作中正确使用数据,以及在日常生活中正确地分享和保护个人隐私数据。
二是优化数据管理。在工作中注重审查数据质量、保护数据安全、控制数据访问权限,人人参与数据管理,确保数据真实可靠。
三是让学生利用数据。向学生提供数据资源和数据分析结果,以支持学生数据素养提升,并激发他们参与自身教育的热情。通过基于数据的形成性反馈,学生可以评估自身学习进展,与教师互动反馈。学生参与数据互动也有助于在将来的数字社会中更好地工作和生活。
四是积极参与数据收集。及时广泛地收集数据有利于提高数据集的一致性和完整性,以及流程的高效性。需要注意的是,扩大数据收集范围会增加错误概率和安全隐私风险,所以持续的数据素养培训至关重要。
2.部门及单位层面
一是重新设计工作流程和岗位描述。重新定义工作描述和职业发展路径,明确数据责任和数据管理职能,分配所需的资源和人员,确保数据治理工作高效执行。同时,为团队成员提供适当的激励和资源支持,以提升数据实践。
二是为学生提供数据工具。一方面,授权学生从入学到毕业的在校数据访问权限,以便学生了解自身学习情况;另一方面,为学生提供数据工具和相关培训,帮助学生充分利用数据工具发挥数据价值。
三是使用数据网格体系架构。进一步打破数据壁垒,实现机构内部各部门间的数据共享,以便集成多元数据集。此外,邀请主题专家指导数据输出和定义,可以降低诸如数据误解等风险。
四是构建可扩展的技术基础设施。可扩展的数据提取能力是人工智能、学习分析等技术的关键因素。确保技术基础设施可扩展,以适应不断变化的数据需求。同时,安排专职人员维护数据资源和数据系统,并为团队成员提供技术支持。
五是建立数据质量保证机制。高质量数据有助于高效整合不同平台数据集,数据质量保证流程要做到有记录、可追溯,确保数据的完整性、一致性。
六是明确数据流程和数据工具。明确数据集成和数据访问的流程和工具,有利于保障数据安全。同时,相关流程和工具能够保证数据访问的安全性,促进数据民主化和数据整合。
七是建立数据收集策略。数据收集策略应当与机构战略目标保持一致,清晰的愿景有利于未来工作规划并获得员工支持。基于战略的数据收集有助于洞察关键绩效指标,为未来战略发展提供指引。
八是为师生提供数据素养培训。帮助师生理解数据价值,并将数据素养作为生活必备技能,包括了解数据标准规范、厘清本地数据类型、明确数据清洁的重要性等。
3.机构层面
一是确立机构层面的数据素养发展要求。机构数据用户应在数据使用方面达成共识,以促进全面数据分析。开展机构层面的数据素养培训,有助于数据用户在特定的数据环境中开展数据实践。
二是为数据导向型思维提供财政和文化支持。利益相关者需要明确数据何时可用,如何获取,如何使用。机构保持数据公开透明以增强利益相关者对数据的信心。
三是增加AI数据分析研发方面的投入。投入的时间和经费属于战略性投资,将有助于发挥数据效能,提高工作效率。此外,支持数据驱动的科学决策,将有效提升学生全面教育体验。
四是获取高层领导者的财政和文化支持,促进数据协调统一。机构领导层可提供高层级资源,用于支持数据驱动的科学决策,并确保数据使用者可以及时有效获取数据。
五是建立机构范围内的数据实践社区,推进最佳实践分享。社区成员无需额外工作,而是将数据实践融入日常工作中。此外,吸引相关主题专家加入社区,为数据实践提供指导。
六是制订全面的数据治理战略和准则。统一的质量保证要求、标准化的数据字典、明确定义的角色和权限等基本准则,可以促进利益相关者之间的数据互信,从而促进数据利用。
七是将信息安全融入数据战略和流程中。加强数据安全保障是高效使用数据、避免伦理问题的基础。清晰的数据分类和访问权限应贯穿各个数据流程始终。
4.跨机构合作层面
第一,加入国内或国际数据实践社区,分享交流最佳实践、共同的挑战和公共的资源,利用这些知识指导数据治理工作。还可以利用合作关系跳出传统思维桎梏,打破机构现有框架,迎接未来挑战。
第二,制订统一数据模型的行业标准,同时保持定制灵活性。数据互操作性、质量保证、访问控制、数据匿名化等数据属性的标准化,将促进跨机构的数据分析和通用数据集的创建。
第三,采用符合行业标准的共享数据集和数据工具。一致的、高质量的数据分析工具将促成更好的机构合作,从而提升学生全面教育体验。同时,共享基础设施有助于各个机构利用更少的资源实现更多的成果。
第四,倡导行业合作伙伴公开透明、公平定价。第三方工具的说明条款必须明确阐述数据的采集、分享、管理过程,以及终端用户的信任。此外,利用正式的跨机构合作伙伴关系(如联合体、联盟等)增加机构合作的影响力。
未来规划
1.明确所在机构的需求