大学促进可持续发展的驱动力研究
作者: 李莹
摘 要:为探索大学内部哪些因素驱动其对可持续发展作出贡献,文章基于“相关性分析获得相关因素—案例研究分析因素指向—二者综合构成驱动力”的思路展开研究,以《泰晤士高等教育》世界大学排名及其影响力排名作为数据来源,运用皮尔森系数、多元线性回归、随机森林、最大信息系数,对教学、研究、国际视野、产业收入与大学影响力综合得分之间的关系进行相关性分析,结果显示研究和国际视野与可持续发展之间呈现明显相关。为进一步阐释与丰富量化研究结果,文章以悉尼大学为案例,进一步阐释在《可持续发展战略2020》的指导下,悉尼大学通过聚焦相关主题、开展卓越研究,拓展伙伴关系、深化国际合作,结合课程活动、共塑学生体验,紧密连接产业、协同解决问题四个方面落实具体实践,推动可持续发展的相关建设,为我国大学推动具有中国特色的可持续发展建设提供经验。
关键词:可持续发展目标;可持续发展;悉尼大学;驱动力;《可持续发展战略2020》
中图分类号:G649.1 文献标志码:A DOI:10.3969/j.issn.1672-3937.2023.06.06
一、问题的提出
经济全球化步伐的加快与科学技术日新月异的更迭,促进了人类社会史无前例的进步与发展,但与此同时也带来了前所未有的社会、经济、环境等挑战。为应对诸多困境,联合国于2015年提出17项可持续发展目标(Sustainable Development Goals,SDG)[1]。大学作为承担人才培养、科学研究、社会服务、文化传承与创新、国际交流与合作职能的重要社会机构,理应积极承担社会责任,充分利用自身知识、人才、合作伙伴关系等重要资源,致力于为可持续发展作出突出贡献。
《泰晤士高等教育》(THE)自2019年起发布世界大学影响力排名(Higher Education University Impact Rankings),打破了传统以学术为主要标准的评价体系,创造性地将17项SDG作为评价标准,评估全球高等教育机构的可持续发展贡献度。此次排名分为单项排名与综合排名。单项排名依据大学在该项SDG上三个维度的表现,即研究力、贡献度和治理水平,据此设计一系列细化评价指标并分配权重。有意向的大学只需提交1项SDG材料即可参加单项排名。但若要参加综合排名,第17项SDG(实现目标的伙伴关系)材料为必须提供项,此外,大学还需提供至少其他3项SDG材料,最终大学影响力的综合得分根据其在第17项SDG及其余16项SDG中评分最高的3项获得,其中SDG17权重为22%,其余3项SDG各占26%。[2]
基于此,“大学内部哪些因素驱动其对可持续发展作出贡献”这一问题值得深入思考。结合THE世界大学排名的5个评价指标(教学、研究、引用、国际视野、产业收入)[3]、大学基本职能及日常各项活动,本研究选取教学、研究、国际视野、产业收入四个指标,运用皮尔森系数(Pearson Correlation Coefficient,PCC)、多元线性回归(Multiple Linear Regression,MLR)、随机森林(Random Forest,RF)、最大信息系数(Maximal Information Coefficient,MIC),探究其与大学影响力综合得分(本研究以此项数据代表大学可持续发展建设情况)之间的相关关系,并结合悉尼大学促进可持续发展的具体案例进行深入分析,以期为我国大学致力于推动可持续发展的建设提供经验。
二、数据来源与分析
(一)数据集构建
为探究影响大学影响力综合得分的因素,本研究依托THE 2021年世界大学影响力排名和THE 2021年世界大学排名①构建了相关性分析数据集D②,数据集可使用如下公式表示:
i 分别是THE世界大学排名提供的教学、研究、产业收入、国际视野四个指标得分,Yi是THE 2021年世界大学影响力排名提供的基于SDG的大学影响力综合得分。数据集D是5维实数集,包含总计687所同时存在于两个排行榜中的大学。
表1展示了数据集D的部分统计学描述。变异系数越大,则得分越分散;反之,变异系数越小,则得分越集中。
(二)相关性分析方法
以相关性分析数据集D为基础,本研究运用PCC、MLR、RF和MIC四种相关性分析方法探究教学、研究、产业收入和国际视野4个指标对大学影响力综合得分的影响。其中,PCC与MLR算法可评估X与Y的线性相关性,RF与MIC算法可评估X与Y的非线性相关性。
PCC[4]由卡尔·皮尔森提出,是最常用的衡量两个变量间线性相关性的方式,其原理是使用消除量纲协方差度量两个变量的变化趋势,当两个变量变化趋势接近时,其协方差较小,当两个变量变化趋势不同时,其协方差较大,度量变量X与变量Y的皮尔森系数ρ可由如下公式表示:
ρX,Y=(2)
其中,μX、μY、σX和σY分别是变量X与变量Y的均值与标准差。皮尔森系数的值被限制在-1到1之间,其绝对值越接近1,则变量X与变量Y的线性相关性越高,反之,皮尔森系数的绝对值越接近0,变量X与变量Y的线性相关性越低。
MLR[5]是一种统计学模型,旨在分析一个因变量与一组自变量之间的依存关系。本研究视大学影响力综合得分Y为因变量,视四个指标得分为自变量,假设因变量与自变量之间存在一定的线性相关性,构建了一个多元线性模型,可表示如下:
其中wt、wr、wii、wio和b均表示模型参数,i是综合得分的估计值,模型通过有监督的方式学习模型参数的取值,使综合得分Y与综合得分估计值的差值最小。因此,通过有监督方式学习到的wt、wr、wii、wio可表示不同指标得分对综合得分的影响。
MLR和PCC可以分析两个变量之间的线性相关性,但无法衡量变量的非线性相关关系,因而本研究选取RF与MIC衡量变量间的非线性相关性。RF算法[6]是一种机器学习算法。它具有良好的预测性能、较低的过度拟合和较强的可解释性。除用作分类回归外,RF还兼具相关性分析的能力。RF由许多决策树组成,决策树的每个节点选择一个维度的特征将输入数据集分为两个子集。RF在生成每棵决策树时,会随机有放回地抽取样本,因此每棵树都有一些未被抽取到的样本,这些样本被称为决策树的袋外(Out-of-Bag)样本。袋外样本的误差,可衡量决策树的性能。在使用RF分析综合得分与某个特征得分的相关性时,需利用两个RF回归模型,一个模型回归特征得分与综合得分的关系,另一个模型回归在特定维度加入噪声的特征得分与综合得分的关系,计算两个决策树袋外误差之差并取均值,可以度量加入噪声的特征得分与综合得分的相关性。
MIC[7]于2011年由雷谢夫(Reshef)等人提出,最大信息系数利用互信息(Mutual Information)的概念,互信息的公式为:
Ι(X;Y)=p(x,y)log(4)
上述公式的含义是,综合得分Y与特征得分X之间的互信息I(X;Y)是它们的联合概率分布p(x,y)与各自边缘概率分布p(x)、p(y)的相对熵。MIC的计算方法对综合得分与特征得分构成的散点分布图进行多种网格划分,求出每种划分下的最大互信息值。其中,综合得分Y与特征得分X之间的MIC系数被认为是不同网格划分得到的互信息值中最大的一个。
(三)相关性分析结果
本研究使用PCC、MLR计算综合得分与四个指标的线性相关性(表2展示了PCC与MLR的显著性检验系数P值),使用RF、MIC计算综合得分与四个指标的非线性相关性,图1展示了4个指标与综合得分的相关性关系。
由表2可见,使用PCC检测4个指标与影响力综合得分的相关性时,4个指标的P值均小于0.05,即4个指标与影响力综合得分之间均呈显著相关;使用MLR检测4个指标与影响力综合得分的相关性时,教学、产业收入两个指标的P值大于0.05,即教学、产业收入与影响力综合得分之间的相关性并不显著。
如图1所示,图中每个柱状图组均描述了一种相关性分析方法下4个指标与大学影响力综合得分的相关性系数,从左向右依次代表教学、研究、产业收入、国际视野。从PCC图组来看,教学、研究、国际视野均与影响力综合得分呈现较为接近的变化趋势,其中研究、国际视野的相关性系数超过了0.5;从MLR分析上看,教学和产业收入对综合得分的效应较低,在数据集上学习到的MLR方程中,与教学和产业收入对应的权重参数均不足0.1;从RF图组分析来看,在研究与国际视野指标中加入噪声会对影响力综合得分造成更大的影响,相比之下,在教学与产业收入指标中加入噪声对影响力综合得分的影响较小;从MIC上看,尽管教学、研究、产业收入与影响力综合得分均有一定的非线性相关性,但相关性系数均不足0.4。
为综合四个相关性系数的结果,本文提出以平均相关系数C作为衡量4个指标与影响力综合得分相关性的唯一标准,平均相关系数C是经过softmax归一化后四个相关性系数的均值,其公式为:
Ci=(s(ρi)+s(yi)+s(Ii)+s(Ri))(5)
其中Ci表示第i个指标与影响力综合得分的平均相关性系数,ρi、yi、Ii、Ri分别表示第i个指标与影响力综合得分之间的PCC系数、MLR系数、MIC系数、RF系数。s(·)表示softmax归一化函数。得分Ci高于0.25时,证明指标i与可持续发展影响力综合得分之间存在相关关系。
经公式(5)计算,教学、研究、产业收入、国际视野的平均相关系数分别为:0.207、0.279、0.202、0.302,由此可见,研究和国际视野指标均高于0.25,即研究和国际视野与大学影响力综合得分之间呈现明显相关,亦即研究和国际视野与大学促进可持续发展的建设具有较强联系。
三、案例的选取
通过上一章的相关性分析,国际视野、研究两项指标与大学影响力综合得分之间的相关性较高。为进一步探究大学通过哪些具体举措推动其可持续发展的建设,本研究选取具有代表性的案例进行深入分析。相较于可持续发展表现不均衡地区的优势高校,可持续发展表现均衡地区的拔尖高校更具研究价值且更易被学习推广,为此需要规避地理因素对高校可持续发展表现可能造成的影响,因而本研究定义了国家或地区可持续发展影响力得分,利用这一得分筛选可持续发展水平均衡的地区。
本研究以国家或地区为分类依据,对THE 2021年世界大学影响力排名中的1118所大学影响力评分条目进行分类,上榜大学可被分类至94个国家或地区[8]。依据分类结果,统计了94个国家或地区的上榜大学数量、上榜大学平均得分、上榜大学平均排名三个指标。
一个国家或地区可持续发展影响力的得分与其上榜大学平均分、上榜大学数量成正相关,与上榜大学平均排名成负相关。因此,本研究将一个国家或地区可持续发展影响力得分Si定义为上榜大学排名XRank
i 倒数、上榜大学平均分XScore
i 和上榜大学数量XNum
i 的乘积关系。由于XRank
i 、 XNum
i 数据分布较为分散,对这两项指标进行开根号操作,可对数据分布进行约束。基于这三个统计学指标,本研究提出了国家或地区的可持续发展影响力评分公式,可写作如下形式:
Si=N(XScore