智能化时代研究生统计学专业教学高质量发展探索
作者: 唐立 刘源远摘 要:通过揭示统计学与智能化技术核心机器学习之间的重要关系,提出智能化时代下研究生统计学专业教学改革的目标,即把学生培养成为推动统计学以及人工智能发展的重要力量。提出教学内容改革的框架,将机器学习中相关方法分别融入统计学专业各门课程教学中;实施方案为在理论和实践教学中,将传统方法与机器学习方法进行结合和比较。最后以时间序列分析课程为例,具体探讨怎样与机器学习深度融合,以此探索研究生教学高质量发展之路。
关键词:智能化;机器学习;研究生;统计学专业;教学改革
中图分类号:G423.07 文献标志码:A 文章编号:2096-000X(2025)10-0131-05
Abstract: By revealing the important relationship between statistics and machine learning, the core of intelligent technology, this paper puts forward that the goal of teaching reform for postgraduates majoring in statistics in the era of intelligence is to cultivate students as an important force to promote the development of statistics and artificial intelligence. The framework of teaching content reform is proposed as follows: the relevant methods in machine learning are integrated into the teaching of each course of statistics specialty respectively;the implementation plan is to combine and compare traditional methods with machine learning methods in theory and practice teaching. Finally, taking the course of time series analysis as an example, this paper specifically discusses how to deeply integrate with machine learning, so as to explore the road of high-quality development of graduate teaching.
Keywords: intelligence; machine learning; graduate students; statistics; teaching reform
党的二十大指出,“建设教育强国、科技强国[1]”是我国发展的总目标之一。教育作为中国式现代化的基础支撑,必须紧跟时代要求,不断与时俱进地改革,才能培养出在全球具有竞争力的人才,为中国特色社会主义建设服务。通常认为,第三次工业革命的标志是大数据的开发和利用,第四次工业革命是生产方式的智能化。现在正是第三次和第四次工业革命的交替之际,世界即将迈入智能化时代[2-3]。对于即将到来的智能化时代,我们唯有把握机遇,迎接挑战,对教育进行智能化改革,才能达到时代的要求。特别是研究生教育,肩负着为国家培养高层次人才的重任,更是需要把握时代的脉搏,开展智能化改革,促进研究生教育高质量发展。
教育的中心是教学,教学是实现教育目的的基本途径。因此,智能化时代下,研究生教学的智能化改革势在必行。研究生教学智能化改革可以分为两种:一种是针对所有专业课程的,对其教学方法和教学手段的智能化改革;另一种是针对部分与智能化知识相关的专业课程的,根据研究生课程体系的建设理论,还应该对其教学目标和教学内容等进行智能化时代下的改革[4]。人工智能的核心是机器学习,机器学习是运用计算机,从大量数据中学习复杂的知识,而统计学一直是研究如何搜集数据、分析数据的学科。可见,统计学属于与智能化知识相关的专业[5-6]。这里,我们以研究生统计学专业为例,讨论与智能化知识相关的专业课程的教学目标和教学内容的改革,以此探索智能化时代下研究生教学高质量发展之路。
一 智能化时代研究生统计学专业教学目标改革
人工智能起源于二十世纪五六十年代,但因受到计算机性能限制,未能得到很大的发展。直到最近二十多年,随着计算机性能飞速提高,人工智能呈现出勃勃生机。如今人工智能已经在工业、农业、经济、医疗和教育等领域,展开着广泛的研究和应用。众所周知,人工智能是依靠机器学习技术支撑起来的,想要成为智能化时代的主人,掌握机器学习是关键[2,5]。
(一) 问题的提出
机器学习作为一门新兴的学科,是利用计算机对样本数据进行学习,找到数据的规律,达到预测和控制数据的目的。机器学习的研究目的与统计学学科的研究目的是一致的。于是有人提出疑问:机器学习对数据的研究是不是涵盖了统计学对数据的研究?统计学还有存在的意义吗?智能化时代下研究生统计学专业教学目标究竟应该是什么?
(二) 问题的研究
回答这些问题,需要从如下三个方面探讨统计学与机器学习之间的重要关系。
1 从采集的数据方面
统计学从古时候人类对于人口、财产等数据的统计开始算起,至今已有几千年的历史。现在的统计学应用十分广泛,可以说,统计学存在于任何有人类思维活动的领域[7]。因为统计学发展过程与数学方法关系密切,研究生统计学专业大多属于理学门类,这样培养的研究生,统计学和数学知识都比较完备。
统计学的研究对象是数据,这一点与机器学习一样。不过,传统统计学研究的数据,一般是通过观察或调查等方法得到的结构化数据。而机器学习研究的数据,更倾向于数量庞大的大数据,并且可以是从传感器、网络上获得的文本、图像等非结构化数据[6,8]。所以,从数据类型上看,机器学习比传统统计学应用更广泛,这也是目前统计学专业已普遍增设机器学习课程的一个原因。
虽然数据的搜集和存储方式已经取得长足的进步,它们为统计学和人工智能提供充足的数据信息基础。然而,只有运用强有力的技术方法加工这些数据信息,才能真正解决实际问题,实现人工智能等用途。
2 从研究的方法方面
机器学习是运用计算机模拟人类学习行为的学科,它的许多理论与统计学有着直接的关系,不妨来看一些机器学习中使用的统计学方法。
机器学习研究的对象往往是大数据集,数据集中如果含有过多的特征,可能导致构建的模型太复杂、过拟合或者预测误差偏大等不良结果。为减少数据集中的特征,需要对数据进行特征选择或者特征提取的工作,以降低数据的维度。关于数据特征的选择或者提取的机器学习方法中,很多就是统计学的方法[8]。比如,数据特征的选择中,经常使用统计学中的方差分析、卡方拟合优度检验等方法,过滤掉那些对输出目标影响较小的特征。也常常使用统计学中的岭回归、Lasso回归等,区分数据中重要的特征和不重要的特征。同样,在数据特征的提取中,经常使用主成分分析、因子分析等经典统计学方法,实现数据的降维。
除了上述数据降维的工作,机器学习中其他常见的任务:回归、分类、可视化等,往往也是基于统计学方法来完成[5]。比如,以贝叶斯统计学为基础的贝叶斯学习,就可以用来实现上述所有的任务。其实,贝叶斯学习是机器学习中的重要算法之一,广泛应用于图像压缩、自然语言处理、人工神经网络等复杂的机器学习。所以,从研究方法上来看,机器学习十分依赖于统计学这个基础,想要从根本上掌握机器学习方法,就必须掌握其中的统计学原理。
3 从使用的软件方面
人工智能和统计学,都是依靠于计算机硬件和软件的进步而发展起来的学科。关于使用的软件,所有的统计学方法和机器学习方法,都可以使用当今流行的软件Python或者R语言实现。而且,Python或者R语言都是性能良好的开源免费软件[8-9]。
对于统计学专业的学生来说,他们在本科生阶段,一般就有这两种软件使用方法的教学课程。在研究生阶段,他们对于这两种软件的掌握更加熟练。统计学方法和机器学习方法能使用同一款软件实现,意味着我们可以在一个问题中同时使用这两类方法,这为我们把统计学和机器学习进行深入融合和应用提供方便。
(三) 教学目标改革建议
从上面三点统计学与机器学习密切而又重要的关系可知,统计学是机器学习的起源和基础,现在它们交互作用,不可分割。尤其是在研究方法上,统计学对机器学习有着重大的影响和贡献。因此,智能化时代下统计学不但有存在的意义,而且统计学对人工智能的发展十分重要。然而,我们必须对研究生统计学专业的教学进行改革,才能使得培养的研究生在智能化时代中发挥充分积极的作用。
事实上,智能化时代下最需要的是掌握人工智能核心技术——机器学习方法的人才。对于机器学习方法的掌握有两类人。第一类人掌握机器学习中各种已开发的工具箱和算法,第二类人不但掌握已有的机器学习方法,还能创造新模型、新算法,推动人工智能的发展。显然,第二类人必须从根本上,即从基础理论上理解和掌握机器学习方法。众所周知,机器学习主要理论基础是计算机、概率论、统计学和数学。统计学专业的研究生,正是同时掌握这几门基础课程知识的人。他们作为智能化时代下国家的高层次人才,对他们的培养目标应该是让他们成为第二类人。
要使得培养的研究生成为掌握机器学习的第二类人,需要对研究生统计学专业各门课程的教学进行深入的改革,这里提出的教学目标改革建议是:不但要让学生掌握统计学专业各门课程中的传统方法,以及机器学习中已有的工具,而且要让他们深入理解机器学习方法中的各种统计学原理,掌握统计学课程中传统方法与机器学习之间的重要联系,能够在创新统计学方法的同时,运用统计学知识创新机器学习的模型和算法。即智能化时代下研究生统计学专业教学目标是把统计学专业的研究生培养成为推动统计学以及人工智能发展的重要力量。
二 智能化时代研究生统计学专业教学内容改革
为了实现上述智能化时代的教学目标,接下来进一步探讨研究生统计学专业各门课程教学内容的改革。目前高校研究生统计学专业课程设置中,虽然大多已经开设机器学习课程,但它与传统的各门统计学专业核心课程是分开单独设立的,甚至可能将它当作计算机类的一门课程在讲授,注重的是已有算法的运用,而不是将它与统计学专业各门核心课程教学内容融合在一起,深入讲授机器学习中的各种统计学原理,将机器学习中相关方法与各门传统课程中的方法进行结合和比较[10-11]。这样,学生很可能不能领悟到机器学习与统计学专业各门课程之间深刻的联系,不能从根本上掌握机器学习方法,以及各门统计学专业课程智能化时代下的重要发展方向,更不能灵活地创造新模型、新方法。因而,智能化时代下研究生统计学专业课程教学内容改革,需要将各门研究生课程教学内容与机器学习进行深度融合。下面初步探讨教学内容改革的框架和实施方案,抛砖引玉。
(一) 教学内容改革的框架
这里我们提出的教学内容改革的框架是:将机器学习中与统计学相关的方法,分别深入融合到研究生统计学专业的各门课程教学内容中,即将机器学习结合到统计学各门课程中一起讲解和应用。研究生统计学专业核心课程通常包括高等概率论、多元统计分析、时间序列分析等[12]。例如,可以将一些数据特征的选择或者提取的机器学习方法,结合到研究生多元统计分析课程;可以将隐马尔可夫模型、循环神经网络等机器学习方法,结合到研究生时间序列分析课程等等。