人工智能时代应用回归分析课程建设与教学方法探索

作者: 李会琼 陈黎 唐年胜 蒋茹仙

摘  要:人工智能技术的发展正推动着数据分析方法和应用场景的快速变化。应用回归分析课程作为数据科学教育的基础课之一,面临课程建设和教学方法更新的需求,以适应智能化的学习需求。该文从课程内容调整、教学方法、跨学科融合等多个角度,探讨在人工智能时代下如何构建一个更具时代适应性和前瞻性的课程体系,并提出一系列教学改革建议,旨在提升学生对回归分析方法在实际场景中的理解和应用能力,为培养未来数据科学和人工智能领域的专业人才提供坚实的教育支持。

关键词:人工智能;回归分析;课程建设;教学方法;改革建议

中图分类号:G642      文献标志码:A          文章编号:2096-000X(2025)11-0057-04

Abstract: The advancement of artificial intelligence technology is driving rapid changes in data analysis methods and application scenarios. As one of the basic courses of data science education, the course Applied Regression Analysis is facing the needs of curriculum construction and updating of teaching methods to accommodate intelligent learning requirements. This paper explores how to construct a more adaptability and foresight curriculum system in the era of artificial intelligence, addressing aspects such as course content adjustment, teaching methods, assessment systems, interdisciplinary integration, and technological updates. It also puts forward a series of teaching reform suggestions aimed at enhancing students' understanding and application of regression analysis methods in practical scenarios, thereby providing solid educational support for training future professionals in data science and artificial intelligence.

Keywords: artificial Intelligence; regression analysis; curriculum development; teaching methods; reform suggestion

人工智能时代的到来,为我们提供了前所未有的机遇和挑战。最近几年,几乎所有行业都在讨论人工智能为所在领域带来的变革与机遇。从机械时代到计算机时代,再到互联网时代,每一个时代的技术进步都在推动着社会改革的各个方面,抓住这些机遇,我们可以更好地把握人工智能时代所带来的新要求。人类已慢慢进入弱人工智能时代,开展全面的人工智能教育势不可挡[1]。由于数据类型变化多端,大数据处理技术也面临着计算时间和存储的挑战。通过将人工智能技术应用到大数据分析领域,为数据挖掘提供了一种有效的方法,实现更高效、精准的数据分析,从而成为推动社会改革和创新的重要驱动力。

应用回归分析作为统计学专业的核心课程,是一种描述变量之间的关系的统计方法,主要通过构建回归模型来研究因变量与自变量之间的关系。此课程为学生面对更复杂的数据结构和模型的分析提供了一个坚实的统计学基础。课程不仅强调深厚的理论知识推导,还涵盖了这些理论在实际生活中广泛的应用场景。在人工智能时代,回归分析因其强大的数据建模能力成为数据科学家和统计学家不可或缺的工具之一,回归分析占据着数据科学与人工智能的核心地位。

人工智能时代为高校教育带来了新的机遇,传统的应用回归分析课程建设与教学方法也面临着新的要求与挑战。一方面,教育应与时代接轨,课程内容需要与时俱进[2],将人工智能技术融入到经典回归理论教学,顺应人工智能时代发展需求调整教学内容和方法,以满足学生对现代多样化的数据分析技能的需求[3]。另一方面,教学方法也需要不断创新,传统的教学方法已无法适应新的数据环境,只有将更多的现代统计方法引入到课程内容中,才能适应学生日益增长的个性化和智能化学习需求。本文将结合应用回归分析教学过程中的课程建设和教学方法,探讨如何在传统课程的基础上,利用新的人工技术改进课程的教学方法以适应复杂数据的分析需求。

一  应用回归分析课程建设的现状与挑战

应用回归分析课程深入探讨了回归分析的理论和方法,详细介绍了一元线性回归模型与多元线性回归模型的理论和方法,以及自变量选择、模型的统计诊断、非线性回归模型等内容,是一门统计专业的学生必须牢牢掌握的课程。通过这门课程的学习能够培养学生处理和分析回归数据、理解变量间复杂关系、解决实际应用回归问题的能力。然而,在实际的教学过程中发现,课程主要注重模型参数估计的推导及公式的应用,在大数据时代的数据分析需求相对忽视。

(一)  课程建设的现状分析

在应用回归分析的教学过程中,发现课程建设过程中存在以下几个现状特征。第一是课程内容与设置,课程的内容包括简单的一元和多元线性回归、变量选择、假设检验和模型诊断等相关知识,这些内容的详细推导与证明在课程内容中都比较全面和系统。课程还涉及非线性回归和广义线性模型,但讲解的内容不够深入,无法满足学生分析复杂数据的需求。第二是教学方法与手段,目前的教学手段通常是课件展示和板书,教学模式比较单一。教学不应局限于课本,而应该拓展到课外知识和实践应用,若教师缺乏教学内容的更新意识,那么将会导致学生在面对大数据集分析时,缺乏在实践中解决数据处理、模型选择、优化模型等问题的能力。第三是教材与资源,大多数高校使用的课本采用经典的回归分析教材,内容覆盖了基础的经典理论知识,但大多数教材更新速度慢,不能及时纳入现代统计分析方法来应对多样化的数据分析,导致学生的学习内容与时代需求脱节,无法满足学生在大数据和人工智能背景下的应用需求。

(二)  人工智能时代的挑战与机遇

随着人工智能技术的蓬勃发展,传统的应用回归分析课程的建设面临着新的挑战,同时也为课程建设的改革创新带来了发展的机遇。

理论与实践的融合是主要的挑战之一,在人工智能时代背景下,大数据分析技术与时俱进,传统的回归分析方法也需要不断的更新。课程的教学不仅需要传授传统的理论知识,还要嵌入现代主流的统计分析方法,并探索如何将理论与实践有效的结合,使学生在掌握理论的基础上又具备实践分析的能力。课程内容的更新压力是另一个挑战,大数据时代的数据环境错综复杂,传统的线性回归、非线性回归模型已经无法适用于复杂的数据环境中,这就要求课程需要不断地引入人工智能时代下新的数据分析方法。同时,面临的挑战还包括多学科知识的融合需求,人工智能因在各个领域应用广泛,促进了学科交叉的机会,回归分析课程需要在扎实的统计学基础上增加一些计算机科学知识,有助于提高学生数据处理和算法实现的技能,传统的课程不涉及学科的交叉,不能很好地适应现代数据分析需求。

人工智能时代为回归分析带来挑战的同时也带来了许多机遇,促进了传统回归方法的发展,适应时代发展的潮流,关于人工智能的学习工具和软件在教育领域已有所运用[4]。首先,人工智能技术为回归分析提供了强大的算法,这些技术能极大地提高回归分析的准确率和效率。其次,在这个多模态数据的背景下,高维数据和非线性关系的数据是常见的,传统的回归课程主要涉及低维线性模型,这就使得我们必须引入大数据分析处理技术来顺应时代的发展。人工智能技术如深度学习网络,擅长捕捉非线性与复杂关系的能力,使得回归分析能够更准确地反映真实世界的动态变化。最后,借助分布式计算和GPU加速技术,回归分析能快速处理和分析大规模数据集,满足大数据时代对时效性的需求。更重要的是,人工智能技术能够融合多源异构数据,实现个性化与定制化服务,为各行业提供了更精准和高效的数据分析解决方案。这些机遇不仅推动了回归分析技术的进步,更为数字化转型和智能化升级提供了强有力的支持[5]。

二  人工智能时代下应用回归分析课程内容的调整策略

在人工智能技术迅猛发展的背景下,应用回归分析课程的内容需要适应现代数据分析需求。虽然知识可以被人工智能时代下的大模型记忆,但人类的思维和智慧是人工智能技术无法代替的[6]。传统的课程内容以理论为主,主要集中于线性模型,对于高维、非结构化、多样化的数据类型,传统方法难以满足需求。因此,课程内容的更新与调整显得尤为重要,在人工智能时代下优化应用回归分析课程的策略主要分为以下三个方面。

(一)  现代回归分析方法的引入

人工智能的发展途径可以归纳为三类:机器学习、深度学习、强化学习,三者的区别在于学习方式和应用场景,前两个的学习方式是通过监督和无监督方式进行模型训练,强化学习是通过试错和奖励机制进行智能决策。传统的回归方法已不再适用于多模态的数据结构,而现代统计方法的快速发展为高维数据、非结构化数据提供了一定的参考思路和理论依据。

机器学习的回归方法包括支持向量机回归、随机森林回归和决策树回归等,支持向量机适合处理高维数据和复杂的非线性关系,在小样本数据集上表现良好,因此在小样本高维复杂非线性关系数据的预测任务中应用广泛。深度学习的核心是神经网络,它是一种受人脑神经元启发的模型,通过多个隐藏层和神经元之间的连接来进行回归。神经网络模型能够进行分布式并行信息处理的算法数学模型,通过内部大量节点之间的相互连接关系,从而达到处理信息的目的,并具有自学习和自适应的能力。在课程教学的过程中,适当引入人工智能技术,既帮助学生了解了处理复杂数据的方法,又扩展了学生的思维能力。

(二)  加强数据预处理与特征工程内容

在实际的数据分析之前,数据的清洗与特征工程的选择至关重要。数据清洗的常见步骤包括缺失值的处理、异常值的检测、数据标准化等,在传统课程中,建立线性回归模型之前只通过相关系数矩阵来检测变量间是否存在线性关系,而忽略了数据预处理的步骤,导致学生在应对实际数据建模的过程中缺乏数据清洗的经验。特征工程的选择是提高模型预测精度的关键步骤,在海量高维数据分析中,高维数据的稀疏性导致仅部分变量起作用,而忽略特征稀疏性可能导致统计推断偏差,所以选择符合模型的特征能有效提高模型性能。

许多机器学习算法不能直接处理包含缺失值的数据集,常见的缺失值的处理方法有删除缺失值、插值方法、基于矩阵分解的方法等,每种方法都有其优缺点,适用于不同的数据集和不同的任务。在实际应用中,需要尝试多种方法根据不同的模型性能来选择最佳处理方法。常见的异常值检测方法有基于分布的检测(如基于正态分布的检验、基于四分位距的箱线图、Grubbs假设检验等)、基于距离的方法检测(如KNN距离)、基于密度的方法等。

对于特征工程的选择,要求我们既要选取对因变量有重要影响的因素,又要避免遗漏重要变量。在传统的回归分析教材中,介绍了几种自变量选择方法,有助于深入理解变量选择的目的和重要性。然而,传统的变量选择方法在处理高维数据、非线性关系及存在多重共线性等问题时显得力不从心。在这种情况下,这些方法可能会导致模型过于复杂、解释性差,从而影响模型的预测效果和稳定性。为了解决这些问题,机器学习领域不断探索新的变量选择的方法,Lasso回归通过在优化的目标函数中加入L1范数的正则化,实现了对自变量系数的压缩和选择,这种方法在处理高维数据时表现较好,能够有效避免多重共线性问题。除此之外,岭回归通过加入L2范数的正则化项来约束自变量系数的绝对值,防止模型过于复杂;弹性网回归则是Lasso回归和岭回归的结合体,既能处理多重共线性又能选择重要自变量;还有基于机器学习算法的特征选择方法,如随机森林、梯度提升树等。

经典小说推荐

杂志订阅