实践与理论双驱动的数据挖掘课程教学改革研究

作者: 陈美 张永清 周航

[摘 要] 在当前产教融合、科教融汇的新工科背景下,“数据挖掘与应用”作为一门学科交叉性强、行业应用领域广、理论知识丰富的课程,是提高学生工程实践与理论创新能力的良好载体。针对课程的特点和教学现状,以适应不同学生的知识储备基础、满足不同学生的未来发展需求为目标,提出从教学内容的先进性、理论教学模式的多元性、实验项目设计的多层次性以及考核评价方式的全面性四个维度进行教学改革,旨在构建一种可针对不同学生提高其工程实践能力与理论创新能力的个性化人才培养模式。

[关键词] 数据挖掘;工程实践;理论创新;产教融合;科教融汇

[基金项目] 2024年度成都信息工程大学本科教育教学研究与改革项目“工程实践与理论创新双驱动的‘数据挖掘与应用’教学改革研究与实践”(JYJG2024131);2023年度成都信息工程大学省级一流本科课程项目“计算机组成原理”(2023YLKC37);2023年度成都信息工程大学本科教育教学研究与改革项目“预防作弊行为的数据挖掘实验实践教学研究”(JYJG2023185)

[作者简介] 陈 美(1994—),女,四川成都人,博士,成都信息工程大学计算机学院副教授(通信作者),主要从事机器学习、数据挖掘研究;张永清(1985—),男,江西赣州人,博士,成都信息工程大学计算机学院教授,主要从事人工智能、数据挖掘研究;周 航(1991 —),男,四川乐山人,博士,成都信息工程大学计算机学院讲师,主要从事机器学习和图像处理研究。

[中图分类号] G642.0 [文献标识码] A [文章编号] 1674-9324(2025)11-0077-04 [收稿日期] 2024-03-29

引言

在大数据的时代浪潮中,数据已从单纯的数字化信息转变成国家和全球经济社会竞争的核心要素。合理且高效地利用数据资源,使其为企业发展、社会进步提供动力,是当前时代对科技、教育乃至政策制定者的必然要求。数据挖掘技术作为大数据处理的核心手段,近年来取得了飞速的发展,并逐渐成为推动大数据行业前进的重要动力[1]。几乎所有的大数据分析都依赖于数据挖掘技术从海量数据中提取有价值的信息[2]。

“数据挖掘与应用”作为一门学科交叉性强、行业应用领域广、理论知识丰富的课程,是提高计算机相关专业学生工程实践与理论创新能力的良好载体。在“双创”人才、产教融合、科教融汇等新工科人才培养新模式背景下,有必要开展工程实践与理论创新双驱动的“数据挖掘与应用”课程教学改革研究,以就业市场需求和科学研究需求为导向,一方面,针对未来重点产业发展的新趋势和新要求,着重培养学生的动手实践能力,使学生能够将理论知识与实际工作相结合,提高解决实际问题的能力,为产业界输送高素质的应用型人才;另一方面,面向科技创新发展的新趋势和新要求,着重培养学生的科学理论创新能力,激发学生的创新思维和学术探索精神,为学术界输送中高端的创新型人才。

一、“数据挖掘与应用”教学现状

(一)课程基本信息

“数据挖掘与应用”是成都信息工程大学面向计算机科学与技术、智能科学与技术专业三年级本科生开设的一门专业选修课程。该课程是一门综合性的多学科交叉课程,以数据挖掘的算法和应用为主要内容,包括数据挖掘导论、数据预处理方法,以及关联分析、分类、聚类、回归四个数据挖掘领域的主要思想、算法和适用范围。

(二)目前存在的问题

“数据挖掘与应用”课程具有知识点繁多、算法推导复杂、课程总学时较少等特点。传统的高等教育模式以知识型人才培养为首要目标,重视理论教学的核心地位,忽视了学生实践能力和创新精神的培养[3]。在这种教学模式下,学生普遍能够熟记理论知识,但难以将其应用于实际场景中。成都信息工程大学自2021年首次开设本门课程以来,经过几年的教学实践和教学反馈,课程教学团队发现该课程教学主要存在以下问题。

1.案例资源匮乏。理论知识的传授固然重要,但结合实际案例开展教学能够帮助学生更好地理解和应用所学知识。在当前课程中,真实的、与实际应用紧密相关的案例资源相对匮乏,导致学生难以将理论知识与实际场景相结合,限制了其工程实践能力的培养。

2.教学内容与行业需求脱节。随着大数据和人工智能技术的快速发展,数据挖掘在实际应用中的需求也在不断变化。然而,当前的教学内容未能及时跟上这些变化,导致学生学到的知识和技能与行业实际需求存在一定程度的脱节。

3.缺乏开展针对不同学生需求的差异化教学。当前的课程设置未能针对学生的实际需求和能力差异进行个性化教学。不同学生的背景、兴趣和能力各异,对于课程的需求和期望也有所不同。在传授基础理论知识的基础上,应对不同毕业走向的学生开展针对性的能力培养。例如,对于计划进入企业就业的学生,应更注重培养其工程实践能力和实际操作技能,而对于计划继续读研深造的学生,则应更注重培养其理论创新能力和学术研究能力。

二、“数据挖掘与应用”教学改革

在产教融合、科教融汇的新工科背景下,针对“数据挖掘与应用”课程的特点和教学现状,以适应不同学生的知识储备基础、满足不同学生的未来发展意愿为目标,从提高学生工程实践能力与理论创新能力的人才培养模式角度出发,笔者提出从教学内容的先进性、理论教学模式的多元性、实验项目设计的多层次性以及考核评价方式的全面性四个维度进行教学改革。

(一)保持教学内容的先进性

“数据挖掘与应用”作为一门新兴且前沿的课程,其课程内容、方法和技术持续发展并演变。为确保教学内容的先进性,可采取以下措施。

1.跟踪技术前沿。教师须密切关注数据挖掘领域的新技术进展,定期更新和扩充教学内容,包括引入新的算法、工具和技术,确保学生能够紧跟数据挖掘领域的新趋势,掌握前沿知识和技能。

2.建立教学内容主线。在不断发展的新技术与相对稳定的教材之间,教师须寻找并建立一条贯穿整个教学内容的主线,合理设计教学大纲,以确保教学内容的连贯性和系统性,帮助学生理解数据挖掘的内在逻辑和体系结构,使学生能够更好地掌握各个知识点并形成整体认识。

3.跨学科融合。加强与其他相关学科的交叉融合,如计算机视觉、自然语言处理等,以拓展数据挖掘的应用领域和技术范围,为学生提供更广泛的学习和发展机会。

(二)开展理论创新的多元化教学模式

针对当前教学中理论创新意识的缺乏,尝试通过多元化教学模式激发学生的创新思维,突出理论教学方法的高阶性和创新性,从以下三个方面进行改革。

1.教学内容的层次化处理。根据教学内容的难易程度将其划分为基础和进阶两个层次。如在聚类算法中,针对基础内容,强调聚类算法的原理性,确保学生扎实掌握。针对进阶内容,引入前沿理论拓展知识,如基于密度的聚类、谱聚类、模糊聚类等,扩展学生的知识视野,激发学生对聚类算法研究的兴趣。

2.问题驱动的教学策略。讲授过程应以学生为中心,通过引导学生主动学习和探究式学习,激发其学习兴趣和主动性,培养他们的创新思维和实践能力。如在讲解关联规则挖掘算法时,可采取以下教学策略。

一是引入实际问题:选择具有实际背景的关联规则挖掘问题,例如超市的购物篮分析或网页推荐系统,引导学生思考如何运用关联规则挖掘算法解决这些问题。通过解决实际问题,学生能够更加深入地理解关联规则挖掘算法的应用价值和重要性。二是开放性问题:设计一些开放性的关联规则挖掘问题,例如数据量庞大导致关联规则挖掘效率低下的问题,让学生思考如何优化算法性能以提高挖掘效率,鼓励学生自由发挥想象力和创造力,提出解决方案,以激发学生的探究精神和创新思维,培养他们独立思考和解决问题的能力。三是引导学生分析问题:在提出问题之后,引导学生分析问题的本质和关键点,帮助他们理解关联规则挖掘算法的基本原理和适用场景。通过分析问题,学生能够更好地理解关联规则挖掘算法的内在逻辑和思想,提高其学习效果和思维能力。四是团队合作解决问题:组织学生进行团队合作,共同探讨解决问题的方案。通过团队讨论和协作,学生可以互相启发和帮助,共同进步。同时,团队合作能够培养学生的沟通能力和协作精神,提高他们的综合素质。

3.科研嵌入的教学方法。教师可将科研成果有机地融入教学中,采用科研嵌入的教学模式。鼓励学生自主探索和研究数据挖掘领域的前沿问题,提供一些基础科研项目供学生选择,或支持学生自行申报和参与相关课题的研究,或鼓励学生撰写学术论文和参加学术竞赛等,以提升学生的学术水平和创新能力。同时,加强业界合作与交流,邀请数据挖掘领域国内外知名专家和学者来校授课或举办学术讲座,为学生提供与行业接轨的机会,让学生接触到前沿的学术研究动态和新理论成果,了解实际应用中的需求和挑战。

(三)实施实验项目设计的多层次教学模式

实验教学是“数据挖掘与应用”课程中不可或缺的环节,旨在使学生能够将理论知识与实际应用相结合,通过实践操作深入理解数据挖掘的原理和算法,并提升解决实际问题的能力。当前,上机实验主要聚焦如Apriori、决策树、K-means等经典算法的实现。然而,考虑到“数据挖掘与应用”课程的工程应用特性,仅通过这些算法验证实验,学生可能无法充分体验到数据挖掘的实际应用价值。因此,尝试通过实验项目设计的多层次教学模式[4],增加综合型和创新研究型的实验,培养学生的基础掌握能力、工程应用能力及创新探索能力。

首先,针对分类、聚类、回归和关联规则挖掘这四大核心数据挖掘任务,分别设计一个具有代表性的基础算法验证型实验,帮助学生通过实践操作更深入地理解所学算法的工作原理,并提升他们在基础算法实现方面的能力。

其次,结合工程实际应用,设计一个综合性较强的实验,例如住房租金预测系统。该综合型实验要求学生完成从数据收集、数据预处理、特征选择到整个系统实现的全流程,培养学生综合运用所学理论知识解决实际问题的工程实践能力,并让学生亲身体验到数据挖掘技术在解决实际问题中的价值和意义。

最后,结合科研项目,设计一个涵盖理论创新算法的实验,例如铁路钢轨扣件损伤识别算法。该创新型实验有助于学生探索新的算法和技术,培养学生的创新能力,尤其对未来致力于从事科学研究的学生有极大帮助。

学生可以根据自己的兴趣和研究方向,从上述三种实验类型中选择两种进行实践。例如:对于计划进入企业就业的学生,推荐选择算法验证型实验和综合型实验,以提升他们在实际工作中的应用能力;而对于计划继续读研深造的学生,则推荐选择算法验证型实验和理论创新型实验,以提升他们的科研创新能力。

(四)建立多元考核联合教学评价体系

当前,“数据挖掘与应用”课程考核方式存在一定的局限性,以期末考核和平时成绩为主,方式较为单一。这种考核方式较难全面反映学生掌握和应用知识的水平,更无法准确评估学生是否已具备分析和解决问题的能力。

为了更全面、有效、客观地评估学生的学习成果,可构建一个基于多目标(知识目标、能力目标、价值目标),多主体(学生自评、生生互评、教师评价),多方式(定量与定性相结合、形成性与结果性相结合)的多元考核联合教学评价体系[5]。具体从以下三个方面展开。

1.多目标考核:除了传统的知识目标外,加入能力目标和价值目标。其中,能力目标重点考查学生的实践操作能力、问题解决能力和创新能力;价值目标则关注学生的团队协作能力、沟通交流能力和职业道德等方面的素养。

2.多主体参与:评价主体包括学生自评、生生互评和教师评价。学生自评有助于培养学生的自我反思和自我管理能力;生生互评可以提高学生的团队协作能力和沟通技巧;教师评价则可为学生提供专业的指导和发展建议。

经典小说推荐

杂志订阅