工程实践创新项目(EPIP)教学模式在“大数据分析和可视化”课程中的应用研究
作者: 崔凤梅 刘颖
摘要:文章以大数据技术专业核心课程“大数据分析和可视化”为例,探索工程实践创新项目(EPIP)教学模式改革。通过设计实施基于企业真实工程的教学项目,引导学生从项目规划、数据获取、清洗整理、分析挖掘到结果可视化全过程实践,提升学生数据分析、数据可视化及解决复杂问题等方面的能力。
关键词:工程实践创新项目(EPIP);大数据技术;教学案例
中图分类号:G712 文献标识码:A 文章编号:1672-5727(2024)08-0019-06
作者简介:崔凤梅(1974—),女,硕士,天津城市职业学院院长,副教授,研究方向为职业教育教学与管理;刘颖(1984—),女,硕士,天津城市职业学院智能科技与应用学院助教,研究方向为职业教育教学。
“大数据分析和可视化”课程,旨在使学生了解数据分析的流程、数据分析的方法、数据可视化工具,掌握运用大数据平台进行大数据分析、数据可视化设计的工作方法,提高创新实践能力。该课程具有工程实践性强的特点,在课程设计、实践教学中采取工程实践创新项目(EPIP)教学模式,以工程项目为引领,以培养学生的工程意识和创新、实践能力为目标,激发学生的学习兴趣,提高教学质量,达到预期教学效果。
一、EPIP教学模式概述
EPIP教学模式是在长期教育实践与理论研究基础上创立的具有中国特色、适合技术技能人才培养的职业教育教学模式。其内涵是工程化、实践性、创新型、项目式。EPIP是工程、实践、创新、项目四个关键元素的有机组合,是以实际工程为背景结合技术技能人才培养的中国实际而创立的,以工程实践为导向,以工程实践创新能力培养为目标,以真实工程项目为统领的技术技能人才培养的教学模式[1]。EPIP是中国职业教育理论发展成果的具体化,也是中国职业教育实践改革经验的系统化,是理念,是方法,是路径,是启示,更是探索。
EPIP以“五观、四元、三谛、两核、一宗”归纳了模式内涵。五观,即纳观(知技素点)、微观(课程论)、中观(专业论)、宏观(教育论)及达观(办学思想);四元,即四个关键元素,分别是工程化、实践性、创新型和项目式;三谛,即 EPIP的“原”实谛、“代”名谛、“衍”合谛三个境界;两核,即真实和完整两个核心;一宗,即知行合一宗旨[2]。
EPIP的本质是让“产教融合、工学结合、校企合作、知行合一”真实落地。基于职业教育的职业属性特点,需要在教学过程中充分开发学生的实践能力,因此,在专业课程的教学中就不能脱离实践。传统的理论与实践分离的教学模式虽然理论体系严谨、统一、紧凑,但缺乏了将实践作为教学过程主体的宗旨。EPIP教学模式突出理论与实践的结合,将实践应用上升为教学过程的主体,同时又不缺乏理论知识的贯穿,所以是适合职业教育的教学模式。
二、基于EPIP的课程教学设计
“大数据分析和可视化”课程,依托真实工程项目,运用数据分析方法与数据可视化技术,对获得的数据进行综合分析,解决实际问题,使学生认识数据思维的本质,将应用信息的能力转变为一种基本技能。这些能力要通过不断实践才能融会贯通,因此,本课程以大数据分析和可视化应用为主线,运用EPIP教学模式中的“四元”核心要素,进行EPIP教学模式的教学设计。
(一)工程化重构课程体系
EPIP工程化的核心要义是生活化、生产化、现实化及社会化。“大数据分析和可视化”课程中的工程化,是与天津开发区中软卓越信息技术有限公司、紫光云技术有限公司等公司合作,将大数据应用开发、大数据分析与挖掘、数据可视化与画像、大数据决策与应用等工作岗位的实际工程转化为教学项目,抽取形成基于真实场景的大量数据进行课程教学。通过该课程的学习,学生将掌握在大数据管理、分析、运维、可视化中遇到问题的解决方法,获得数据工程师、数据分析师等岗位所需的工作技能。如图1所示。
(二)项目式设计课程内容
EPIP的项目化是指将教学内容以实际项目的形式进行组织和实施,培养学生的实践能力和解决实际问题的能力。结合大数据技术专业特征,教师团队根据知识要素,按照数据量和数据结构的复杂程度,由少至多、由浅至深设计了五个综合项目:高职学生学情分析、天津意式风情区游客特征分析、电商平台订单数据分析、股票数据分析及K线图绘制、银行用户画像大数据分析(如图2所示)。学生需要参与到每个项目开发的完整周期中,全面掌握大数据分析的基本框架,形成一定的大数据分析能力。
(三)实践性实施实训过程
本课程按照企业完成数据分析工程项目的实际过程,即环境搭建、数据获取、数据处理、数据分析、数据可视化,实施课程教学任务。环境搭建,即搭建项目实施需要的环境,如Hadoop和相关组件的获取与安装。数据获取,即通过网络爬虫、网站下载等方法获取数据集。数据处理,即通过Pandas、NumPy等工具将其“清洗”干净。因为有大量诸如重复数据、空白数据、无意义数据等类型的“脏”数据存在,故拿到的数据一般不能直接使用。数据分析,即将看上去毫无规律、杂乱无章的数据,利用Python总结出规律和趋势。数据可视化,即将分析结果通过折线图、散点图、热力图等具有可视化效果的图形展示出来。
通过以上5个步骤,教师引导学生进行数据处理,学生通过具体实践操作能够更清晰透彻地理解和掌握数据处理与分析的方法,提高处理真实工程项目的能力。
(四)创新型设计教学过程
本课程设计主要体现了EPIP教学模式中“一强二引三融合”的创新型特点。一强,即强化机器学习和数据科学的内容,包括如何使用Hadoop进行数据清洗、特征工程、模型训练等,使学生能够更好地理解大数据与机器学习之间的关系。二引,即引入实时数据处理,如流处理、实时分析等,使学生能够掌握实时数据处理的工具和技术;引入最新技术趋势,如数据湖、数据编织等,使学生能够紧跟技术发展的步伐,掌握最新的大数据技术和应用。三融合,即混合式教学融合,在教学活动中采用“三段式”全程导学教学模式,通过课前、课中、课后任务式引导让学生亲自动手实践,加深对课程内容的理解和掌握;跨界创新融合,将大数据与金融行业、房地产行业、旅游行业等跨界融合,创新课程内容,拓宽学生的知识面和视野;个性化教学创新融合,针对不同学生的需求和兴趣,提供个性化的教学内容和方式。使用EPIP教学模式,通过“一强二引三融合”给予学生更多的实践机会,提高学生的学习兴趣与积极性。
三、EPIP教学模式课程教学实践
金融行业是大数据的重要应用领域之一,而银行用户画像的大数据分析是其中的一个重要应用场景。银行用户画像就是通过对用户行为、偏好、风险承受力等多维度数据进行分析,帮助银行更好地了解客户,为用户提供个性化的金融服务,增强用户粘性和满意度。本项目以真实的银行用户画像大数据分析系统的开发环境为依托,以实训项目流程为引导,以培养数据分析能力为目标,以系统开发为项目式统筹,从工程认知,到工程实践,再到自主创新,实现从简单到复杂、从单项到综合的技能训练模式,促进学生“知技素”的提升,培养学生发现问题、分析问题、解决问题、勇敢实践、追求卓越的创新能力及团队合作、爱岗敬业、努力进取、精益求精的职业精神。
(一)工程化场景设计
用户画像的本质就是从业务角度出发对用户进行分析,了解用户需求,寻找目标客户;同时也是金融企业利用统计的信息,开发适合目标客户的产品。银行用户画像大数据分析系统可以针对用户特点为用户推荐或定制适合的产品,满足用户的储蓄、理财的需求。利用用户基本属性、支付偏好、消费情况数据对用户情况进行数据处理,描绘用户基本情况,实现用户价值分析。
(二)实践性引导实施
在本课程的教学设计中,融入了银行用户画像大数据分析系统的开发,将项目实施流程重构为系统概况、开发准备、数据存储、数据分析、数据处理、数据管理、数据迁移、项目总结、项目扩展等9个连续性子项目、35个任务,实现实践性引导。
在课程实施过程中,通过“系统概况”引出本项目的总体任务,包括银行用户画像大数据分析系统项目背景、系统功能、系统技术需求等;按照大数据平台搭建—数据存储—数据分析—数据管理—数据迁移的顺序完成项目实施的全周期,全面涵盖了数据分析技术所需的核心知识与实践技能,其中项目数据引用了银行用户数据集,力求实现与真实项目对接;“项目总结”是对银行用户画像大数据分析系统项目进行总结,并做出可视化展示。在“项目扩展”环节,因为在前期的项目实施过程中使用的是Hadoop+Hive的框架处理离线的银行用户数据,通过编写MapReduce可以批量画出用户画像,得出用户的基本属性、支付偏好、消费习惯等,但离线数据必然产生数据的滞后,影响分析效果,而实际上银行每天都会产生实时数据流,这样Hadoop+Hive就无法满足需求,因此,在此环节向学生拓展出流数据处理技术Spark,作为课程内容的升级。
(三)创新型人才培养
本项目以数据分析和可视化技能训练为目标,每个任务均设置工作情境,提出具体问题启发学生思考,激发学生对大数据技术的兴趣和创造性思维,引导学生去探索和尝试。例如,利用MapReduce对银行用户数据进行统计时,以区域消费汇总为案例,帮助学生理解MapReduce分布式计算模式,再结合“递进式”实践教学体系,鼓励学生将技术举一反三、融会贯通,延伸出其他属性的用户数据汇总,提高学生创新精神和实践能力。
(四)项目式统筹
整个银行用户画像大数据分析系统项目的设计,采用“做中学、学中做”的工程方法培养学生,注重项目整体的完整性,设置“1+1+1+1”的能力模块(即:一期一项目,一课一汇报),注重培养学生解决实际工程问题的能力。同时,针对每个子项目与任务,认真梳理思政融入点,实现思政教育与专业教育有机融合。从爱国情怀、工匠精神、团队精神、创新精神、职业道德、国际视野等方面,让学生体会合作学习、社会担当和家国使命,领会大数据技术专业的学科精神和创新意识,构建良好的课程生态。
四、银行用户画像大数据分析系统的实施
银行用户画像大数据分析系统是“大数据分析和可视化”课程的一个重点实训项目。教学实施过程中,应用 EPIP 教学模式,实行校企双导师模式,充分利用校企共建的课程资源、实训平台、真实项目数据集进行授课,拓展智慧职教、新媒体等平台资源做课后知识补充。采用“三段式”全程导学,通过课前、课中、课后任务式教学方式,加深学生对课程内容的理解和掌握。
(一)课前
课前,学生完成复习和预习任务。首先,学生通过教学平台闯关习题,完成银行用户画像大数据分析系统项目中所需的前导知识点和技能点的复习,做到温故。知识点包括NumPy基本操作、Pandas排序、数据清洗、基于树模型的特征选取、折线图热力图等图表可视化等。其次,教师将相关资料上传至教学平台,并发布预习任务单,包含本项目教学目标、学习方法指导、预习任务等内容,做到知新。最后,学生通过预习了解银行用户画像大数据分析系统项目相关的知识和学习要求,完成教师发布的摸底测试,通过闯关活动与测试,发现自身欠缺的知识,加强相关知识的复习。教师可从后台监测学生的复习和预习情况,对数据进行客观分析,掌握学生课前学习动向,及时调整教学策略。
(二)课中
围绕教学重点难点,将课中环节划分为情景导入—项目分析—分组实训—多元评价—巩固训练—课程总结六个部分。
1.情景导入
通过情景动画创设工作情境,以问题为导向,把解决金融产品广告投放、精准营销、个性化推荐、用户分析、产品优化等实际问题作为银行用户画像大数据分析系统数据处理的突破口,引导学生理解课程的实践意义。
2.项目分析
教师采用教授法讲解银行用户画像大数据分析系统项目开发的完整流程,包括开发准备、数据存储、数据分析、数据处理、数据管理、数据迁移等过程,并对实现数据可视化的方法进行讲解。学生根据教师讲解的内容,系统整理开发流程、规划项目设计。此阶段旨在培养学生的自我学习能力及分析问题能力,使其更好地掌握知识、发现规律,并在实践中不断提升综合素质。
3.分组实训
对学生进行分组实训,每个小组选取一个负责人,负责组织成员集体讨论、整理意见、制定整体实施方案、对项目实施进行部署等。负责人可采取轮流制,以充分调动学生的积极性。学生根据分工独立完成各自的任务,并对个人任务进行总结,再由负责人进行整理,形成一份完整的项目总结报告。