网络空间安全学科研究生智能课程实战化教学研究
作者: 郑敬华 许成喜 沈毅[摘 要] 军校研究生是高层次人才的主力军,其能力素质将直接影响高科技武器装备效能的发挥和战斗力生成。在实施“智能+”改造人才培养目标的背景下,如何培养高素质新型军事人才成为众多军事高校研究的重点。以国防科技大学网络空间安全学科研究生课程“机器学习理论及应用”为例,讨论实战化教学改革方案,提出“紧耦合、贴实战、谋减负、重创新”的教学理念,设计一套教学资源合理运用的教学方法,为培养具有较强实践能力、综合分析能力和创新能力的高素质新型军事人才提供新的教学思路。
[关键词] BOPPPS模型;实战化教学;教学设计;机器学习
[作者简介] 郑敬华(1976—),女,河北衡水人,博士,国防科技大学电子对抗学院副教授,主要从事网络安全研究;许成喜(1989—),男,安徽潜山人,博士,国防科技大学电子对抗学院讲师,主要从事网络安全研究;沈 毅(1985—),男,重庆人,硕士,国防科技大学电子对抗学院副教授,主要从事网络安全研究。
[中图分类号] G643.0 [文献标识码] A [文章编号] 1674-9324(2024)33-0001-04 [收稿日期] 2023-06-20
军校研究生不仅需要具备扎实的理论基础和专业知识,还需要较强的实践能力、综合分析能力和创新能力,其能力素质直接影响高科技武器装备效能的发挥和战斗力生成。在突出专业特色,实施“智能+”改造的人才培养目标背景下,如何培养高素质新型军事人才成为众多军校重点研究内容[1]。本文以国防科技大学网络空间安全学科研究生智能课程“机器学习理论及应用”为例,针对以往教学过程中发现的问题和不足,瞄准教育部推动实施的一流课程建设目标,围绕培养实战型网络空间安全人才,充分利用线上教育环境和资源,结合线下课程教学,探索一条切实可行、行之有效的实战化教学模式,旨在培养具有较强科研创新能力的高素质军事人才。
一、机器学习类课程特点及现状分析
(一)国内外高校的课程设置情况
目前,国内外诸多高校都将机器学习类课程作为学科的核心课程。密歇根大学的ECE教师团队提供了十多种机器学习类课程,用于解决不同领域的实际问题,同时其物理和计算系统方面的专业知识也增加了机器学习方面所需的数学基础内容,还定期进行一些专题讲座。斯坦福大学强调让学生具备必要的技能,同时要求任何技能都能够面临现实随机性的挑战。其成立的人工智能实验室,采用沙龙模式,定期组织全议案讨论,同时辅以Blog形式将讨论内容共享,借以拓宽参与者的视野并激发其研究灵感,重视学生将知识内化于心的理念,强调知识的实际应用。2014年吴恩达带领的机器学习小组将机器学习类课程视频上传到网易公开课,面向全球人工智能领域开放,这是最早的一批关于机器学习的在线开放课程,随后陆续有不同院校教师的MOOC或者SPOC等在线课程在网上共享。清华大学、北京大学等国内一流大学也在积极进行教育教学改革,学堂在线、中国大学MOOC等平台集中了许多优秀教师的在线课程,Educoder实训平台、UClass智慧教学平台、智慧教室等教学平台陆续上线,各大院校纷纷借助教学平台丰富自身教学模式和教学资源,既开阔了学生的视野,也在教学上取得了一定成效。
“机器学习理论及应用”是我校网络空间安全学科研究生的专业核心课程,课程理论与实践紧密结合,涵盖了目前机器学习中各种最实用的理论和算法,包括神经网络、贝叶斯学习、优化算法、深度学习和强化学习等内容,课程目标是培养学生逻辑思维能力和运用机器学习算法解决网络空间安全领域实际问题的能力。
(二)我校教学中存在的问题
1.课程与网络空间安全结合不够紧密。网络空间安全学科中面临的复杂场景和海量数据需要采用机器学习等智能化方法来处理和分析,网络空间安全技术的发展趋势也必将是自动化和智能化。然而,传统的机器学习类课程主要涉及机器学习基本的理论和算法,在教学内容上与网络空间安全学科结合不够紧密,军事元素不浓,致使学员网络空间安全的智能化研究能力及在网络空间安全智能化处理方面的能力较弱。
2.传统的机器学习类课程重理论、轻实战,缺乏领域相关知识数据,学员实践机会偏少。传统的机器学习类课程重点关注理论教学,在课程内容上主要以决策树、聚类算法、支持向量机等传统理论算法为主,忽略了学员在实际场景中如何实现与应用机器学习算法的指导,导致学员对机器学习理论方法的掌握浮于表面。而网络空间安全学科中所面临的复杂安全分析问题,如网络攻防、流量分析、程序分析、口令安全、漏洞分析等场景下的机器学习应用问题仍难以解决。
3.机器学习理论对数理基础要求高,课程学习压力大,部分学员欠缺学习兴趣。机器学习理论涉及大量的数理知识,包括微积分、线性代数、概率论、凸优化理论等。传统的机器学习类课程对学员的数理基础有较高的要求,课程内容包含了大量的公式推导与证明分析。而网络空间安全专业的基础课大多与计算机专业相关,学员的数理基础较为薄弱。因此,目前的机器学习类课程内容对于网络空间安全专业的学员来说难度较大,导致学员难以深入和全面掌握相关理论。
4.教学模式单一,教学资源配置不够合理,教学效能受到制约,导致学员综合分析和创新能力不足。传统的机器学习类课程存在教学模式单一、教学资源配置不够合理等问题。在教学模式方面,以教师在课堂讲授相关知识为主。首先,这种单一的教学模式会导致学员在课堂上难以及时和深入地掌握相关知识。其次,单一的教学模式不适用于不同学习能力和不同研究方向的学员。在教学资源方面,目前的机器学习相关教学资源多种多样,质量参差不齐,因此学员容易陷入教学资源选择的问题中。
二、面向网络空间安全领域的实战化教学设计
机器学习类课程本身就具有极高的应用实践价值,且课程组拥有大量的科研项目,学员也具备一些人工智能大赛的比赛项目经验。基于这些基础条件,课程组经过充分调研,实施了“紧耦合、重实战、谋减负、提效能”机器学习类课程实战化教学研究,围绕培养实战型网络空间安全人才,将实战场景与领域前沿技术充分融入教学课堂,构建涵盖基础理论、案例研究、综合实践等教学内容,创新“问题引导、知识剪裁、思维启发”的减负式教学,有效提升了机器学习类课程的教学效果。
(一)“机器学习理论与实践”课程实战化教学设计
1.紧跟前沿,以实际科研项目为导向,通过知识植入与支架式教学方式,定制教学内容,增强智能课程中的军事元素。从机器学习模型的数据处理到模型选择,都源于实际承担的科研项目,基于实际问题,引导学员建立解决问题的思维,既能锻炼学员对机器学习算法理论的深刻理解,又能强化其工程实践及创新能力。同时,通过拓展资料搭建思维发展的阶梯,使学有余力的学员达到新的高度。
2.依托承研的科研项目,收集整理大量网络空间安全领域真实数据,以任务驱动完成课程教学,增加网络安全智能化实践机会。学校承研或参与来自多渠道的多项科研任务,涵盖了网络空间测绘、异常监控等多种类型。在项目研究过程中,将大量真实数据进行整理汇编,学员利用所学知识通过数据挖掘和智能模型构建,大大增加了网络安全智能处理的实践机会,学员的实践能力得到了充分锻炼。
3.基于Educoder等网络实训平台,创建课程实验环境,包括实战场景、实训任务、闯关题目等,提高学员学习兴趣。对于一些烦琐复杂的公式推导过程,课程组将其上传至Educoder、雨课堂等各种线上教学平台,供有能力的学员自学。线下教学过程中,要求学员理解这部分知识的思想及实际应用,同时创建实战场景的仿真训练环境,通过布置实训任务等内容,增强学习趣味性,在潜移默化中既加深了学员对理论学习精髓的理解能力,又充分锻炼了学员的动手能力。
4.基于网络教学平台,科学整合教学视频、试题库及拓展资料等多元化教学资源,提高学员综合分析和创新能力。课程组通过网络教学平台,拓展相关领域的新发现、新应用、新模型、新工具,同时通过教学视频、试题库等内容,促进学员自主学习,拓展机器学习思维的广度和深度,提高网络空间安全智能处理技术所需的高端人才培养水平。
5.以赛代练,以赛促学,开阔视野,面向未来,全面提升网络空间安全创新型人才培养能力。机器学习类教材的知识在时效性上会落后于技术的更新速度,但知识指导实践是不会改变的。为开阔学员的视野,提高对新技术、新方法的敏感度,课程组积极组织研究生学员参加各类人工智能大赛,培养学员发现问题、解决问题的能力,使学员从被动学习转变为主动学习。在2021年第五届“强网杯”全国网络安全挑战赛的人工智能挑战赛中,国防科技大学电子对抗学院两支参赛队伍分别斩获“网络自动渗透测试”和“口令密码智能破解”两个赛道的一等奖和二等奖。
(二)教学设计案例
本文以决策树算法解决域名系统(DNS)精准版本识别任务为例,讲述“机器学习理论及应用”课程的教学设计。将BOPPPS教学模型[2]与信息化手段深度融合,以学员为中心,激发其学习兴趣,引导其享受机器学习的魅力,帮助其深刻理解算法精髓,将复杂问题简单化、抽象问题形象化,解决教学难点问题。本次课程分为课前预习、课堂实战、课后拓展三个教学阶段,课堂实战环节通过情景导入激发学员学习兴趣,通过提出问题引出决策树知识,通过探索发现、问题分析、算法改进掌握算法精髓,课后拓展阶段通过任务分配、拓展阅读强化算法应用。
课前预习阶段要求学员对于一些晦涩难懂的数理知识进行自主学习,便于线下进行知识剪裁。同时通过信息化教学平台完成相关任务,使其积累一些DNS相关知识,了解DNS面临的安全威胁,通过实际的DNS服务器遭受的诸多安全隐患,增强学员主动思考和研究问题的主动性,同时提高其学习热情。课堂教学阶段利用BOPPPS教学模型,将教学过程分解为导入、明确学习目标、前测、参与式学习、后测和总结6个阶段。
1.导入:紧跟前沿、领域耦合、面向实战,通过讲解DNS面临的多种安全威胁以及对网络安全甚至国家安全带来的影响入手,一方面引出DNS精准版本识别的意义,另一方面使学员厚植家国情怀,提高学员职业素养。例如,2014年我国境内顶级域名被重定向到美国的IP地址65.49.2.178,暴露出DNS严重的协议脆弱性;2016年10月美国网络效能管理公司Dyn所管理的DNS服务系统遭到大规模流量攻击,自此失去了8%的域名客户;2018年3月1日知名代码托管网站GitHub、2019年10月23日云服务公司AWS(Amazon Web Services)都遭遇了严重的DDoS攻击,网站功能长时间瘫痪,这些事故与域名服务器直接相关[3]。
2.明确学习目标:清晰明确描述知识目标、能力目标和情感目标,并在后续的授课过程中始终围绕各个目标引导学员有目的地学习,并将学习目标作为考核的参考依据。
3.前测:问题导入,通过发送关于DNS及决策树算法的前测习题,帮助学员掌握相关理论知识。
4.参与式学习:以问题引导—知识植入—优化设计的模式进行授课,引导学员具备使用机器学习算法解决实际问题的逻辑思维能力。问题引导环节通过讲述如何解决DNS精准版本识别问题抽象出问题描述,为知识植入打下基础;知识植入环节,通过DNS精准版本识别的总体设计、环境构建、指纹数据采集过程,一步一步引出决策树的概念、思想、建树的过程;优化设计环节,借助信息化教学平台有针对性地展示学员自己动手实现的算法,通过自主发现问题、分析问题、算法改进三个步骤引出决策树在建树过程中的常见问题,引导学员自主思考。在整个参与式学习中既培养了学员正确的思维方法、严谨的科学态度,同时激发了学员的求知欲,激励了学员的创新精神。
5.后测:通过发送关于决策树算法的习题以及DNS相关安全问题,引导学员进行交流互动,及时了解学员掌握情况,并用于教学效果反馈。
6.总结:结合学习目标进行总结,并给学员合理建议及反思教学效果。课后拓展阶段上传网络安全领域数据集,分组安排任务;推荐机器学习相关软件辅助学习,以备学有余力的学员拓展知识范围;上传网络课程等共享资源,拓展课堂知识,强化算法理解及应用,培养学员对网络安全领域知识的兴趣。