走向国际共识的中小学AI教育

作者: 谢作如 毛勇 郑子杰

走向国际共识的中小学AI教育0

编者按:因为翻译的问题,“智能”“智慧”和“Intelligence”“Smart”这几个名词往往是混用的,如“智慧校园”对应的单词是“Smart School”,“智慧社会”则对应“Intelligent Society”。“智能教育”是指人工智能教育还是智慧教育?“智能设备”是指人工智能设备还是电脑类设备?语义的混淆给人工智能教育的内容和目标界定带来了困扰,也造成了“泛人工智能教育”(指把人工智能教育的边界泛化到机器人、编程、物联网等)的尴尬。那么,国际上对人工智能教育的认识和定位是怎么样的?中小学人工智能教育如何走出“泛人工智能教育”的误区并走向国际共识?本期对话邀请了温州科技高中的特级教师谢作如、清华大学毛勇博士和北京十一学校郑子杰老师,他们将围绕“国际共识”展开讨论。

算力、数据和算法是中小学AI教育的核心

谢作如:“算力、数据和算法是推动新一代人工智能发展的三驾马车”,这句话对很多人来说已经是常识,随处都能看到。我查过资料,关于“算力、数据和算法”的表述在2017版的高中信息技术课标中并没有出现,但在2022年发布的义务教育信息科技课程标准中出现了,原文为“了解人工智能的基本特征及所依赖的数据、算法和算力三大技术基础”。最初读到这句话时,我并没有深刻感触。过了相当长一段时间我才忽然领悟到——“算力+数据+算法”不就是机器学习的过程吗?毛勇博士是清华大学AI专业的博士,属于在新一代人工智能兴起前就毕业的那一批博士,我很好奇,当您第一次读到“三驾马车”的表述时,想到的是什么?

毛勇:我知道“三驾马车”这一表述的时间也已经很晚了,大概在2017年之后。那时候深度学习已经兴起,AlphaGo已经横空出世。经过媒体的传播,AI学科也渐渐成为人人关注的“显学”。而在2007年前后,也就是我读书和参与科研工作的年代,AI研究基本上局限在实验室中。因此,我们当时的研究工作都不需要太强的算力和太多的数据,而且实际上这些条件也并不存在。当看到这句话之后,结合AI应用在生活中不断出现,我意识到这是对AI领域核心要素非常精炼的概括。它概括的是AI发展的过程,即伴随着互联网和移动互联网时代的发展,摩尔定律带来的算力飞速提升以及各种优秀算法的出现,人工智能终于走出困境成为一个真正的工程学科。对于这个时代的每个学习者来说,建立起一个学科的宏观概念是非常重要的,所以我认为这个总结很精辟,每个学生都应该理解它的内涵。

谢作如:相对于毛勇博士来说,我是“半路出家”的AI教育工作者,靠各种入门型的教程或者教材,才慢慢迈进了AI的大门。早在2005年左右,我把当时所有高中《人工智能初步》模块教材都研究了一遍。即使这样,我也仅仅了解了点皮毛,一度把机器人当作实施AI教育的最好载体。2014年左右,我应邀参加高中课标《智能系统初步》模块(这一模块后来又更名为《人工智能初步》)的讨论和初稿编写,重点则落在“机器人”和“智能控制”上。第一次编写AI教材是在2019年,我应邀为初中生编写一个学年的教材。最初也是中规中矩从符号主义开始学习,如知识表达、推理和搜索等内容,基本上没有涉及神经网络。到了2020年,我们在清华大学出版社的初中《信息科技》教材中加入了“深度学习”的内容。而现在,我的想法又有了变化:能不能把学习重点定位在“模型”上?因为“算力+数据+算法”得到的结果就是“模型”。我这十多年来的学习、认知历程,是不是走了太多弯路?

毛勇:您这个历程绝对不是走了弯路。您从开源硬件、互动媒体到创客、3D打印,再到人工智能,一直在坚持学习,这一点让我尤为佩服,而且您的学习路径很有趣,从“编程和控制”逐步转移到“模型和训练”,关注真实问题解决,为解决问题不断学习新的知识,包括机器学习和深度学习。对于符号主义的涉猎,其实不能算是走弯路,而是在帮助自己建立对AI学科的全貌理解。而且对于之前的学习者来说,都不可避免有这样的经历。您正在推广的“以数据驱动和模型训练为核心”的AI教育,我认为是抓住了现阶段AI学科的核心,路径非常正确。

谢作如:谢谢毛博士的肯定。郑子杰老师是北京十一学校的AI课程教师,我很早就在网上看到过您分享的一个PDF文件,标题为《如何开设面向10年级学生的机器学习课程》。请郑老师简单介绍一下,您的AI课程是什么时候开始实施的?面向哪些学生?涉及哪些课程内容?

郑子杰:自2020年起,我在北京市十一学校开设机器学习课程,主要针对高一和高二学生。这门课每学期都开,一个学期为一个学习周期,每周二晚上上课,每次上课的长度是1.5至2小时。课程内容主要涉及机器学习的基础知识、模型的训练与测试流程,以及包括神经网络、支持向量机、决策树在内的多种常见模型。我尽可能深入浅出地阐释这些概念,并鼓励学生通过问题探索,激发他们思考。例如,在介绍“支持向量机”时,我会强调其设计理念中从“较优解”到“最优解”的演进过程。在讲解决策树时,我侧重于交叉熵概念的讲解。至于深度神经网络,我会简要介绍如何使用PyTorch搭建神经网络以及一些常见的网络模型,但不会深入,因为这需要更深厚的数学背景知识,超出了一般高中生的理解范围。我的课程主要面向那些对AI有浓厚兴趣、具备一定Python编程基础,但又不仅仅为了参加学科竞赛的优秀学生。虽然现在的AI跟升学没关系,但有相当一部分家长会支持孩子选择学习我的课程。

谢作如:谢谢郑老师的介绍。您的课程很有难度,如“交叉熵”一词就能吓跑很多想研究AI的老师。但作为度量两个概率分布间的差异性信息的概念,我也认为“交叉熵”在机器学习中实在是太重要了。对了,我们三个人还有一个共同的身份,都是NOAI科学教育委员会委员。NOAI是IOAI活动的国内版本,IOAI的全称是国际人工智能奥林匹克,我想IOAI的方向基本上代表了AI教育方面的国际共识。那么IOAI活动是以怎样的形式,将不同国家的青少年放在一起“竞技”?关注哪方面的AI知识和能力?请毛博士简单介绍一下IOAI官方网站给出的模拟试题,分析涉及的AI知识以及可能的考核形式。

毛勇:IOAI的考查形式是以4人组队的方式解决真实的人工智能研究和应用问题。它主要包括两轮考查,也就是两种类型的题目。第一轮叫做科学轮,科学轮的3道题目会在国际活动前1个月就发送给学生。学生要在国内进行充分的学术准备和积累,然后在出国前提交一次正式的代码和文档,但是这部分内容只占总分的5%。而到了国际现场,这3道题目的后一半延展问题会直接给到学生手中。他们有8个小时左右的时间以团队为单位进行研究、学习、写代码、处理数据、搭建模型,然后还有8个小时左右的时间可以用云端算力去跑训练。然后他们要把自己的代码、结果和文档在线提交。科学轮的题目基本都是模拟了现实世界中非常新的科学研究问题,选手需要识别和解决现有方法中的局限性,并提出自己的解决方案。在这一轮中的表现主要取决于选手的基本编码技能、对常用深度学习Python库和框架的熟悉程度,以及对机器学习基本原理的理解。

谢作如:据我了解,类似IOAI活动的面向青少年的国际人工智能活动很少。我想请毛博士再介绍一下面向成人(包含大学生)的人工智能活动有哪些,这些活动的考核内容和传统的编程比赛(如信息学奥赛)有什么区别。

毛勇:相对而言,面向大学生和成人的国际人工智能活动要更丰富些。例如,图像领域的学术竞赛ILSVRC(ImageNet Large-Scale Visual Recognition Challenge)、对话系统领域的DSTC(Dialogue System Technology Challenge)都是学术性非常强的比赛活动,还有开源数据平台Kaggle上也会经常组织一些活动。此外,一些大公司也很喜欢把自己业务中的真实问题做成题目,开放地征集解决方案。这些活动要解决的问题往往具体、真实而又开放,有很大的研究和创新空间,考核内容和传统的编程比赛相差比较大。

AI实验要重点体现当今时代(近20年)主流AI的核心要素——数据、模型(算法)和算力。

在现阶段,大语言模型的原理可以在专家讲座中出现,大语言模型的应用可以渗透到其他课程和日常生活中,但是不适合直接放在中学AI课程中。

精心选择AI实验是中小学AI教育的抓手

谢作如:从毛博士的介绍可以看出,虽然都在强调算法,但是人工智能方面的活动涉及的知识往往不是我们熟悉的排序、搜索、动态规划、线段树之类,很多内容都很新,如“词向量”“对抗生成”等。但我们不需要大惊小怪,因为国际奥林匹克活动本来就是为学有余力的学生设计的。当然,我们也必须知道,这些内容实际是新一代人工智能的课程不可缺少的部分。

从AI的各种知识点出发,我想给两位出一道难题。两位都知道,目前国内有多个省份和地区正组织专家编写中小学人工智能通识课程,以地方课程的形式实施,如深圳和上海。假设某地区准备在小学、初中阶段实施一个学年的通识课程,大概32课时,其中有6个AI实验(一个实验2课时)。假设你们都是这个地区编写人工智能通识课程纲要或者指南的专家,你们会为初中生遴选哪6个AI实验主题?

至于我为什么会选择AI实验?那是因为2023年教育部等十八部门颁布了《关于加强新时代中小学科学教育工作的意见》,提出要着力在教育“双减”中做好科学教育加法,要加强中小学科学及相关学科(物理、化学、生物、地理、信息科技/信息技术、通用技术等)课程标准及教材修订完善工作,加强实验室建设,强化实验教学等要求,通过实验来学习AI,显然是最好的抓手。另外,你们在遴选实验主题时不要局限于上课教师的AI水平,即要假设教师们都经过一段时间的AI技术培训,具备了一定的专业技术能力。

郑子杰:首先,我们要明确设计这些实验的目标是什么。以初中生的认知水平,想要通过这6个实验了解AI的各个前沿方向,如大语言模型、多模态、具身智能等显然是不现实的。所以,我会牢记基础教育阶段的“基础性”,课程是为之后学习AI打下“基础”的。至于AI前沿领域的发展,应该通过专家讲座或者是通过其他课程完成。所以,AI实验要重点体现当今时代(近20年)主流AI的核心要素——数据、模型(算法)和算力。我推荐的6个实验分别是:

实验1:以二维表为载体、旨在让中学生认识和分析数据表的实验,数据来源可以是他们真实的物理、化学、生物课堂;

实验2:实现传统机器学习的实验,如线性回归或者鸢尾花分类的实验,用来体会机器学习的一般流程;

实验3:计算机视觉方向的基础实验,如提取图片特征等,简单跟学生讲讲怎么使用卷积提取图片边界;

实验4:计算机视觉方向的进阶实验,如基于CIFAR10这个数据集,使用卷积神经网络实现图像分类;

实验5:自然语言处理的基础实验,如直接分析一篇小说,重点让学生体会如何定量化地描述“文字”,并如何提取文字中的信息;

实验6:自然语言处理的进阶实验,如使用Pytorch框架和LSTM实现文本的分类等。

这6个实验可以分为3个大方向——机器学习、计算机视觉和自然语言处理,并且前一个实验都是通过实验载体了解简单的原理,后一个实验是走通AI训练的流程。我之所以不提大语言模型,是因为其太复杂,学生在知道模型的一些基础结构之前,很难体会大语言模型这类复杂模型的设计初衷。如果直接在课程上讲解大语言模型,学生只会觉得“好厉害”,却发现什么也学不到。所以我一直坚持,至少在现阶段,大语言模型的原理可以在专家讲座中出现,大语言模型的应用可以渗透到其他课程和日常生活中,但是不适合直接放在中学AI课程中。从教学角度讲,我们要用符合中学生知识积累和认知水平的载体,让学生体会数据、模型(算法)、算力,并尽可能体会一些模型设计的初衷和精妙之处。当学生能够体会简单模型的原理后,随着年龄的增长,他们自然就会学习、应用、修改甚至创造更加复杂且精妙的模型。

毛勇:我非常同意郑老师的思路,唯一的不同是我可能会选择把实验5和6改为某个更简单的处理时序数据的问题,如天气或股票数据等。这样做对于像北京十一学校这样的学校来说似乎少了一块内容,但是对于更多的学校来说,相比处理自然语言做词表、向量化等困难一些的实验,也许简单一些的结构化时间序列数据更加适合他们。当然,如果课时允许,可能更加理想的方式是将这部分内容增加到自然语言处理实验的前面去,增加实验时长,让课程更加丰富。

经典小说推荐

杂志订阅