儿童语言领域的统计学习研究进展

【摘要】本研究对儿童语言领域的统计学习的研究进行概述，并从词汇分割、拼写和阅读三个语言子领域进行了梳理。结果发现，在词汇分割领域，统计学习机制对儿童语言学习的解释得到了较多的证据支持;在拼写和阅读领域，已有研究主要证实了统计学习对拼写和阅读能力存在影响，至于儿童能否通过统计学习机制获得拼写和阅读能力，还有待进一步探究。

【关键词】儿童;语言;统计学习;研究展望

【中图分类号】G610 【文献标识码】A 【文章编号】1004-4604（2022）05-0038-05

*通讯作者：李菲菲，浙江师范大学杭州幼儿师范学院副教授，E-mail：lifeifei1206@163.com

人类的语言中，无论语音、书写还是句法都存在大量的统计规则（statistical regularity）。如语音可以看作是一组声音的共现规律，〔1〕单词的字母与字母之间、〔2〕汉字的部首与部首之间都存在特定的组合规律。〔3〕统计学习（statistical learning）指个体检测和学习外部环境中隐含的统计规则的能力。〔4-7〕儿童期是人类语言能力快速发展的时期，统计学习可以说明儿童如何学习他们所接触到的语言结构，为儿童的语言习得提供了一种重要的解释。〔8〕本文对近二十年儿童语言领域的统计学习的研究进行概述，并通过梳理和思考目前研究中存在的问题和挑战，对未来研究进行展望。

一、语言各领域的研究进展

目前，儿童语言领域的统计学习研究主要集中于词汇分割、拼写和阅读领域。

1.词汇分割（word segmentation）

萨弗朗等人设计了三联体学习任务（triplet⁃learning paradigm）考察婴儿的词汇分割能力（word segmentation）。结果发现，婴儿能够根据语音流中的转换概率这一统计属性来分割单词。〔9〕随后，研究者进一步将语音材料替换为视觉材料，发现2到8个月大的婴儿也能提取出视觉刺激中的统计规则。〔10〕例如，格拉夫·埃斯特雷斯等人的研究发现，17个月大的婴儿不仅可以将语音流分割成单词，还可以将单词和意义进行对应。〔11〕随后，格拉夫·埃斯特雷斯和卢·威廉姆斯增加了任务难度，使用了多种人声合成的人工语音流考察8个月和10个月大的婴儿，结果发现婴儿依旧可以对语音流进行分割。〔12〕

此外，婴儿的词汇分割受到真实生活中语言经验的影响，如语音背景、重音、顺序和双语经验等。萨弗朗在研究中将三音节单词分别嵌入有意义的语句和无意义的语句中，结果发现8个月大的婴儿对嵌入到有意义语句中的单词的注视时间更长。〔13〕泰森和萨弗朗在人工语音流中加入不同的重音，结果发现7个月大的婴儿更多地使用转换概率，9个月大的婴儿则更多地使用重音作为分割线索。可见，不同年龄段的婴儿会根据他们当前的语言经验而采取不同的分割策略。泰森等人探究了婴儿对不同顺序的统计规则的学习偏好。他们设计了顺向转换概率和逆向转换概率的单词任务（如D、E、F、Y四个音节， D、E、F后接Y的概率为顺向转换概率，Y之前是D、E和F的概率为逆向转换概率）。结果表明，母语为英语的13个月大的婴儿更倾向于逆向转换概率，这与母语为英语的成年人的偏好一致。〔14〕安托维奇和格拉夫·埃斯特雷斯的研究发现，双语婴儿能够利用统计规则分割双语流，他们的双语统计学习成绩与其在真实生活中的双语经验有关。〔15〕

统计学习为婴儿的词汇分割能力提供了一种重要的解释。目前研究已证实，将连续的语音流分割成单词是婴儿在早期语言学习中就使用的方法。同时，统计学习对语言环境，尤其是对母语的特点和规律的适应，表明其具有强大的适应性，能帮助个体更好地提取环境中的统计规则以学习语言。

2.拼写（spelling）

随着年龄增长，儿童开始接触书面语的学习。在正式接受教育并明确习得单词的拼写规则之前，他们已经在生活环境中接触到大量的文字信息，成为前音韵拼写者（prephonological speller），即处在拼写发展初期的儿童。一系列研究支持了统计学习在儿童书面语学习中发挥的作用。波洛等人对美国和巴西前音韵拼写儿童的拼写模式进行分析后发现，该阶段的儿童虽然不能明确理解单词的拼写与语音之间的关系，但是已经学习到一些简单的书写规律。〔16〕特雷曼等人的研究发现，年长孩子比年幼孩子的拼写长度更长，重复的双字母拼写频率和按字母表顺序拼写更少，拼写模式更接近于真实的单词拼写。〔17〕凯斯勒等人的研究进一步发现，4岁就表现出对单词统计属性敏感的儿童，在学龄期的拼写测试中表现得更好。〔18〕

对正字法（orthographic）的研究也支持了统计学习对词汇拼写的作用。正字法是指在书面语中单个字母或字母序列的分布规律。迪肯和梁在研究中设置屈折词（如“cold⁃colder”）和派生词（如“teach⁃teacher”）的拼写选择任务（spelling choice task），要求儿童从备选项（“er，or，r”）中选出一项填到单词词尾（如“teach”）。研究结果表明，儿童在选择派生词的词尾时正确率更高，这与“er”在派生词的词尾出现的频率更高有关，说明他们对接触到的正字法规律很敏感。〔19〕布雷德莫尔和迪肯让6—7岁和8—11岁的儿童进行单词拼写，单词包括相同字母开头的基础词、屈折词、派生词和对照词（如“rock， rocking， rocky， rocket”）。结果发现，在屈折词、派生词和对照词上，两组儿童的拼写时间相似，表明6—7岁的儿童对单词的正字法规律产生了敏感性。〔20〕佟和麦克布莱德的研究发现，汉语儿童从5岁起就意识到左右和上下结构汉字中部首的位置限制，且这种能力随着年龄的增长而逐渐提高。〔21〕金格拉斯和塞内夏尔的研究发现，儿童可以习得较难的正字法规律，且随着年级的上升，拼写的准确性会增加。〔22〕

在儿童还没有接受正式拼写教育时，统计学习就会对儿童的拼写发展产生作用。儿童的语言经验中包含着语言的统计规则。随着年龄以及语言经验的增长，儿童可以获得这些隐含的统计规则，从而发展拼写能力。然而，已有研究都没有使用统计学习范式对儿童的统计学习进行测量，因此得出的结论仅仅是一种推测，无法直接说明统计学习与拼写之间存在相关。同时，尽管统计学习离不开语言经验的影响，但是这些研究将统计学习和语言经验视为同一个概念，是不准确的。

3.阅读（reading）

相关研究者就儿童的阅读能力开展了研究。他们使用视觉和听觉的统计学习任务测量统计学习，同时使用量表评估阅读能力，结果发现两者之间存在相关。阿尔丘利和辛普森使用视觉统计学习任务和广泛成就测验（Wide Range Achievement Test， WRAT-4）中的阅读子测验考察6—12岁儿童的阅读能力和统计学习的关系，结果发现统计学习能力能显著预测儿童的单词阅读能力。他们认为，统计学习可能通过检测到字母和音素以及字母之间的统计规则促进单词的阅读。〔23〕托基尔德森等人的研究发现，即使考虑了与阅读相关的认知和语言技能的个体差异，儿童的统计学习能力也能预测单词阅读能力。〔24〕除了词汇阅读，研究者还关注到统计学习在句子阅读中的作用。齐等人的研究发现，在控制了年龄和非语言智力后，儿童的统计学习与非词阅读准确性和句子阅读流利度均显著相关。〔25〕

此外，对发展性阅读障碍（developmental dyslexia， DD）儿童的研究发现，他们的阅读障碍和统计学习缺陷存在相关。辛格等人使用视觉统计学习任务和ERP技术对8—12岁发展性阅读障碍儿童和普通儿童的统计学习进行测量。研究发现，发展性阅读障碍儿童的单词阅读成绩显著差于普通儿童。〔26〕佟等人也发现7—8岁阅读障碍儿童存在视觉统计学习缺陷。〔27〕

二、研究展望

1.研究材料：设计不相邻规则考察句法结构的统计学习

在词汇分割和拼写领域的统计学习研究中，研究者设置的统计规则通常都是相邻规则（local dependency），如传统的三联体学习任务中，统计规则是一个音节跟着另一个音节的转换概率。相邻规则是一种表层的具体元素的组块（chunk），而非深层的抽象规则（abstract rule）。语言学家早就拒绝用组块习得来解释全部的语言习得，〔28〕认为人们只有具备一种比组块习得更加强大的语言获得机制才能够掌握自然语言。事实上，人类的语言中存在大量的不相邻规则（nonlocal dependency）。因此，在统计学习研究中，仅仅设置相邻规则来考察语言学习，将使研究局限于词汇水平的统计学习，而难以考察复杂的句法结构的统计学习。未来的研究可以进一步探究语言学习中各种不相邻规则的统计学习，阐明统计学习在儿童习得更深层次的语法规则时所起的作用，进一步明确统计学习机制对人类语言学习的解释是否存在边界。

2.研究方法：使用直接测量考察拼写和阅读相关规则的统计学习

在词汇分割领域，研究者使用统计学习范式和人工语言材料，在熟悉阶段的语音流中设置了统计规则，之后在测验阶段要求被试对符合或不符合统计规则的词汇进行判断。这是对统计学习的直接测量。然而，在拼写领域，关于儿童在日常生活的语言经验中通过统计学习获得了拼写规则的结论，仅仅是一种推测或者假设。在阅读领域中，相关研究不能说明词汇拼写或阅读能力是通过统计学习机制获得的。这需要通过在统计学习任务中让被试习得拼写规则或阅读相关规则才能得到证实。未来需要更多的研究为词汇拼写规则和阅读相关规则的统计学习提供汇聚性的证据。

3.研究内容：聚焦深层结构考察阅读理解的统计学习

在阅读领域，已有研究证实了儿童统计学习与阅读能力存在相关。但它们考察的主要是儿童对词汇或句子的朗读准确性和流畅性，〔29〕可能只涉及了词汇和句子的表层结构（如语音和词形），而未必涉及深层结构（如语义）。〔30〕对词汇的书写形式和语音的提取只是阅读的第一步，对词汇、句子和文章意义的理解才是阅读的最终目的。然而，目前阅读领域的统计学习研究很少关注语义理解。且这些研究在方法学上都属于相关研究，无法证明阅读（尤其是阅读理解）能力可通过统计学习机制获得。此外，理解句子需要掌握一些表层结构和深层结构之间的转换规则。有时不同的表层结构可以表达相同的语义，如“小朋友咬了一口苹果”和“苹果被小朋友咬了一口”意思相同，掌握句式的转换规则才能准确理解句子。〔31〕目前这方面的统计学习研究尚属空白，未来的研究可以考虑如何使用统计学习范式，设计句子结构及相应的句子意义方面的统计规则，进一步拓展阅读领域，考察阅读理解的统计学习研究。

参考文献：

〔1〕ONISHI K H，CHAMBERS K E，FISHER C.Learning phonotactic constraints from brief auditory experience〔J〕.Cognition，2002，83（1）：13-23.

〔2〕CHETAIL F.What do we do with what we learn：Statistical learning of orthographic regularities impacts written word processing〔J〕.Cognition，2017，163（6）：103-120.

〔3〕〔21〕TONG X，MCBRIDE C.Chinese children’s statistical learning of orthographic regularities：Positional constraints and character structure〔J〕.Scientific Studies of Reading，2014，18（4）：291-308.

儿童语言领域的统计学习研究进展

经典小说推荐

杂志订阅

友情链接