概率论学习中几个值得注意的问题探究
作者: 赵进 周秀轻
摘 要:概率论是随机数学的基础,学好概率论对于金融数学,统计学等学科有着重要的意义。在多年的概率论教学中,以下三点是值得注意的。首先将概率论的历史发展融入概率论教学,这对于学生的理解是有价值的;另外通过比较的方法来学习有助于学生的理解。如比较不同的极限理论可以使得大数定律,中心极限定理更加容易理解;最后,在概率论与随机过程的学习中经常会遇到一些概念性的错误。我们以更新过程中的Feller初等更新定理的证明为例。指出同学们容易产生一些概念性的错误,并将这些错误的原因做出解释,以便让学生对概念的理解更加清晰,避免在概率论与随机过程的学习中犯类似的错误。
关键词:极限理论;更新过程;Wald等式;更新定理;概率论学习
中图分类号:G642 文献标志码:A 文章编号:2096-000X(2023)31-0083-04
Abstract: Theory of Probability is basic course of stochastic mathematics, especially for financial mathematics and statistics etc. In years of teaching Theory of Probability, I found that it is important to study the history of probability, which can help the students learn the concepts of probability. It can be also helpful to learn by comparison. For example, the Law of Large Numbers and central limit theorem can be easily studied by comparing the limit theory. Finally, In the proof of the Feller renewal theorem, there are several problems that students always make mistake. Theses mistakes are often made in the study of probability and stochastic processes. We will give the explanation to clean the concept and avoid similar mistakes.
Keywords: limit theory; renewal process; Wald equation; renewal theorem; learning Theory of Probability
随着计算机技术的发展,进入上世纪九十年代以来,金融数学与统计学日益受到重视。因此,作为随机数学的基础内容,概率论与随机过程已成为数学系重要的核心课程。并且很多非数学学院,如大气科学学院、商学院、管理学院等,都将这两门课程作为必修的数学基础课程。因此,学好这两门课对以后进一步学习和研究有着重要的意义。
作为核心基础课程,概率论与随机过程的理论结构清晰、逻辑层次分明,教授内容也相对比较固定。这些特点与其他核心基础课如:数学分析、高等代数类似。同时,笔者在多年的教学实践中,感到概率论与随机过程也有着其自身的特点,特别是在概念以及定理证明中有一些其他数学课程不具备的特点。下面就三个方面来谈谈学习概率论的体会,希望这些经验能够帮助同学们更好地学习和掌握概率论。
一 在教学过程中融入概率论的发展历史
众所周知,现代概率论的理论基础是建立在测度论的基础上,但是概率论的发展有其自身的需求,而非看作测度论的分支。因此在讲授概率论的概念和定理时,一定要着重将概念、定理的概率论背景介绍清楚。并将概率论的发展历史融入概念、定理的讲解之中,可以让同学们对这些概念、定理有更为清晰的直观认识。
例如,贝叶斯公式的证明较为简单,在教材中往往放在前面与初等概率论一起介绍。但公式背后有着较为深刻的哲学意义。因此,将贝叶斯公式的历史发展介绍清楚,该公式是贝叶斯去世后两年才发表的,当初并未得到大家的重视。直到150年后,才引起学术界的重视,并将其文章重新在统计一流刊物《Biometrika》刊登,从而标志着现代贝叶斯学派的诞生。这样使得学生知道公式的意义。事实上,现代贝叶斯学派就是以该公式为基础的。
再如,随机变量是一个十分重要的概念。但作为初学者往往不能体会,仅将随机变量看作函数而已,而函数的概念同学们早已熟知。那么,通过融入概率论的历史,让同学们知道随机变量的引入标志着概率论由古典概率进入近代概率,这个概念是十九世纪下半叶由俄罗斯的彼得堡学派(其核心人物为切比雪夫)引入的。这样就可以让同学们对这个概念引起重视了。
又如,极限理论是概率论教学中的重点和难点。其概念较多,如收敛性就有四种之多;定理证明也较为复杂,往往同学们会混淆不清,那么结合极限理论的发展历史,将弱大数定律、强大数定律及中心极限定理的发展过程讲清楚,同学们就容易记忆了。以弱大数定律为例,伯努利大数定理是最早的一个极限定理,发表于1713年伯努利的著作《猜度术》[1-3]。其后一百多年未有大的进展,直至切比雪夫利用矩不等式才取得了突破。由此得到了切比雪夫大数定理。了解这些历史发展,就可以让同学们知道切比雪夫不等式的重要性。后来,切比雪夫的学生马尔科夫又进一步提出了马尔科夫大数定理。最后由辛钦证明了独立同分布的大数定理。该定理没有使用矩不等式,而是使用了特征函数的连续性定理加以证明。于是同学们就明白特征函数理论的重大意义了。通过讲解弱大数定理的发展过程,学生们很容易就将这些定理联系起来了。不仅容易记忆,同时也加深了对定理的理解,如切比雪夫不等式的重要性与局限性等。
总之,在学习一门课的同时,了解这门学科的发展历史是很有必要的。这不仅可以使枯燥的课堂教学增加了趣味,而且对同学们理解这门学科也有很大的帮助。
二 利用比较的方法来讲解极限理论
极限理论是概率论的重点和难点。前面我们谈到就结合概率论的历史来讲解极限理论。这里我们谈谈如何运用比较的方法来讲解极限理论。下面以弱大数定律与强大数定律为例。首先这两者涉及的收敛性不同。弱大数定律是依概率收敛,而强大数定律是几乎处处收敛。具体定义如下。
定义1:设X1,X2,…,Xn,…为一列随机变量,若存在随机变量X,使得任意给定的ε>0,则有
则称随机变量序列{Xn}依概率收敛于随机变量X,记为______ 。
定义2:设X1,X2,…,Xn,…为一列随机变量,若存在随机变量X,使得
则称随机变量序列{Xn}几乎处处收敛于随机变量X,记为______ 。
意给定的ε>0,有
通过比较,很显然几乎处处收敛强于依概率收敛。
且弱大数定律的证明主要运用切比雪夫不等式。定理如下。
定理1:对于任意具有有限方差的随机变量X,有
而强大数定律主要是运用科尔莫哥洛夫不等式。具体如下。
定理2:设X1,X2,…,Xn,…为一列独立随机变量,方差存在,则
不难看出,科尔莫哥洛夫不等式是切比雪夫不等式的推广(取n=1即为切比雪夫不等式)。因此强大数定律比弱大数定律更为深刻。同时科尔莫哥洛夫不等式中的概率涉及到事件的并集,结合几乎处处收敛的定义,就不难发现科尔莫哥洛夫不等式可以用于几乎处处收敛的证明,而切比雪夫不等式就不具备这个能力了。
由上可见,利用对比的方法,可以使得学生对定理的证明有进一步认识,从而加深了对极限理论的理解和记忆。
三 随机过程中易犯的概念错误
(一) 更新过程的定义
随机过程是概率论的后续课程。对于概率统计专业的学生,这是一门必修的核心专业课程。对于其他院系,这门课也是必须掌握的。随机课程涉及的随机过程种类较多,各种随机过程的特点不一,特别是随机过程往往具有复杂的相关性,因此学习的难度较大。学生在学习的过程中会遇到各种难点,其中很大的原因是概念不清晰造成的。我们将在该文中通过Feller初等更新定理的证明来说明一些容易产生的概念性错误,这些错误常常会在随机过程的学习中出现。通过比较定理的不同证明,我们能够清楚地看出错误到底发生在什么地方,从而避免在随机过程的学习中再犯类似的错误。
泊松过程是随机过程理论中的一个基本过程,其有着各种各样的推广,其中一个简单而重要的推广就是更新过程。更新过程在实际的应用很广泛,比如我们有一堆灯泡,灯泡的使用时间服从指数分布,如果灯泡失效,我们对灯泡立即进行更换,这是一个泊松过程,如果我们假定更换灯泡时间为某个固定的分布。这就是泊松过程的一个推广,也就是更新过程。
更新过程理论是随机过程理论中的重要组成部分。在可靠性、人口学、保险精算以及排队论等很多领域有着重要的应用。其中尤其是更新定理,起着关键的作用。由更新定理可以得到各种更新方程,这些更新方程在解决实际问题起到了核心的作用。例如在保险精算中,破产概率的计算就是由更新方程推导到的积分方程,从而得到著名的Lundeberg上界[4]。
更新定理中的一个基本定理是Feller基本定理,这个定理的证明在随机过程的教学中会讲到。下面主要就这个定理证明中容易产生的两种错误加以说明,这两种错误在同学们学习概率论与随机过程理论中经常出现,有一些概念不清的同学会纠结于这些错误,想不明白自己究竟错在什么地方。这里我们借用Feller初等更新定理的证明来指出这两种错误的根源。
下面首先给出更新过程的定义。
定义3:设X1,X2,…,Xn,…是一列独立同分布的非负随机变量,分布函数为F(x),记μ=EX1。令Tn=Xi,T0=0。则称N(t)=sup{n:Tn≤t}定义的计数过程为更新过程。
记M(t)=E[N(t)],这称为更新函数。研究更新函数的性质是非常重要的。实际上,更新过程中的重要结论均与M(t)有关,例如Feller初等更新定理、关键更新定理等[5]。
(二) Feller初等更新定理的证明
下面首先给出Feller初等更新定理及其证明。
定理3:对于更新过程,有
若μ=∞,=0。
定理3的证明需要Wald等式
该等式的证明参见文献[6-7],在此我们不再赘述。
下面给出Feller初等更新定理的证明。
证明:首先
,
两边取期望,再利用Wald等式得
,
即
于是
采用截尾的方法加以证明,证明较为复杂。具体为固定一个常数A,定义一个新的更新过程1,2,…,n,…,其中
于新的更新过程的间隔时间以A为上界,于是 。
由Wald不等式得到
式中 。因此
于是 。又由 ,得 ,