数理统计课程中Cranmer-Rao不等式的教学案例设计
作者: 陶红 徐耀坤 何章鸣 侯臣平
[摘 要] 案例教学法能够有效提升数理统计课程的教学质量。案例教学法的推广需要丰富的案例资源作为支撑,然而,目前我国数理统计课程的案例资源还比较匮乏。针对数理统计课程案例资料数量有限的情况,结合Cramer-Rao不等式的教学目标和教学重点,通过查阅相关领域的前沿研究成果,从单分子定位超分辨成像和锂电池荷电状态估计两个实际应用中,凝练了两个Cramer-Rao不等式的教学案例,加强课程内容与实际问题的结合,为案例教学法的有效实施提供案例支撑,从而增强学生对数理统计知识及其应用的理解,提高教学效果。
[关键词] 数理统计;Cramer-Rao不等式;案例教学法
[基金项目] 2020年度国家自然科学委青年基金项目“视图动态变化时的多视图学习方法与应用研究”(62006238);2020年度国家自然科学委青年基金项目“计算时间域鬼成像目标信息获取能力研究”(62001484)
[作者简介] 陶 红(1990—),女,湖南浏阳人,博士,国防科技大学文理学院讲师,主要从事统计机器学习研究。
[中图分类号] E251.3;G642.0 [文献标识码] A [文章编号] 1674-9324(2022)32-0127-05 [收稿日期] 2021-09-22
引言
数理统计是统计学的一个重要分支,在自然科学、工程技术、管理科学和人文社会科学等领域得到了越来越广泛的应用。很多高校的本科和研究生数学类与统计类专业均开设数理统计类课程。传统的数理统计教学着重于定义与公式的讲解与证明,这种讲授方法虽然能够准确传达课程知识,但在激发学生学习兴趣、培养数理统计思想、提升科研创新能力这些方面存在明显的不足。为了提升学生的学习兴趣,很多高校都在尝试采用案例教学法来提升数理统计课程的教学质量。已有的教学实践表明,在数理统计课程中引入案例教学模式,能够有效帮助学生加深对理论知识的理解和提升解决实际问题的能力[1-3]。案例教学法的推广需要丰富的案例资源作为支撑。然而,目前我国高校数理统计课程的案例教学中,案例资源还比较匮乏。大多数案例内容陈旧,与当前社会的发展态势联系不够紧密,从而限制了案例教学法的作用。由此可见,数理统计教学案例建设的必要性与紧迫性。本文针对数理统计课程中Cramer-Rao不等式的教学目标和教学重点,结合相关领域前沿研究成果,从单分子定位超分辨成像和锂电池荷电状态估计两个实际应用中,凝练了两个Cramer-Rao不等式的教学案例,加强课程内容与实际问题的有效结合。
一、Cramer-Rao不等式的基本理论
在案例教学开始,首先对案例涉及的基本概念进行详细剖析。Cramer-Rao不等式的内涵是:对于Cramer-Rao正则族的可估参数,其无偏估计的协方差阵存在下界。这个下界被称为Cramer-Rao下界,由样本容量、Fisher信息和可估参数的导数确定。Cramer-Rao不等式的应用十分广泛,可应用于雷达运动目标检测、卫星定位系统、超精密测量和量子成像等科学研究和工程实践中的参数估计精度分析,对于提升实际应用中的参数估计性能具有重要作用。由于Cramer-Rao不等式在理论研究和工程实践中的重要地位,Cramer-Rao不等式一直是数理统计课程中的教学重点。
定义1 (Cramer-Rao正则族)如果分布族{pθ(x),θ∈Θ}满足:(1)Θ是 上开矩形;(2) lnpθ(x)/θi, i=1, …, k对所有θ∈Θ都存在;(3)支撑A={x:pθ(x)>0}与无关;(4)对pθ(x),积分与微分可交换;(5)对一切1≤i,j≤k,Eθ <∞,则此分布族称为Cramer-Rao正则族[4]。
定义2 (Fisher信息)设分布族{pθ(x),θ∈Θ}为Cramer-Rao正则族,记随机向量为
Sθ(X)= ,称Sθ(X)的协方差阵I(θ)=Varθ(Sθ(X))=Eθ(Sθ(X) (X))为此分布族的Fisher信息矩阵,简称Fisher信息[4] 。当k=1时,称标量I(θ)为Fisher信息量。对于多维随机变量,其Fisher信息矩阵I(θ)是基于其联合概率密度函数计算的。
定理1 (Cramer-Rao不等式)设{pθ(x),θ∈Θ}为Cramer-Rao正则族, ,其Fisher信息I(θ)是非奇异矩阵,设可估参数为g(θ)=(g1(θ),…,gs(θ))T,s≤k且gi(θ)/θj对一切i=1,…,s, j=1,…,k都存在[4]。假设T(X)是g(θ)的模平方可积的无偏估计,记Δ= g(θ),则有Varθ(T(X))≥ΔI-1(θ)ΔT, θ∈Θ其中ΔI-1(θ)ΔT称为g(θ)的无偏估计的Cramer-Rao下界。
现有教材通常直接给出Fisher信息的定义与存在条件,然后再给出Cramer-Rao不等式的具体内容与证明。教师在教学的时候如果仅仅局限于教材,不结合实际应用进行适当延伸与拓展,那么学生对此部分内容的学习将停留于“背公式”的层面,不能深入理解Cramer-Rao不等式的应用途径。因此,需要发挥数理统计作为一门应用性极强的学科的特点,积极进行案例建设,扩大案例式教学法在数理统计教学中的应用范围,从而提升教学质量。事实上,Cramer-Rao不等式作为参数估计中误差分析的有力工具,已经在相关学科中得到广泛应用,结合基本理论,让我们分析以下案例。
二、Cramer-Rao不等式的案例设计
实际的教学案例设计中,要考虑学生对案例背后知识背景的掌握程度。笔者结合学生的已学课程,通过查阅相关学科的前沿研究成果,分别从单分子定位超分辨成像和锂电池荷电状态估计两个实际应用中凝练了两个Cramer-Rao不等式的教学案例,学习过“大学物理”基本课程的学生均可理解案例中的基本背景。两个不同的案例中,既有诺贝尔奖工作中的科学问题,又有贴近实际生活的工程问题,现予以分享。
案例1 基于单分子定位的显微成像技术(Single-Molecule Localization Microscopy, SMLM)获得2014年获得诺贝尔化学奖。SMLM的工作原理可以概括为“闪烁”“定位”与“重建”,即多次循环采集被稀疏激活的荧光分子,再利用单分子定位算法给出荧光分子精准的空间定位信息,最后将每一帧的定位点合成为一张超分辨图像[5]。单分子定位算法的精度分析是成像分辨率分析中的一个基本且重要的问题[6]。事实上,单分子定位就是对单分子的坐标进行估计。若获得了单分子坐标的无偏估计量,则此估计量的定位精度定义为其标准差。
考虑如图1所示的单分子成像系统,位于样本平面(u,v)∈ 处的单个荧光分子,其在探测平面(像面)上所成的像的中心为(x0,y0)=Mθ,其中M表示物镜的放大率。在探测平面(x,y)∈ 处探测到其发射出的光子的概率密度函数为
其中 (x,y)∈ ,θ=(u,v)∈ ,即为待估计的参数,α=2πna/λem,na表示物镜的数值孔镜,λem表示发射光的波长,J1表示第一种类型的一阶Bessel函数。容易验证{fθ(x,y),θ∈ }为Cramer-Rao正则族。
若采集到N个光子,由此N个光子的坐标构造出的θ的模平方可积的无偏估计为T,且已知
,
,
试求T的方差下界。
解:由Cramer-Rao不等式知,T的方差下界为
,其中IN(θ)为N个光子的联合概率密度函数的Fisher信息。由Fisher信息的性质可知IN(θ)=NI(θ),其中I(θ)为分布族{fθ(x,y),θ∈ }的Fisher信息。现计算I(θ)如下。
第一步Sθ= 。记
,则
,
第二步,计算I(θ)。
由 与 的轮换对称性知I22(θ)=α2。
于是, ,即
。
由此可知,在采用点扩散函数时,u,v的估计精度下限均为 。
案例2 锂电池因其能量密度高、循环寿命长等优点迅速发展为新一代储能电源。准确估计电池当前工作状态,对于提高储能系统的安全性、可靠性和可用性具有重要作用。假设锂电池内部具有图2所示的RC等效电路模型。
此等效电路的工作原理为[7]
其中x1表示电池的荷电状态(SOC),R1和C1分别表示电池的极化内阻和极化电容,x2表示平行电容器的电荷量,Q表示电池电量,R2表示电池欧姆内阻,u表示输入电流,y表示可直接测量的电池端口电压,OCV(x1)表示开路电压与SOC间的非线性关系并且可以通过实验测量得到。
假设上述模型中的待估参数为θ=[Q R1C1 C1 C2]T,记时刻t的电池端口电压为yθ(t)。在给定θ的额定值、电池的初始状态(x1(t)和x2(t)的初始状态)和输入电流信号u(t)时,可以通过锂电池工作原理仿真得到yθ(t)的理论值。然而,端口电压的实际测量值会存在误差。假设不同时刻的端口电压测量值的误差独立同分布,服从均值为0方差为σ2的正态分布。记t1时刻的测量电压为ym(t1),则此时的测量误差为εθ(t1)=ym(t1)-yθ(t1),且εθ(t1)的概率密度函数为