参数:反应总体某方面特征的量(比如:合格率、均值、方差、中位数…
参数估计的形式:点估计和区间估计
7.1 点估计
借助于总体X的一个样本来估计总体未知参数的值的问题称为参数的点估计问题。
设总体的分布函数为
F(x;θ),其中
θ为k维向量。根据样本
X1?,X2?,…,Xn?构造一个统计量
θ^(X1?,X2?,…,Xn?)作为
θ的估计,则称
θ^(X1?,X2?,…,Xn?)为
θ的估计量。如果
x1?,x2?,…,xn?是一个样本观察值,带入
θ^后得到的具体值
θ^(x1?,x2?,…,xn?)称为
θ的估计值。
常用的点估计方法:矩估计法、极大似然估计法。
一 、矩估计法
统计思想:以样本矩估计总体矩,以样本矩的函数估计总体矩的函数。
理论依据:辛钦大数定律和依概率收敛的性质。
设
θ1?,θ2?,…,θk?为待估参数,
X1?,X2?,…,Xn?是来自X的样本。矩估计的具体步骤:
-
建立
(θ1?,θ2?,…,θk?)与
(μ1?,μ2?,…,μk?)的联系:求总体前k阶矩关于k个参数的函数
μi?=E(Xi)=hi?(θ1?,θ2?,…,θk?),i=1,2,…,k.
-
求各参数关于k阶矩的反函数
θi?=gi?(μ1?,μ2?,…,μk?),i=1,2,…,k
-
以样本各阶矩
A1?,A2?,…,Ak?代替总体X各阶矩
μ1?,μ2?,…,μk?, 得到各参数的矩估计
θ^i?=gi?(A1?,A2?,…,Ak?),i=1,2,…,k
【注】:方差
σ2的矩估计并不是(修正)样本方差
S2,而是样本二阶中心距
B2?=n1?i=1∑n?(Xi??Xˉ)2=nn?1?S2
矩估计的特点:
- 直观、简便
- 适用范围广,不需要知道总体分布的具体类型
- 没有充分利用总体分布的信息,精度不高
二 、最大似然估计法
离散型总体
X?p(x;θ),θ∈Θ,
θ为待估参数,
Θ为参数的取值范围。
X1?,X2?,…,Xn?是来自总体X的样本,则
X1?,X2?,…,Xn?的联合分布率为
i=1∏n?p(xi?;θ)
又设
(x1?,x2?,…,xn?)是相应于样本的一组观察值,那么样本
X1?,X2?,…,Xn?取到观察值的概率为
L(θ)=L(x1?,x2?,…,xn?;θ)=i=1∏n?p(xi?;θ),θ∈Θ
L(θ)称为样本的似然函数。
最大似然估计法就是固定样本的观察值
x1?,x2?,…,xn?,在
θ取值的可能范围
Θ内挑选使得最大似然函数
L(θ)=L(x1?,x2?,…,xn?;θ)达到最大值的参数值
θ^作为参数
θ的估计值,即取
θ^使
L(x1?,x2?,…,xn?;θ^)=θ∈Θmax?L(x1?,x2?,…,xn?;θ)
这样得到的
θ^值与
x1?,x2?,…,xn?有关,常记为
θ^(x1?,x2?,…,xn?) ,称为参数
θ的最大似然估计值,相应的统计量
θ^(X1?,X2?,…,Xn?) 称为参数
θ的最大似然估计量。
连续型总体的概率密度
f(xi?;θ),θ∈Θ
θ为待估参数,
Θ为参数的取值范围。
X1?,X2?,…,Xn?是来自总体X的样本,则
X1?,X2?,…,Xn?的概率密度函数为
i=1∏n?p(xi?;θ)
又设
x1?,x2?,…,xn?是样本的一组观察值,那么样本
(X1?,X2?,…,Xn?)落在
x1?,x2?,…,xn?的领域内的概率近似为
i=1∏n?p(xi?;θ)dxi?
因子
i=1∏n?dxi?与参数
θ无关, 所以似然函数:
L(θ)=L(x1?,x2?,…,xn?;θ)=i=1∏n?f(xi?;n)
满足下式
L(x1?,x2?,…,xn?;θ^)=θ∈Θmax?L(x1?,x2?,…,xn?;θ)
的
θ^(x1?,x2?,…,xn?)称为
θ的最大似然_估计值,
θ^(X1?,X2?,…,Xn?)称为最大似然估计量。
【说明】:
-
很多情形下,
p(xi?;θ)和
f(x;θ)关于
θ可微,
θ可从以下方程中解得
dθd?L(θ)=0
-
对数似然函数 :
lnL(θ)
-
对数似然方程组:
?θ?L(θ)?=i=1∑n??θ?lnp(xi?;θ)?=0
7.3 估计量的评选标准
一 、无偏性
定义 若
θ^=θ^(X1?,X2?,…,Xn?)为参数
θ的一个估计量,
Θ为参数
θ的取值范围,若对任意的
θ∈Θ, 有
E(θ^)=θ
则称
θ^是
θ的无偏估计量。
若
E(θ^)??=0, 那么
∣E(θ^)?θ∣称为估计量
θ^的偏差,
若
n→∞lim?E(θ)=θ,则称
θ^是
θ的 渐进无偏估计量。
例: 样本均值
Xˉ是总体均值
μ的无偏估计,样本方差
S2?=n?11?i=1∑n?(Xi??Xˉ)2是总体方差
σ2的无偏估计,而样本二阶中心矩
B2?=n1?i=1∑n?(Xi??Xˉ)2=nn?1?S2不是总体方差
σ2的无偏估计,但有
n→∞lim?E(B2?)=n→∞lim?nn?1?σ2=σ2,所以
B2?是
σ2的渐进无偏估计。
纠偏方法:如果
E(θ^)=aθ+b,θ∈Θ其中
a,b是常数,且
a??=0,则
a1?(θ^?b)是
θ的无偏估计。
二 、有效性
定义 设
θ^1?=θ^1?(X1?,X2?,…,Xn?)与
θ^2?=θ^2?(X1?,X2?,…,Xn?)都是
θ的无偏估计量,若对于任意的
θ∈Θ,有
D(θ^1?)≤D(θ^2?)
且至少对于某一个
θ∈Θ上式中的不等号成立,则称
θ^1?较
θ^2?有效。
三 、均方误差准则
定义 称
E(θ^?θ)2为均方误差,记为M(\hat{\theta}, \theta)M(θ^,θ)。显然,均方误差越小越好,这一准则称为均方误差准则。
均方误差可以分为两部分:
M(θ^,θ)=D(θ^)+(E(θ^)?θ)2
如果估计量是无偏估计,那么第二部分为0,均方误差变为方差。
四 、相合性
定义 设
θ^(X1?,X2?,…,Xn?)为参数
θ的一个估计量,
Θ若对任意的
θ∈Θ, 当
n→∞时,
θ^(X1?,X2?,…,Xn?)依概率收敛于
θ,则称
θ^为
θ的相合性估计量。
即,若对于任意
θ∈Θ都满足:对于任意
ε>0,有
n→∞lim?{∣θ^?θ∣<ε}=1
则称
θ^为
θ的相合性估计量。