当前位置: 代码迷 >> 综合 >> 机器学习|单个正态总体的区间估计,均值、方差的置信区间求法+实际应用| 15mins 入门 |概统学习笔记(二十八)
  详细解决方案

机器学习|单个正态总体的区间估计,均值、方差的置信区间求法+实际应用| 15mins 入门 |概统学习笔记(二十八)

热度:86   发布时间:2023-12-21 14:21:22.0

(一)单个正态总体 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2)的区间估计

  1. 均值 μ \mu μ的置信区间

(1) σ 2 \sigma^2 σ2已知

X 1 , . . . , X n X_1,...,X_n X1?,...,Xn?是取自 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2)的样本, σ 2 \sigma^2 σ2已知,求参数 μ \mu μ的置信度为 1 ? α 1-\alpha 1?α的置信区间。

(明确问题,是求什么参数的置信区间?置信水平是多少?)

解:选 μ \mu μ的点估计为 X ? \overline X X X ? ? N ( μ , σ 2 n ) \overline X \sim N(\mu,\frac{\sigma^2}{n}) X?N(μ,nσ2?)

(寻找未知参数的一个良好估计,可用点估计法得到)

U = X ? ? μ σ / n ? N ( 0 , 1 ) U=\frac{\overline X-\mu}{\sigma/\sqrt{n}} \sim N(0,1) U=σ/n ?X?μ??N(0,1)

(寻找一个待估参数估计量的函数为枢轴量,要求其分布为已知,有了分布,就可以求出U取值于任意区间的概率)

对于给定的置信水平 1 ? α 1-\alpha 1?α,查正态分布表得 u α / 2 u_{\alpha /2} uα/2?,使得
P { ∣ X ? ? μ σ / n ∣ ≤ u α / 2 } = 1 ? α P\{|\frac{\overline X -\mu}{\sigma/\sqrt n}|\leq u_{\alpha/2}\}=1-\alpha P{ σ/n ?X?μ?uα/2?}=1?α
(对于给定的置信水平(大概率),根据U的分布,确定一个区间,使得U取值于该区间的概率为置信水平)

在这里插入图片描述

从中解得
P { X ? ? σ n u α / 2 ≤ μ ≤ X ? + σ n u α / 2 } = 1 ? α P\{\overline X-\frac{\sigma}{\sqrt n}u_{\alpha/2}\leq \mu \leq \overline X+ \frac{\sigma}{\sqrt n}u_{\alpha/2}\}=1-\alpha P{ X?n ?σ?uα/2?μX+n ?σ?uα/2?}=1?α
于是所求 μ \mu μ的置信区间为
[ X ? ? σ n u a / 2 , X ? + σ n u α / 2 ] [\overline X-\frac{\sigma}{\sqrt n}u_{a/2}, \overline X+\frac{\sigma}{\sqrt n}u_{\alpha/2}] [X?n ?σ?ua/2?,X+n ?σ?uα/2?]
也可简记为
X ? ± σ n u α / 2 \overline X \pm \frac{\sigma}{\sqrt n}u_{\alpha/2} X±n ?σ?uα/2?
实际应用

一个车间生产滚珠,滚珠的直径服从正态分布,从某天的产品里随机抽出5个滚珠,量得直径如下(单位:mm)。如果已知该天滚珠直径的方差为0.05,试求平均直径的置信区间( α = 0.05 \alpha=0.05 α=0.05).

滚珠1 滚珠2 滚珠3 滚珠4 滚珠5
14.6 15.1 14.9 15.2 15.1

解:滚珠直径 X ? N ( μ , 0.05 ) X\sim N(\mu,0.05) X?N(μ,0.05)
X ? = 14.6 + 15.1 + 14.9 + 15.2 + 15.1 5 = 14.98 ≈ μ \overline X=\frac{14.6+15.1+14.9+15.2+15.1}{5}=14.98 \approx \mu X=514.6+15.1+14.9+15.2+15.1?=14.98μ
置信度为 1 ? α = 0.95 1-\alpha=0.95 1?α=0.95,所以 u a 2 = u 0.025 = 1.96 u_{\frac{a}{2}}=u_{0.025}=1.96 u2a??=u0.025?=1.96

于是要求的置信区间为
[ 14.98 ? 1.96 × 0.05 5 , 14.98 + 1.96 × 0.05 5 ] = [ 14.8 , 15.2 ] [14.98-1.96\times \sqrt{\frac{0.05}{5}},14.98+1.96 \times \sqrt{\frac{0.05}{5}}]=[14.8,15.2] [14.98?1.96×50.05? ?,14.98+1.96×50.05? ?]=[14.8,15.2]
(2) σ 2 \sigma^2 σ2未知

σ 2 \sigma^2 σ2未知,故不能用前面给出 μ \mu μ的置信区间 [ X ? ? σ n u a / 2 , X ? + σ n u a / 2 ] [\overline X-\frac{\sigma}{\sqrt n}u_{a/2},\overline X+\frac{\sigma}{\sqrt n}u_{a/2}] [X?n ?σ?ua/2?,X+n ?σ?ua/2?]

考虑到 S 2 S^2 S2 σ 2 \sigma^2 σ2的无偏估计,因此只需将 U = X ? ? μ σ / n U=\frac{\overline X-\mu}{\sigma/\sqrt n} U=σ/n ?X?μ?中的 σ \sigma σ换成 S = S 2 S=\sqrt{S^2} S=S2 ?,于是有枢轴量(抽样分布定理3)
T = X ? ? μ S / n ? t ( n ? 1 ) T =\frac{\overline X-\mu}{S/\sqrt n} \sim t(n-1) T=S/n ?X?μ??t(n?1)
进而得出 μ \mu μ的置信区间为
[ X ? ? S n t a / 2 ( n ? 1 ) , X ? + S n t a / 2 ( n ? 1 ) ] [\overline X-\frac{S}{\sqrt n}t_{a/2}(n-1),\overline X+\frac{S}{\sqrt n}t_{a/2}(n-1)] [X?n ?S?ta/2?(n?1),X+n ?S?ta/2?(n?1)]
实际运用

? 已知某种木材横纹抗压力的实验值服从正态分布,对10个试件作横纹抗压力试验得数据如下(单位:Mpa)

? |48.2|49.3|45.7|47.1|51.0|44.6|43.5|41.8|39.4|46.9|

? 试对该木材的平均横纹抗压力进行区间估计 ( α = 0.05 ) (\alpha=0.05) (α=0.05)

? 解:总体的方差未知 σ 2 \sigma^2 σ2未知,对总体的 μ \mu μ值进行区间估计,应选用随机变量:
T = X ? ? μ S / n ? t ( n ? 1 ) T=\frac{\overline X-\mu}{S/\sqrt n}\sim t(n-1) T=S/n ?X?μ??t(n?1)
? 根据 P { ∣ T ∣ ≤ t a / 2 ( n ? 1 ) } = 1 ? α = 0.95 P\{|T|\leq t_{a/2}(n-1)\}=1-\alpha=0.95 P{ Tta/2?(n?1)}=1?α=0.95

? 查自由度为10-1=9的t分布表得:
t a / 2 ( n ? 1 ) = t 0.025 ( 9 ) = 2.262 t_{a/2}(n-1)=t_{0.025}(9)=2.262 ta/2?(n?1)=t0.025?(9)=2.262
? 即 P { ∣ X ? ? μ S / n ∣ ≤ 2.262 } = 0.95 P\{|\frac{\overline X-\mu}{S/\sqrt n}|\leq 2.262\}=0.95 P{ S/n ?X?μ?2.262}=0.95

? 于是平均横纹抗压力 μ \mu μ的置信区间为
[ X ? ? S n × 2.262 , X ? + S n × 2.262 ] [\overline X-\frac{S}{\sqrt n}\times 2.262,\overline X+ \frac{S}{\sqrt n}\times 2.262] [X?n ?S?×2.262,X+n ?S?×2.262]
? 将实验数据代入,得 X ? = 45.75 、 S = 35.218 \overline X=45.75、S=35.218 X=45.75S=35.218

? 则平均横纹抗压力的置信区间为 [ 43.23 , 48.269 ] [43.23, 48.269] [43.23,48.269]

  1. 方差 σ 2 \sigma^2 σ2的置信区间

根据实际情况需要,只需要介绍 μ \mu μ未知下的 σ 2 \sigma^2 σ2的置信区间。由于 σ 2 \sigma^2 σ2的无偏估计为 S 2 S^2 S2,所以一般采用以下函数G(抽样分布定理2)为枢轴量。
G = ( n ? 1 ) S 2 σ 2 ? χ 2 ( n ? 1 ) G=\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1) G=σ2(n?1)S2??χ2(n?1)
于是
P { χ 1 ? a / 2 2 ( n ? 1 ) < ( n ? 1 ) S 2 σ 2 < χ a / 2 2 ( n ? 1 ) } = 1 ? a P\{\chi^2_{1-a/2}(n-1)<\frac{(n-1)S^2}{\sigma^2}<\chi^2_{a/2}(n-1)\}=1-a P{ χ1?a/22?(n?1)<σ2(n?1)S2?<χa/22?(n?1)}=1?a

P { ( n ? 1 ) S 2 χ a / 2 2 ( n ? 1 ) < σ 2 < ( n ? 1 ) S 2 χ 1 ? a / 2 2 ( n ? 1 ) } = 1 ? a P\{\frac{(n-1)S^2}{\chi^2_{a/2}(n-1)}<\sigma^2<\frac{(n-1)S^2}{\chi^2_{1-a/2}(n-1)}\}=1-a P{ χa/22?(n?1)(n?1)S2?<σ2<χ1?a/22?(n?1)(n?1)S2?}=1?a
进而得出 σ 2 \sigma^2 σ2的置信区间为
[ ( n ? 1 ) S 2 χ a / 2 2 ( n ? 1 ) , ( n ? 1 ) S 2 χ 1 ? a / 2 2 ( n ? 1 ) ] [\frac{(n-1)S^2}{\chi^2_{a/2}(n-1)},\frac{(n-1)S^2}{\chi^2_{1-a/2}(n-1)}] [χa/22?(n?1)(n?1)S2?,χ1?a/22?(n?1)(n?1)S2?]
标准差 σ \sigma σ的置信区间为
[ S n ? 1 χ a / 2 2 ( n ? 1 ) , S n ? 1 χ 1 ? a / 2 2 ( n ? 1 ) ] [\frac{S\sqrt{n-1}}{\sqrt{\chi^2_{a/2}(n-1)}},\frac{S\sqrt{n-1}}{\sqrt{\chi^2_{1-a/2}(n-1)}}] [χa/22?(n?1) ?Sn?1 ??,χ1?a/22?(n?1) ?Sn?1 ??]
如果 μ \mu μ已知,则选择的枢轴量为
U = X ? ? μ σ / n ? N ( 0 , 1 ) U=\frac{\overline X-\mu}{\sigma/\sqrt n} \sim N(0,1) U=σ/n ?X?μ??N(0,1)

实际应用

岩石密度的测量误差服从正态分布,随机抽测12个样品得S=0.2,求 σ 2 \sigma^2 σ2的置信区间(a=0.1)

解:以X表示测量误差, X ? N ( μ , σ 2 ) X\sim N(\mu, \sigma^2) X?N(μ,σ2), 下面用样本的方差 S 2 = 0. 2 2 = 0.04 S^2=0.2^2=0.04 S2=0.22=0.04来估计总体的方差 σ 2 \sigma^2 σ2,对 σ 2 \sigma^2 σ2作区间估计(a=0.1),选用随机变量
X 2 = ( n ? 1 ) S 2 σ 2 ? χ 2 ( n ? 1 ) X^2=\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1) X2=σ2(n?1)S2??χ2(n?1)
于是
P { ( n ? 1 ) S 2 χ a / 2 2 ( n ? 1 ) < σ 2 < ( n ? 1 ) S 2 χ 1 ? a / 2 2 ( n ? 1 ) } = 0.9 P\{\frac{(n-1)S^2}{\chi^2_{a/2}(n-1)}<\sigma^2<\frac{(n-1)S^2}{\chi^2_{1-a/2}(n-1)}\}=0.9 P{ χa/22?(n?1)(n?1)S2?<σ2<χ1?a/22?(n?1)(n?1)S2?}=0.9
因为
χ 0.05 2 ( 12 ? 1 ) = 19.675 χ 0.95 2 ( 12 ? 1 ) = 4.575 \chi^2_{0.05}(12-1)=19.675 \\ \chi^2_{0.95}(12-1)=4.575 χ0.052?(12?1)=19.675χ0.952?(12?1)=4.575
σ 2 \sigma^2 σ2的置信区间为
[ ( n ? 1 ) S 2 χ a / 2 2 ( n ? 1 ) , ( n ? 1 ) S 2 χ 1 ? a / 2 2 ( n ? 1 ) ] = [ 0.02 , 0.10 ] [\frac{(n-1)S^2}{\chi^2_{a/2}(n-1)},\frac{(n-1)S^2}{\chi^2_{1-a/2}(n-1)}]=[0.02,0.10] [χa/22?(n?1)(n?1)S2?,χ1?a/22?(n?1)(n?1)S2?]=[0.02,0.10]