一、以实际应用为导向
以终为始,先看看平均值的假设检验可以解决什么问题。
例子1:
老板问:这个月生产工艺变化了之后,生产出来的产品是不是及格呢?
已知累计使用时长服从正态分布,使用均值要求为1000小时,已知标准差为100小时。现在随机抽取30件,测得使用时间平均值为950小时。那么在显著水平0.05下判断这批产品是否及格。
例子2:
老板问:这个月网站新版的促销页面上线后,日均用户活跃数量是否有明显提升?
已知日均活跃用户数量服从正态分布,之前日均活跃用户数均值为750。现在随即抽取15天数据,测得日均活跃用户数均值为780,标准差为50。那么在显著水平0.05下判断日均活跃用户数量是否有明显提升。
二、基本概念
什么是假设检验
假设就是对从总体参数(均值、比例等)的具体数值所作的陈述,比如前面的例子,我先假设认为新版促销页面上线后的效果比之前要好。(日均用户活跃数量有显著变化)
假设检验就是先对总体的参数提出的假设,然后利用样本的信息判断假设是否成立的过程,比如上面的假设信息我该接受还是拒绝。
原假设与备择假设
待检验的假设又叫原假设(零假设),一般表示为H0,原假设一般表示两者没有显著性差异。
与原假设进行对比的叫备择假设,表示为H1。一般在比较的时候,主要有等于、大于、小于。
显著性水平
显著性水平是一个概率值,原假设为真时,拒绝原假设的概率,表示为α,常取值为0.05、0.01、0.10。
检验统计量
对原假设和备择假设作出决策的某个样本统计量,称为检验统计量。
根据给定的显著性水平,查表得出相应的临界值。再将检验统计量的值与该显著性水平的临界值进行比较,得出是否拒绝原假设的结论。
P值
是一个概率值,如果原假设为真,p值是抽样分布中大于或小于样本统计量的概率。
左检验时,p值为曲线上方小于等于检验统计量部分的面积。
右检验时,p值为曲线上方大于等于检验统计量部分的面积。
I类错误,II类错误
I类错误(弃真):原假设为真,但我们却否定它。
II类错误(采伪):原假设为假,但我们却没有否定它。
单侧检验、双侧检验
左侧检验:当假设的关键词有不少于/不低于之类的字眼,为左侧检验。
右侧检验:当假设的关键词有不多于/不高于之类的字眼,为右侧检验。
双侧检验:两端都计算显著性水平概率的检验,比如有不等于字眼的假设。
三、假设检验一般方法
(1)处理过程:
- 提出原假设与备择假设
- 从所研究总体中出抽取一个随机样本
- 构造检验统计量
- 根据显著性水平确定拒绝域临界值
- 计算检验统计量与临界值进行比较
(2)关于均值的检验
Z检验
一般用于大样本(样本容量大于30)的平均值差异性检验的方法。它是用标准正态分布的理论来推断差异发生的概率,从而比较两个平均值的差异是否显著。
Z统计量的计算公式:
T检验
主要用于小样本(样本容量小于30),总体标准差未知的正态分布平均值差异性检验。T检验是用t分布理论来推断差异发生的概率,从而比较两个平均数的差异是否显著。
t统计量的计算公式:
四、应用例子的解答
例子1:
(1)提出原假设与备择假设
原假设
备则假设
(2)总体中出抽取一个随机样本
如例子所述,随机抽取30件,测得使用时间平均值为950小时
(3)构造检验统计量
(4)显著性水平确定拒绝域临界值
根据显著水平0.05,查得临界值为-1.645
(5)检验统计量与临界值进行比较
因此拒绝假设,选择备则假设,所以这批产品不及格。
例子2:
(1)提出原假设与备择假设
原假设
备则假设
(2)总体中出抽取一个随机样本
如例子所述,随机抽取了15天数据,测得日均活跃用户数均值为780,标准差为50。
(3)构造检验统计量
(4)显著性水平确定拒绝域临界值
根据显著水平0.05,查得临界值为1.753
(5)检验统计量与临界值进行比较
因此拒绝假设,选择备则假设,所以日均活跃用户数有显著提升。