假设检验：知识点梳理，及最常见的平均值检验实例_综合

一、以实际应用为导向

以终为始，先看看平均值的假设检验可以解决什么问题。

例子1：

老板问：这个月生产工艺变化了之后，生产出来的产品是不是及格呢？

已知累计使用时长服从正态分布，使用均值要求为1000小时，已知标准差为100小时。现在随机抽取30件，测得使用时间平均值为950小时。那么在显著水平0.05下判断这批产品是否及格。

例子2：

老板问：这个月网站新版的促销页面上线后，日均用户活跃数量是否有明显提升？

已知日均活跃用户数量服从正态分布，之前日均活跃用户数均值为750。现在随即抽取15天数据，测得日均活跃用户数均值为780，标准差为50。那么在显著水平0.05下判断日均活跃用户数量是否有明显提升。

二、基本概念

什么是假设检验

假设就是对从总体参数(均值、比例等)的具体数值所作的陈述，比如前面的例子，我先假设认为新版促销页面上线后的效果比之前要好。（日均用户活跃数量有显著变化）

假设检验就是先对总体的参数提出的假设，然后利用样本的信息判断假设是否成立的过程，比如上面的假设信息我该接受还是拒绝。

原假设与备择假设

待检验的假设又叫原假设(零假设)，一般表示为H0，原假设一般表示两者没有显著性差异。

与原假设进行对比的叫备择假设，表示为H1。一般在比较的时候，主要有等于、大于、小于。

显著性水平

显著性水平是一个概率值，原假设为真时，拒绝原假设的概率，表示为α，常取值为0.05、0.01、0.10。

检验统计量

对原假设和备择假设作出决策的某个样本统计量，称为检验统计量。

根据给定的显著性水平，查表得出相应的临界值。再将检验统计量的值与该显著性水平的临界值进行比较，得出是否拒绝原假设的结论。

P值

是一个概率值，如果原假设为真，p值是抽样分布中大于或小于样本统计量的概率。

左检验时，p值为曲线上方小于等于检验统计量部分的面积。

右检验时，p值为曲线上方大于等于检验统计量部分的面积。

I类错误，II类错误

I类错误（弃真）：原假设为真，但我们却否定它。

II类错误（采伪）：原假设为假，但我们却没有否定它。

单侧检验、双侧检验

左侧检验：当假设的关键词有不少于/不低于之类的字眼，为左侧检验。

右侧检验：当假设的关键词有不多于/不高于之类的字眼，为右侧检验。

双侧检验：两端都计算显著性水平概率的检验，比如有不等于字眼的假设。

三、假设检验一般方法

（1）处理过程：

提出原假设与备择假设
从所研究总体中出抽取一个随机样本
构造检验统计量
根据显著性水平确定拒绝域临界值
计算检验统计量与临界值进行比较

（2）关于均值的检验

Z检验

一般用于大样本（样本容量大于30）的平均值差异性检验的方法。它是用标准正态分布的理论来推断差异发生的概率，从而比较两个平均值的差异是否显著。

Z统计量的计算公式：

T检验

主要用于小样本（样本容量小于30），总体标准差未知的正态分布平均值差异性检验。T检验是用t分布理论来推断差异发生的概率，从而比较两个平均数的差异是否显著。

t统计量的计算公式：

四、应用例子的解答

例子1：

（1）提出原假设与备择假设

原假设

备则假设

（2）总体中出抽取一个随机样本

如例子所述，随机抽取30件，测得使用时间平均值为950小时

（3）构造检验统计量

（4）显著性水平确定拒绝域临界值

根据显著水平0.05，查得临界值为-1.645

（5）检验统计量与临界值进行比较

因此拒绝假设，选择备则假设，所以这批产品不及格。