当前位置: 代码迷 >> 综合 >> 假设检验:知识点梳理,及最常见的平均值检验实例
  详细解决方案

假设检验:知识点梳理,及最常见的平均值检验实例

热度:30   发布时间:2024-01-11 10:21:34.0

一、以实际应用为导向

以终为始,先看看平均值的假设检验可以解决什么问题。

例子1:

老板问:这个月生产工艺变化了之后,生产出来的产品是不是及格呢?

已知累计使用时长服从正态分布,使用均值要求为1000小时,已知标准差为100小时。现在随机抽取30件,测得使用时间平均值为950小时。那么在显著水平0.05下判断这批产品是否及格。

例子2:

老板问:这个月网站新版的促销页面上线后,日均用户活跃数量是否有明显提升?

已知日均活跃用户数量服从正态分布,之前日均活跃用户数均值为750。现在随即抽取15天数据,测得日均活跃用户数均值为780,标准差为50。那么在显著水平0.05下判断日均活跃用户数量是否有明显提升。

二、基本概念

什么是假设检验

假设就是对从总体参数(均值、比例等)的具体数值所作的陈述,比如前面的例子,我先假设认为新版促销页面上线后的效果比之前要好。(日均用户活跃数量有显著变化

假设检验就是先对总体的参数提出的假设,然后利用样本的信息判断假设是否成立的过程,比如上面的假设信息我该接受还是拒绝。

原假设与备择假设

待检验的假设又叫原假设(零假设),一般表示为H0,原假设一般表示两者没有显著性差异。

与原假设进行对比的叫备择假设,表示为H1。一般在比较的时候,主要有等于、大于、小于。

显著性水平

显著性水平是一个概率值,原假设为真时,拒绝原假设的概率,表示为α,常取值为0.05、0.01、0.10。

检验统计量

对原假设和备择假设作出决策的某个样本统计量,称为检验统计量。

根据给定的显著性水平,查表得出相应的临界值。再将检验统计量的值与该显著性水平的临界值进行比较,得出是否拒绝原假设的结论。

P

是一个概率值,如果原假设为真,p值是抽样分布中大于或小于样本统计量的概率。

左检验时,p值为曲线上方小于等于检验统计量部分的面积。

右检验时,p值为曲线上方大于等于检验统计量部分的面积。

I类错误,II类错误

I类错误(弃真):原假设为真,但我们却否定它。

II类错误(采伪):原假设为假,但我们却没有否定它。

单侧检验、双侧检验

左侧检验:当假设的关键词有不少于/不低于之类的字眼,为左侧检验。

右侧检验:当假设的关键词有不多于/不高于之类的字眼,为右侧检验。

双侧检验:两端都计算显著性水平概率的检验,比如有不等于字眼的假设。

三、假设检验一般方法

(1)处理过程:

  • 提出原假设与备择假设
  • 从所研究总体中出抽取一个随机样本
  • 构造检验统计量
  • 根据显著性水平确定拒绝域临界值
  • 计算检验统计量与临界值进行比较

(2)关于均值的检验

Z检验

一般用于大样本(样本容量大于30)的平均值差异性检验的方法。它是用标准正态分布的理论来推断差异发生的概率,从而比较两个平均值的差异是否显著。

Z统计量的计算公式:

T检验

主要用于小样本(样本容量小于30),总体标准差未知的正态分布平均值差异性检验。T检验是用t分布理论来推断差异发生的概率,从而比较两个平均数的差异是否显著。

t统计量的计算公式:

四、应用例子的解答

例子1:

(1)提出原假设与备择假设

原假设

备则假设

(2)总体中出抽取一个随机样本

如例子所述,随机抽取30件,测得使用时间平均值为950小时

(3)构造检验统计量

(4)显著性水平确定拒绝域临界值

根据显著水平0.05,查得临界值为-1.645

(5)检验统计量与临界值进行比较

因此拒绝假设,选择备则假设,所以这批产品不及格。

例子2:

(1)提出原假设与备择假设

原假设

备则假设

(2)总体中出抽取一个随机样本

如例子所述,随机抽取了15天数据,测得日均活跃用户数均值为780,标准差为50。

(3)构造检验统计量

(4)显著性水平确定拒绝域临界值

根据显著水平0.05,查得临界值为1.753

(5)检验统计量与临界值进行比较

因此拒绝假设,选择备则假设,所以日均活跃用户数有显著提升。