当前位置: 代码迷 >> 综合 >> 【定量分析、量化金融与统计学】统计推断基础(4)---假设检验(T或者Z检验)
  详细解决方案

【定量分析、量化金融与统计学】统计推断基础(4)---假设检验(T或者Z检验)

热度:39   发布时间:2023-09-20 12:17:28.0

目录

一、前言

二、假设检验的基本概念

1.假设检验的概念与目的:

2.原假设

三、假设检验的实例步骤:

例子:

一个问题:

四、不同种类的假设检验:

one-sample T检验:

Two-sample T检验:

(1)Matched Pairs 匹配成对检测

(2)Unmatched Pairs

One-tail 测试(单侧检验):

 two-tail检测(双侧检验)


一、前言

这一节来说一说假设检验,这是一个在统计学,量化领域很重要的一个概念。那么《统计推断基础》这个系列主章节主要是5部分,分别是:

  1. 总体、样本、标准差、标准误【定量分析、量化金融与统计学】统计推断基础(1)---总体、样本、标准差、标准误
  2. 样本均值分布、中心极限定理、正态分布【定量分析、量化金融与统计学】统计推断基础(2)---样本均值分布、中心极限定理、正态分布
  3. 点估计、区间估【定量分析、量化金融与统计学】统计推断基础(3)---点估计、区间估计
  4. 假设检验
  5. I型误差,II型误差

之后还会有一些番外来详细说一些其他的问题。

还是那句话,重点在基础概念,基础不牢,地动山摇,不关你是做研究还是本科基础学习阶段,基础都是很重要的。
 

二、假设检验的基本概念

1.假设检验的概念与目的:

假设检验是估计的延伸。

假设检验的目的是利用证据拒绝假设。我们不是要证明或证实假设。你的目的是拒绝,不是肯定。所以这将会影响到之后原假设的设计。

因此,只有当我们能够成功地拒绝假设时,我们才能得到有意义的结论。

例如:

糖果产品的包装袋上写着“每包平均含有50块水果咀嚼片”。
作为消费者,你想要挑战这种说法。如何建立一个有数据支持的案例?

那么这就是一个假设检验问题。

就是有一个人说了一个观点,你觉得不靠谱,想要推翻他,然后你通过假设检验,数据分析的方法得到了证据,于是你拒绝了这个观点。

所以假设检验是反证思想。

2.原假设

原假设(null hypothesis)就是你想要去拒绝的那个观点,一般记作H0。

三、假设检验的实例步骤:

例子:

糖果产品的包装袋上写着“每包平均含有50块水果咀嚼片”。
作为消费者,你想要挑战这种说法。如何建立一个有数据支持的案例?

那么在这个例子中,你的原假设是? = 50,所以H0:? = 50

(1)明确假设:

H0:? = 50

H1:? ≠ 50

(2)确定非拒绝范围:

我们的默认非拒绝概率是95%,也就是说有95%的概率接受H0,此时的我们的偏差范围是±1.96SE

【定量分析、量化金融与统计学】统计推断基础(4)---假设检验(T或者Z检验)

 (3)确定错误概率

当我们计算后,发现这个值并不在非拒绝范围内,那么这就是错误概率,那么错误概率=1-非拒绝概率,这种错误发生的概率称为“α”。

α决定了错误拒绝真假设的最大概率。

(4)计算样本平均值和样本的标准差(SD)

假设我们计算出来是这样的: 

n = 30(样本容量)

【定量分析、量化金融与统计学】统计推断基础(4)---假设检验(T或者Z检验)

(5)计算标准误(SE)

【定量分析、量化金融与统计学】统计推断基础(4)---假设检验(T或者Z检验)

(6)计算非拒绝域

【定量分析、量化金融与统计学】统计推断基础(4)---假设检验(T或者Z检验) 

(7) 下结论:

因为非拒绝域中不包含样本的均值52.4,所以我们拒绝接受H0,“每包水果的平均咀嚼次数不太可能是50个”。

一个问题:

为什么不在范围内就拒绝了?

我们来直观理解一下,我们设定的置信域为95%的情况下,也就是说样本的均值有95%的概率落在范围为48.783~51.217内,错误的概率只由5%,错误的概率很小了,但是很可惜,即使这么小的错误概率也发生了,52.4落在了范围之外,也就是说,“本来不可能发生的小概率事件发生了”,那么我们就可以说,你这个结论是假的,因为发生了小概率的事件。

四、不同种类的假设检验:

one-sample T检验:

只取1个样本作为证据(这个信息通常是给定的)检验叫做One-sample,刚刚的糖果例子就是one-sample。

Two-sample T检验:

(1)Matched Pairs 匹配成对检测

你的两组应该是成对的(通常是同一组的两个观察值)。

例如:

观察100个人的体重。

你需要观察同一组人不同时间的体重值。

用图像形容就是:(Z-test与T-test没有本质区别,Z适用于更大样本,T适用于小样本)

【定量分析、量化金融与统计学】统计推断基础(4)---假设检验(T或者Z检验)

什么时候用?

  1. 你想知道一组中的两个测量值在您感兴趣的变量上是否不同
  2. 感兴趣的变量是连续的
  3. 有两个且只有两个组(即来自单个组的两个测量值)
  4. 有配对样本
  5. 有一个正态的感兴趣变量(和总体方差已知)

(2)Unmatched Pairs

例如:两组人在1个月的体重(平均)下降有显著差异吗?

就是完全的两组,并不是一组人。

和上一个对比理解。

注意:不匹配成对测试计算SE的时候需要用以下公式:

【定量分析、量化金融与统计学】统计推断基础(4)---假设检验(T或者Z检验) 

One-tail 测试(单侧检验):

例如:所有11岁孩子的平均身高是

  1. 至少:110cm
  2. 至多:110cm
  3. 大于:110cm
  4. 小于:110cm

1-tail 的假设样子如下:

【定量分析、量化金融与统计学】统计推断基础(4)---假设检验(T或者Z检验)

注意:1-tail再计算比例的时候:

【定量分析、量化金融与统计学】统计推断基础(4)---假设检验(T或者Z检验)

 如果α = 5%那么就是单侧为5%不是2.5%

【定量分析、量化金融与统计学】统计推断基础(4)---假设检验(T或者Z检验)

 two-tail检测(双侧检验)

双尾假设总是定义为:

- H0中是一个等式

- H1中是一个不等式

例如:糖果问题:

H0:? = 50

H1:? ≠ 50

检测时因为是双尾,所以需要除以2,例如错误率为5%,那么你查表时就要查2.5%对应的Z值。

我们之后会专门出一个例题番外来详细介绍各个类别如何分析。

  相关解决方案