目录
1. 总体与样本
2. 统计量与常用统计量
3. 分布
4. t分布与F分布
1. 总体与样本
数理统计学是一门以数据为基础的学科.
数理统计学的任务就是如何获得样本和利用样本,从而对事物的某些未知方面进行分析、推断并作出一定的决策。
例如:生产厂家声称他们生产的灯泡平均寿命不低于6000小时,如何验证厂家说法的真伪?由于灯泡寿命试验是破坏性试验,不可能把整批灯泡逐一检测,只能抽取一部分灯泡进行检验,通过这部分灯泡的寿命数据来推断整批灯泡的平均寿命。
以部分数据信息来推断整体未知参数,就是数理统计研究问题的基本方式。
1)总体:研究对象的全体
2)个体:总体中的成员
3)总体的容量:总体中包含的个体数
4)有限总体:容量有限的总体
5)无限总体:容量无限的总体,通常将容量非常大的有限总体也按无限总体处理。
- 例子
1)了解某校大学生“做过家教(包括 正在做家教)”的比例。总体是该校大学生全体。这是一个有限总体,每个大学生有许多指标,比如性别, 年龄,身高,体重,高考成绩...。现在我们关心的是学生是否“做过家教”这一指标。
2)了解某城市的空气质量情况,关注该城市的PM2.5值。总体是城市上空一定范围内的空气,这是一个无限总体,描述空气质量有许多指标,而我们仅关心PM2.5值。
3)药厂研究某种药物在人体中的吸收情况。 总体是全体国民,这是一个有限总体,但数量非常巨大,我们常把它看成无限总体。
为了采用数理统计方法进行分析,首先要收集数据,数据收集方法一般有两种:
1)通过调查、记录收集数据。如为了调查大学生是否“做过家教”,可以进行问卷调查;要了解PM2.5值,需要在城市设立若干监测站点,定时收集PM2.5数据。
2)通过实验收集数据。如为了了解药物吸收情况,首先要进行试验设计,并征集若干志愿者,按试验设计方案将他们分成若干组, 监测他们服药后不同时间点身体中药物含量, 记录相应的数据。
1)实际中人们通常只关注总体的某个(或几个) 指标。
2)总体的某个指标X, 对于不同的个体来说有不同的取值, 这些取值构成一个分布, 因此X可以看成一个随机变量.
3)有时候直接将X称为总体. 假设X的分布函数为F(x), 也称总体X具有分布F(x).
- 如何推断总体分布的未知参数(或分布)?
需要从总体中抽取一部分个体, 根据这部分个体的数据,并利用概率论的知识等作出分析推断.
被抽取的部分个体叫做总体的一个样本.
- 简单随机样本
1)获得简单随机样本的抽样称为简单随机抽样。 如何进行简单随机抽样?
2)对于有限总体, 采用放回抽样.
3)但当总体容量很大的时候,放回抽样有时候很不方便, 因此在实际中当总体容量比较大时, 通常将不放回抽样所得到的样本近似当作简单随机样本来处理.
4)对于无限总体, 一般采取不放回抽样.
- 例题
已经得到的样本值为 6394, 1105, 4717, 1399,7952, 17424,3275,21639,2360,2896. 该如何利用这些样本值来估计未知参数?
2. 统计量与常用统计量
在上一部分例3中,为了估计指数分布的参数, 进行抽样观测,得到样本和样本值6394, 1105,4717,1399,7952,
17424,3275,21639,2360,2896.样本中包含了许多信息。
对于推断总体的参数或分布而言,有些是有用的,重要的信息,有些则并不重要.
上例的样本至少提供了两种信息:
1)10个灯泡的平均寿命:有用且重要的信息
2)灯泡寿命的序号(如6394是第一个):不重要的信息
从样本中提取有用的信息来研究总体的分布及各种特征数.——构造统计量.
- 统计量
样本的不含任何未知参数的函数。设为样本,若不含任何未知参数,则称为统计量。
一旦有了样本的观测值就可以算出统计量的具体值.
- 常用统计量
- 例题
- 当总体数字特征未知时
这些非常直观的想法的理论依据,我们后续将进行学习。
1)统计量的分布被称为抽样分布
2)当总体X服从一般分布(如指数分布、均匀分布等),要得出统计量的分布是很困难的。
3)当总体X服从正态分布时,统计量是可以计算的,那么服从什么分布呢?之后我们将学习数理统计中三个重要的抽样分布 --- 分布,t分布,F分布。
3. 卡方分布
在数理统计中, 用于描述抽样分布的分布函数,除了正态分布外,最重要的三个分布分别为:
分布,t分布,F分布。
之后我们将分别学习三个分布的定义,密度函数,图形,性质和分位数等。
- 定义
- 概率密度函数
- 性质
- 例题
4. t分布与F分布
- t分布
定义:
概率密度函数:
- F分布
定义:
性质:
概率密度函数:
- 例题