当前位置: 代码迷 >> 综合 >> 概率论与数理统计 | (10) 数理统计
  详细解决方案

概率论与数理统计 | (10) 数理统计

热度:52   发布时间:2024-01-15 00:52:57.0

目录

1. 总体与样本

2. 统计量与常用统计量

3. 分布

4. t分布与F分布


1. 总体与样本

数理统计学是一门以数据为基础的学科.

数理统计学的任务就是如何获得样本和利用样本,从而对事物的某些未知方面进行分析、推断并作出一定的决策。

例如:生产厂家声称他们生产的灯泡平均寿命不低于6000小时,如何验证厂家说法的真伪?由于灯泡寿命试验是破坏性试验,不可能把整批灯泡逐一检测,只能抽取一部分灯泡进行检验,通过这部分灯泡的寿命数据来推断整批灯泡的平均寿命。

以部分数据信息来推断整体未知参数,就是数理统计研究问题的基本方式。

1)总体:研究对象的全体

2)个体:总体中的成员

3)总体的容量:总体中包含的个体数

4)有限总体:容量有限的总体

5)无限总体:容量无限的总体,通常将容量非常大的有限总体也按无限总体处理。

  • 例子

1)了解某校大学生“做过家教(包括 正在做家教)”的比例。总体是该校大学生全体。这是一个有限总体,每个大学生有许多指标,比如性别, 年龄,身高,体重,高考成绩...。现在我们关心的是学生是否“做过家教”这一指标。

2)了解某城市的空气质量情况,关注该城市的PM2.5值。总体是城市上空一定范围内的空气,这是一个无限总体,描述空气质量有许多指标,而我们仅关心PM2.5值。

3)药厂研究某种药物在人体中的吸收情况。 总体是全体国民,这是一个有限总体,但数量非常巨大,我们常把它看成无限总体。

为了采用数理统计方法进行分析,首先要收集数据,数据收集方法一般有两种:

1)通过调查、记录收集数据。如为了调查大学生是否“做过家教”,可以进行问卷调查;要了解PM2.5值,需要在城市设立若干监测站点,定时收集PM2.5数据。

2)通过实验收集数据。如为了了解药物吸收情况,首先要进行试验设计,并征集若干志愿者,按试验设计方案将他们分成若干组, 监测他们服药后不同时间点身体中药物含量, 记录相应的数据。

 

1)实际中人们通常只关注总体的某个(或几个) 指标。

2)总体的某个指标X, 对于不同的个体来说有不同的取值, 这些取值构成一个分布, 因此X可以看成一个随机变量.

3)有时候直接将X称为总体. 假设X的分布函数为F(x), 也称总体X具有分布F(x).

  • 如何推断总体分布的未知参数(或分布)?

需要从总体中抽取一部分个体, 根据这部分个体的数据,并利用概率论的知识等作出分析推断.

被抽取的部分个体叫做总体的一个样本.

  • 简单随机样本

1)获得简单随机样本的抽样称为简单随机抽样。 如何进行简单随机抽样?

2)对于有限总体, 采用放回抽样.

3)但当总体容量很大的时候,放回抽样有时候很不方便, 因此在实际中当总体容量比较大时, 通常将不放回抽样所得到的样本近似当作简单随机样本来处理.

4)对于无限总体, 一般采取不放回抽样.

  • 例题

已经得到的样本值为 6394, 1105, 4717, 1399,7952, 17424,3275,21639,2360,2896. 该如何利用这些样本值来估计未知参数\lambda?

 

2. 统计量与常用统计量

在上一部分例3中,为了估计指数分布的参数\lambda, 进行抽样观测,得到样本X_1,...,X_{10}和样本值6394, 1105,4717,1399,7952,

17424,3275,21639,2360,2896.样本中包含了许多信息。

对于推断总体的参数或分布而言,有些是有用的,重要的信息,有些则并不重要.

上例的样本至少提供了两种信息:

1)10个灯泡的平均寿命:有用且重要的信息

2)灯泡寿命的序号(如6394是第一个):不重要的信息

从样本中提取有用的信息来研究总体的分布及各种特征数.——构造统计量.

  • 统计量

样本的不含任何未知参数的函数。设(X1,...,X_n)为样本,若g(X_1,...,X_n)不含任何未知参数,则称g(X_1,...,X_n)为统计量。

一旦有了样本的观测值x_1,...,x_n就可以算出统计量的具体值g(x_1,...,x_n).

  • 常用统计量

  • 例题

  • 当总体数字特征未知时

这些非常直观的想法的理论依据,我们后续将进行学习。

1)统计量的分布被称为抽样分布

2)当总体X服从一般分布(如指数分布、均匀分布等),要得出统计量的分布是很困难的。

3)当总体X服从正态分布时,统计量\bar{X},S^2是可以计算的,那么服从什么分布呢?之后我们将学习数理统计中三个重要的抽样分布 --- \chi ^2分布,t分布,F分布。

 

3. 卡方分布

在数理统计中, 用于描述抽样分布的分布函数,除了正态分布外,最重要的三个分布分别为:

 \chi ^2分布,t分布,F分布。

之后我们将分别学习三个分布的定义,密度函数,图形,性质和分位数等。

  • 定义

  • 概率密度函数

  • 性质

  • 例题

 

4. t分布与F分布

  • t分布

定义:

概率密度函数:

  • F分布

定义:

性质:

概率密度函数:

  • 例题