当前位置: 代码迷 >> 综合 >> 概率论与数理统计 | (3) 随机变量
  详细解决方案

概率论与数理统计 | (3) 随机变量

热度:41   发布时间:2024-01-15 00:55:40.0

目录

1. 随机变量

2. 离散型随机变量

3. 分布函数

4. 连续型随机变量及其概率密度

5. 均匀分布和指数分布

6. 正态分布

7. 随机变量函数的分布


1. 随机变量

  • 两类试验结果

中心问题:将试验结果数量化。

  • 随机变量定义

设随机试验的样本空间为S,若X = X(e)为定义在S上的实值单值函数,则成X(e)为随机变量,简写为X。

说明:

1)随机变量X (e) : S -> R 为一映射,其自变量具有随机性;

2)随机事件可以表示为 A = \{e:X(e) \in I\} = {X \in I},I\subset R

如:将一枚均匀的硬币抛掷3次, 样本空间为

3)对于i \neq j,则必有{X=i} \cap {X=j} = \varnothing

4) 一般用大写英文字母X,Y,Z或希腊字母\xi,\eta等来表示随机变量

  • 随机变量类型

1)离散型随机变量

2)连续型随机变量

  • 离散型随机变量定义

若随机变量X的取值为有限个或可数个, 则称X为离散型随机变量。

可数集(也称为可列集): 是指能与自然数集N建立一一对应的集合.即其中的元素都是可以被数到的。

不可数集:是无穷集合中的一种.一个无穷集合和自然数集合之间如果不存在一一对应关系, 那么它就是一个不可数集。

  • 离散型随机变量的概率分布率/分布率

分布率的内容:随机变量的所有可能取值;取每个可能取值时对应的概率

分布率的性质:p_k \geq 0,\sum_{k=1}^{+\infty}p_k = 1

分布率的另一种表示形式:P(X = x_k) = p_k ,k=1,2,...

  • 例题

2. 离散型随机变量

  • 0-1分布

定义:

应用:

一个随机试验,设A是一随机事件,且P(A) = p(0<p<1).若仅考虑事件A发生与否,就可以定义一个服从参数为p的0-1分布的随机变量:

来描述这个随机试验的结果.只有两个可能结果的试验, 称为贝努利(Bernoulli)试验,故两点分布 有时也称为贝努利分布.

1)检查产品的质量是否合格

2)对新生儿的性别进行登记

3)检验种子是否发芽

4)考试是否通过

5)求婚是否成功

6)马路乱停车是否会受罚

  • 二项分布

考察:

马路乱停车9次, 若每次不被罚的概率为0.4,求9次中有2次不被罚的概率(假设每次是否被罚相互独立):C_{9}^20.4^20.6^7

某人注册了6门MOOC课程, 若已知每门课的通过率为80%,假设每门课之间是独立的, 求他通过5门的概率:C_6^10.8^50.2

设试验E只有两个可能的结果:A,\bar{A},且P(A) = p, 0<0<1.将E独立地重复地进行n次,则称这一串重复的独立试验为n重贝努利试验.

我们想了解n重伯努利试验中结果A发生的次数的统计规律。

定义:

设X表示 n重贝努利试验中结果A发生的次数, 则X的可能取值为0,1,..., n,P(X=k) = C_{n}^kp^k(1-p)^{n-k}.

若X的概率分布律为P(X=k) = C_{n}^kp^k(1-p)^{n-k},k=0,1,...,n,其中n \geq 1,0<p<1,就称X服从参数为n,p的二项分布(Binomial),记为X~B(n,p).

  • 泊松分布

定义:

用途:

1)某人一天内收到的微信的数量

2)来到某公交站的乘客

3)某放射性物质发射出的粒子

4)显微镜下某区域中的白血球

如果某事件以固定强度λ,随机且独立地出现,该事件在单位时间内出现的次数(个数)可以看成是服从泊松分布.

即当 n>10,p<0.1时,二项分布B(n,p)可以用泊松分布\pi(np)来近似。

  • 几何分布

若X的概率分布律为P(X=k) = p(1-p)^{k-1},k=1,2,3...,其中0<p<1,称X服从参数为p的几何分布,记为X~Geom(p).

用途:

在重复多次的贝努里试验中, 试验进行到某种结果出现第一次为止, 此时的试验总次数服从几何分布. 如:射击,首次击中目标时射击的次数;上一小节的例2.

 

3. 分布函数

  • 定义

随机变量X ,对任意实数x,称函数F(x) = P\{X \leq x\},为 X 的概率分布函数,简称分布函数.

任何随机变量都有相应的分布函数。

F(x)的几何意义:

  • 用途

可以给出随机变量落入任意一个范围的可能性。

b-0 可以看作是比b小一丁点的数。

一般地,离散型随机变量的分布函数为阶梯函数。

设离散型随机变量X的分布律为P\{X=x_k \} = p_k,k=1,2,... ; X的分布函数F(x) = \sum_{x_k\leq x}p_k.

F(x) 在x = x_k(k=1,2,...)处有跳跃,其跳跃值为p_k = P\{X=x_k\}

  • 性质

4. 连续型随机变量及其概率密度

  • 定义

对于随机变量X的分布函数 F(x), 若存在非负的函数f(x), 使对于任意实数 x 有:

                        F(x) = \int_{-\infty}^x f(t) dt

则称X为连续型随机变量,其中f (x)称为X的概率密度函数, 简称概率密度. 有时也写为f_X(x).

  • f(x)的性质

1)f(x) \geq 0

2)\int_{-\infty}^{+\infty} f(x) dx = 1

  • 例题

5. 均匀分布和指数分布

  • 均匀分布

定义:

若X的概率密度函数为:

其中a < b,就称X服从(a,b)上的均匀分布(Uniform),记为X~U(a,b)/Unif(a,b).

性质:均匀分布具有等可能性。

直观理解:

均匀分布的概率计算:

  • 指数分布

定义:

性质:指数分布具有无记忆性

例题:

用途:

1)指数分布可以用来表示独立随机事件发生的时间 间隔,比如旅客进机场的时间间隔、中文维基百 科新条目出现的时间间隔等等;

2)在排队论中,一个顾客接受服务的时间长短也可 用指数分布来近似;

3)无记忆性的现象(连续时).

6. 正态分布

  • 定义

  • 两个参数的含义

1)当 固 定 \sigma , 改 变 \mu 的 大 小 时 , f ( x ) 图 形 的 形状不变,只是沿着 x 轴作平移变换;\mu称为位置参数 (决定对称轴位置).

2)当固定\mu,改变\sigma的大小时, f(x)图形 的对称轴不变,而形状在改变, \sigma越小,图形越高越瘦,\sigma越大,图形越矮越胖.\sigma称为尺度参数 (决定曲线分散程度).

  • 用途

1)自然界和人类社会中很多现象可以看做正态分布:

如: 人的生理尺寸(身高、体重);医学检验指标(红细胞数、血小板);测量误差;等等

2)多个随机变量的和可以用正态分布来近似:

如:注册MOOC的某位同学完成所有作业的时间;二项分布; 等等(By 中心极限定理)

  • 正态分布的概率计算

积分计算方法:

1)用EXCEL、MATLAB、R等软件来计算;

2)用数值积分法;

3)转化为标准正态, 然后利用标准正态分布表来求(查表)。

  • 标准正态分布

  • 性质

  • 例题

7. 随机变量函数的分布

  • 问题

要得到一个圆的面积Y, 总是测量其半径, 半径的测量值可看作随机变量X,若X\sim N(\mu,\sigma^2),则Y = \pi X^2的分布是什么?

若体重W(kg)均服从正态分布,在身高L(m)确定的情形下,则体质指标BMI = W/L^2服从什么分布?

已知随机变量X的分布,Y=g(X),函数g已知,求Y的分布。

  • 例题

一般,若已知X的概率分布, Y=g(X),求Y的概率分布的过程为: 先给出Y的可能取值; 再利用等价事件来给出概率分布.

1)若X为离散型随机变量, 则先写出Y的可能取值:y_1,y_2,...,y_j,...;再找出P\{Y=y_j\}的等价事件\{X \in D \},得到P\{Y=y_j\} = P\{X \in D\}

2)若X为连续型随机变量, 先根据X的取值范围, 给出Y的取值 范围;然后写出Y的概率分布函数:F_Y(y) = P\{Y \leq y\},找出P\{Y\leq y\}的等价事件\{X \in D \},得到F_Y(y) = P(x \in D);再求出Y的概率密度函数f_Y(y).

  • 定理

一般地,若随机变量X \sim N(\mu,\sigma^2),若Y=aX+b,则Y \sim N(a\mu + b,a^2\sigma^2).