目录
1. 随机变量
2. 离散型随机变量
3. 分布函数
4. 连续型随机变量及其概率密度
5. 均匀分布和指数分布
6. 正态分布
7. 随机变量函数的分布
1. 随机变量
- 两类试验结果
中心问题:将试验结果数量化。
- 随机变量定义
设随机试验的样本空间为S,若X = X(e)为定义在S上的实值单值函数,则成X(e)为随机变量,简写为X。
说明:
1)随机变量X (e) : S -> R 为一映射,其自变量具有随机性;
2)随机事件可以表示为
如:将一枚均匀的硬币抛掷3次, 样本空间为
3)对于,则必有
4) 一般用大写英文字母X,Y,Z或希腊字母等来表示随机变量
- 随机变量类型
1)离散型随机变量
2)连续型随机变量
- 离散型随机变量定义
若随机变量X的取值为有限个或可数个, 则称X为离散型随机变量。
可数集(也称为可列集): 是指能与自然数集N建立一一对应的集合.即其中的元素都是可以被数到的。
不可数集:是无穷集合中的一种.一个无穷集合和自然数集合之间如果不存在一一对应关系, 那么它就是一个不可数集。
- 离散型随机变量的概率分布率/分布率
分布率的内容:随机变量的所有可能取值;取每个可能取值时对应的概率
分布率的性质:
分布率的另一种表示形式:
- 例题
2. 离散型随机变量
- 0-1分布
定义:
应用:
一个随机试验,设A是一随机事件,且P(A) = p(0<p<1).若仅考虑事件A发生与否,就可以定义一个服从参数为p的0-1分布的随机变量:
来描述这个随机试验的结果.只有两个可能结果的试验, 称为贝努利(Bernoulli)试验,故两点分布 有时也称为贝努利分布.
1)检查产品的质量是否合格
2)对新生儿的性别进行登记
3)检验种子是否发芽
4)考试是否通过
5)求婚是否成功
6)马路乱停车是否会受罚
- 二项分布
考察:
马路乱停车9次, 若每次不被罚的概率为0.4,求9次中有2次不被罚的概率(假设每次是否被罚相互独立):
某人注册了6门MOOC课程, 若已知每门课的通过率为80%,假设每门课之间是独立的, 求他通过5门的概率:
设试验E只有两个可能的结果:,且P(A) = p, 0<0<1.将E独立地重复地进行n次,则称这一串重复的独立试验为n重贝努利试验.
我们想了解n重伯努利试验中结果A发生的次数的统计规律。
定义:
设X表示 n重贝努利试验中结果A发生的次数, 则X的可能取值为0,1,..., n,.
若X的概率分布律为,k=0,1,...,n,其中,就称X服从参数为n,p的二项分布(Binomial),记为X~B(n,p).
- 泊松分布
定义:
用途:
1)某人一天内收到的微信的数量
2)来到某公交站的乘客
3)某放射性物质发射出的粒子
4)显微镜下某区域中的白血球
如果某事件以固定强度λ,随机且独立地出现,该事件在单位时间内出现的次数(个数)可以看成是服从泊松分布.
即当 n>10,p<0.1时,二项分布B(n,p)可以用泊松分布来近似。
- 几何分布
若X的概率分布律为,其中0<p<1,称X服从参数为p的几何分布,记为X~Geom(p).
用途:
在重复多次的贝努里试验中, 试验进行到某种结果出现第一次为止, 此时的试验总次数服从几何分布. 如:射击,首次击中目标时射击的次数;上一小节的例2.
3. 分布函数
- 定义
随机变量X ,对任意实数x,称函数,为 X 的概率分布函数,简称分布函数.
任何随机变量都有相应的分布函数。
F(x)的几何意义:
- 用途
可以给出随机变量落入任意一个范围的可能性。
b-0 可以看作是比b小一丁点的数。
一般地,离散型随机变量的分布函数为阶梯函数。
设离散型随机变量X的分布律为 ; X的分布函数.
F(x) 在处有跳跃,其跳跃值为
- 性质
4. 连续型随机变量及其概率密度
- 定义
对于随机变量X的分布函数 F(x), 若存在非负的函数f(x), 使对于任意实数 x 有:
则称X为连续型随机变量,其中f (x)称为X的概率密度函数, 简称概率密度. 有时也写为.
- f(x)的性质
1)
2)
- 例题
5. 均匀分布和指数分布
- 均匀分布
定义:
若X的概率密度函数为:
其中a < b,就称X服从(a,b)上的均匀分布(Uniform),记为X~U(a,b)/Unif(a,b).
性质:均匀分布具有等可能性。
直观理解:
均匀分布的概率计算:
- 指数分布
定义:
性质:指数分布具有无记忆性
例题:
用途:
1)指数分布可以用来表示独立随机事件发生的时间 间隔,比如旅客进机场的时间间隔、中文维基百 科新条目出现的时间间隔等等;
2)在排队论中,一个顾客接受服务的时间长短也可 用指数分布来近似;
3)无记忆性的现象(连续时).
6. 正态分布
- 定义
- 两个参数的含义
1)当 固 定 , 改 变 的 大 小 时 , f ( x ) 图 形 的 形状不变,只是沿着 x 轴作平移变换;称为位置参数 (决定对称轴位置).
2)当固定,改变的大小时, f(x)图形 的对称轴不变,而形状在改变, 越小,图形越高越瘦,越大,图形越矮越胖.称为尺度参数 (决定曲线分散程度).
- 用途
1)自然界和人类社会中很多现象可以看做正态分布:
如: 人的生理尺寸(身高、体重);医学检验指标(红细胞数、血小板);测量误差;等等
2)多个随机变量的和可以用正态分布来近似:
如:注册MOOC的某位同学完成所有作业的时间;二项分布; 等等(By 中心极限定理)
- 正态分布的概率计算
积分计算方法:
1)用EXCEL、MATLAB、R等软件来计算;
2)用数值积分法;
3)转化为标准正态, 然后利用标准正态分布表来求(查表)。
- 标准正态分布
- 性质
- 例题
7. 随机变量函数的分布
- 问题
要得到一个圆的面积Y, 总是测量其半径, 半径的测量值可看作随机变量X,若,则的分布是什么?
若体重W(kg)均服从正态分布,在身高L(m)确定的情形下,则体质指标服从什么分布?
已知随机变量X的分布,Y=g(X),函数g已知,求Y的分布。
- 例题
一般,若已知X的概率分布, Y=g(X),求Y的概率分布的过程为: 先给出Y的可能取值; 再利用等价事件来给出概率分布.
1)若X为离散型随机变量, 则先写出Y的可能取值:;再找出的等价事件,得到
2)若X为连续型随机变量, 先根据X的取值范围, 给出Y的取值 范围;然后写出Y的概率分布函数:,找出的等价事件,得到;再求出Y的概率密度函数.
- 定理
一般地,若随机变量,若Y=aX+b,则.