导语
对于任何一个学习概率论的童鞋来说,各种分布都是很头痛的一件事情,本篇主要讨论的是离散型随机变量.
伯努利分布
伯努利分布就是我们常见的0-1分布,即它的随机变量只取0或者1,各自的频率分别取1?p1?p和pp,当x=0x=0或者x=1x=1时,我们数学定义为:
p(x)=px?(1?p)1?x
p(x)=px?(1?p)1?x
其它情况下p(x)=0p(x)=0,伯努利分布是一个非常好理解的分布,也是很多其它分布的基础。
离散型随机变量期望:E(x)=∑x?p(x)E(x)=∑x?p(x)
方差:D(x)=E(x2)?E2(x)D(x)=E(x2)?E2(x)
对于伯努利分布来说,E(x)=1?p+0?(1?p)=p,D(x)=12?p?p2=p(1?p)E(x)=1?p+0?(1?p)=p,D(x)=12?p?p2=p(1?p)
二项分布
二项分布是这样一种分布,假设进行n次独立实验,每次实验“成功”的概率为pp,失败的概率为1?p1?p,所有成功的次数XX就是一个参数为nn和pp的二项随机变量.数学公式定义为:
p(k)=(nk)?pk?(1?p)n?k
p(k)=(nk)?pk?(1?p)n?k
二项分布公式基于伯努利分布得到,因为二项分布中每项实验都是独立的,因此每一次实验都是一次伯努利实验,在nn次实验中,成功kk次,排列方式有(nk)(nk)种,根据乘法原理,即可得到二项分布的公式。
话外:对于均值和方差的计算,XiXi是标准的伯努利分布,总发生次数X=∑n1XiX=∑1nXi,所以E(X)=E(∑n1Xi)=∑n1E(Xi)=n?pE(X)=E(∑1nXi)=∑1nE(Xi)=n?p,同理方差D(x)=∑n1D(Xi)=n?p?(1?p)D(x)=∑1nD(Xi)=n?p?(1?p)
几何分布和负二项分布
这是一个比较简单的分布,其中负二项分布是几何分布的一般形式,几何分布与二项分布类似,也是由nn次伯努利分布构成,随机变量XX表示第一次成功所进行试验的次数,则
p(k)=P(X=k)=p?(1?p)k?1,k=1,2,3,...
p(k)=P(X=k)=p?(1?p)k?1,k=1,2,3,...
负二项分布是几何分布的一般形式,表示直到成功r次停止,显而易见,当r=1时,它就是几何分布,则
P(X=k)=(k?1r?1)pr?(1?p)k?r
P(X=k)=(k?1r?1)pr?(1?p)k?r
关于几何分布的期望与方差,E(X)=1/pE(X)=1/p,D(x)=(1?p)/p2D(x)=(1?p)/p2,关于期望的证明,E(X)=∑∞n=1n?p?qn?1=p?∑∞n=1(qn)′=p?(∑∞n=1qn)′=1/pE(X)=∑n=1∞n?p?qn?1=p?∑n=1∞(qn)′=p?(∑n=1∞qn)′=1/p,方差证明与期望证明类似,不再赘述…
超几何分布
非常常见的一种分布,常用来表示在NN个物品中有指定商品MM个,不放回抽取nn个,抽中指定商品的个数,即XX~H(N,n,M)H(N,n,M),则抽中k件的概率为:
p(k)=P(X=k)=(Mk)?(N?Mn?k)(Nn)
p(k)=P(X=k)=(Mk)?(N?Mn?k)(Nn)
实际应用中超几何分布例子很多,比如彩票开奖你所符合的数字个数等。
泊松分布
泊松分布是离散型随机变量分布中相对较难的一种,泊松频率函数定义为:
P(X=k)=λk?e?λk!,k=0,1,2,3,...
P(X=k)=λk?e?λk!,k=0,1,2,3,...
泊松分布是二项分布的极限形式,可有二项分布概率公式推导得出,其中λ=n?pλ=n?p,当n>>pn>>p时,
p(k)=(nk)?pk?(1?p)n?k=n!?pk?(1?p)n?kk!?(n?k)!=n!?(λn)k?(1?λn)n?kk!?(n?k)!=λkk!?n!(n?k)!?k!?(1?λn)n?(1?λn)?k
p(k)=(nk)?pk?(1?p)n?k=n!?pk?(1?p)n?kk!?(n?k)!=n!?(λn)k?(1?λn)n?kk!?(n?k)!=λkk!?n!(n?k)!?k!?(1?λn)n?(1?λn)?k
当nn->∞∞时,λnλn->0,n!(n?k)!?k!n!(n?k)!?k!->1,(1?λn)n(1?λn)n->e?λe?λ,(1?λn)?k(1?λn)?k->1,所以
p(k)?>λk?e?λk!
p(k)?>λk?e?λk!
泊松分布的期望和方差均为λλ,证明过程严格按照定义即可,注意在证明过程中使用到了eλ的泰勒展开eλ的泰勒展开
泊松分布主要用来研究单位时间或单位空间内某时间的发生次数,同时事件的发生必须是相互独立的,比如单位时间内通过某一交通灯的车辆数等。λλ大概等于20时,泊松分布基本可以近似为正态分布进行处理。
泊松分布用来衡量事件的稳定性是一个不错的方法,再配合一些统计学上的检验方法,能够做很多东西,在之后的连续型随机变量中,有一种分布叫指数分布,它与泊松分布密不可分,可由泊松分布推导出
---------------------
作者:天空中的一缕微风
来源:CSDN
原文:https://blog.csdn.net/zlbflying/article/details/47777943?utm_source=copy
版权声明:本文为博主原创文章,转载请附上博文链接!