当前位置: 代码迷 >> 综合 >> 【机器学习】高斯分布
  详细解决方案

【机器学习】高斯分布

热度:44   发布时间:2023-12-22 14:54:17.0

1.单变量高斯分布

单变量高斯分布概率密度函数定义为: 

p(x)=12πσ???exp{ ?12(x?μσ)2}(1.1)

式中 μ 为随机变量 x 的期望, σ2 x 的方差, σ 称为标准差: 
μ=E(x)=?xp(x)dx(1.2)

σ2=?(x?μ)2p(x)dx(1.3)

可以看出,该概率分布函数,由期望和方差就能完全确定。高斯分布的样本主要都集中在均值附近,且分散程度可以通过标准差来表示,其越大,分散程度也越大,且约有95%的样本落在区间(μ?2σ,μ+2σ)

2. 多元高斯分布

多元高斯分布的概率密度函数。多元高斯分布的概率密度函数定义: 

p(x)=1(2π)d2|Σ|12exp{ ?12(x?μ)TΣ?1(x?μ)}(2.1)

其中 x=[x1,x2,...,xd]T      是 d 维的列向量;  μ = [ d μ1,μ2,...,μd]Td维均值的列向量; 
Σd×d维的协方差矩阵; 
Σ?1Σ的逆矩阵; 
|Σ|Σ的行列式; 
(x?μ)T(x?μ)的转置,且 
μ=E(x)(2.2)

Σ=E{ (x?μ)(x?μ)T}(2.3)

其中 μ,∑     分别是向量 x 和矩阵 (x?μ)(x?μ)T 的期望,诺 xi x 的第 i 个分量, μi μ 的第 i 个分量, σ2ij 的第 i,j 个元素。则: 
μi=E(xi)=?xip(xi)dxi(2.4)

其中 p(xi) 为边缘分布: 
p(xi)=?????p(x)dx1dx2???dxd(2.5)

而 

不难证明,协方差矩阵总是对称非负定矩阵,且可表示为: 
Σ=??????σ211σ212???σ21dσ212???σ21dσ222???σ22d???σ22d???σ2dd??????

对角线上的元素 σ2ii xi 的方差,非对角线上的元素 σ2ij xi xj 的协方差。 
由上面可以看出,均值向量 μ d 个参数,协方差矩阵 因为对称,所以有 d(d+1)/2 个参数,所以多元高斯分布一共由 d+d(d+1)/2 个参数决定。 
从多元高斯分布中抽取的样本大部分落在由 μ Σ 所确定的一个区域里,该区域的中心由向量 μ 决定,区域大小由协方差矩阵 Σ 决定。且从式子(2.1)可以看出,当指数项为常数时,密度 p(x) 值不变,因此等密度点是使指数项为常数的点,即满足: 
(x?μ)TΣ?1(x?μ)=(2.7)

上式的解是一个超椭圆面,且其主轴方向由 的特征向量所决定,主轴的长度与相应的协方差矩阵 Σ 的特征值成正比。 
在数理统计中,式子(2.7)所表示的数量: 
γ2=(x?μ)TΣ?1(x?μ)

称为 x μ 的Mahalanobis距离的平方。所以等密度点轨迹是 x μ 的Mahalanobis距离为常数的超椭球面。这个超椭球体大小是样本对于均值向量的离散度度量。对应的M式距离为 γ 的超椭球体积为: 
V=Vd|Σ|12γd

其中 Vd 是d维单位超球体的体积: 
Vd=?????????πd2(d2)!,2dπ(d?12)(d?12)!d!,dd

如果多元高斯随机向量x的协方差矩阵是对角矩阵,则x

的分量是相互独立的高斯分布随机变量。



多元高斯分布的概率密度函数。多元高斯分布的概率密度函数定义: 

p(x)=