1.单变量高斯分布
单变量高斯分布概率密度函数定义为:
p(x)=12πσ???√exp{
?12(x?μσ)2}(1.1)
式中 μ 为随机变量 x 的期望, σ2 为 x 的方差, σ 称为标准差:
μ=E(x)=∫∞?∞xp(x)dx(1.2)
σ2=∫∞?∞(x?μ)2p(x)dx(1.3)
可以看出,该概率分布函数,由期望和方差就能完全确定。高斯分布的样本主要都集中在均值附近,且分散程度可以通过标准差来表示,其越大,分散程度也越大,且约有95%的样本落在区间(μ?2σ,μ+2σ)
2. 多元高斯分布
多元高斯分布的概率密度函数。多元高斯分布的概率密度函数定义:
p(x)=1(2π)d2|Σ|12exp{
?12(x?μ)TΣ?1(x?μ)}(2.1)
其中 x=[x1,x2,...,xd]T 是 d 维的列向量; μ = [ d μ1,μ2,...,μd]T是d维均值的列向量;
Σ是d×d维的协方差矩阵;
Σ?1是Σ的逆矩阵;
|Σ|是Σ的行列式;
(x?μ)T是(x?μ)的转置,且
μ=E(x)(2.2)
Σ=E{
(x?μ)(x?μ)T}(2.3)
其中 μ,∑ 分别是向量 x 和矩阵 (x?μ)(x?μ)T 的期望,诺 xi 是 x 的第 i 个分量, μi 是 μ 的第 i 个分量, σ2ij 是 ∑ 的第 i,j 个元素。则:
μi=E(xi)=∫∞?∞xip(xi)dxi(2.4)
其中 p(xi) 为边缘分布:
p(xi)=∫∞?∞???∫∞?∞p(x)dx1dx2???dxd(2.5)
而
不难证明,协方差矩阵总是对称非负定矩阵,且可表示为:
Σ=??????σ211σ212???σ21dσ212???σ21dσ222???σ22d???σ22d???σ2dd??????
对角线上的元素 σ2ii 为 xi 的方差,非对角线上的元素 σ2ij 为 xi 和 xj 的协方差。
由上面可以看出,均值向量 μ 有 d 个参数,协方差矩阵 ∑ 因为对称,所以有 d(d+1)/2 个参数,所以多元高斯分布一共由 d+d(d+1)/2 个参数决定。
从多元高斯分布中抽取的样本大部分落在由 μ 和 Σ 所确定的一个区域里,该区域的中心由向量 μ 决定,区域大小由协方差矩阵 Σ 决定。且从式子(2.1)可以看出,当指数项为常数时,密度 p(x) 值不变,因此等密度点是使指数项为常数的点,即满足:
(x?μ)TΣ?1(x?μ)=常数(2.7)
上式的解是一个超椭圆面,且其主轴方向由 ∑ 的特征向量所决定,主轴的长度与相应的协方差矩阵 Σ 的特征值成正比。
在数理统计中,式子(2.7)所表示的数量:
γ2=(x?μ)TΣ?1(x?μ)
称为 x 到 μ 的Mahalanobis距离的平方。所以等密度点轨迹是 x 到 μ 的Mahalanobis距离为常数的超椭球面。这个超椭球体大小是样本对于均值向量的离散度度量。对应的M式距离为 γ 的超椭球体积为:
V=Vd|Σ|12γd
其中 Vd 是d维单位超球体的体积:
Vd=?????????πd2(d2)!,2dπ(d?12)(d?12)!d!,d为奇数d为偶数
如果多元高斯随机向量x的协方差矩阵是对角矩阵,则x
的分量是相互独立的高斯分布随机变量。
多元高斯分布的概率密度函数。多元高斯分布的概率密度函数定义:
p(x)=