当前位置: 代码迷 >> 综合 >> 卡尔曼滤波(Kalman Filtering)——(2)基础知识(方差、协方差与相关系数)
  详细解决方案

卡尔曼滤波(Kalman Filtering)——(2)基础知识(方差、协方差与相关系数)

热度:0   发布时间:2023-12-16 23:07:46.0

卡尔曼滤波----方差、协方差与相关系数

  • 正态分布(高斯分布)
    • 一、 方差
    • 二、标准差
    • 三、协方差
      • 协方差矩阵
        • 样本的协方差矩阵
    • 四、方差,标准差与协方差之间的联系与区别
    • 五、相关系数
  • 参考文献

正态分布(高斯分布)

??正态分布是一种概率分布。正态分布是具有两个参数μ和σ2的连续型随机变量的分布,第一参数μ是遵从正态分布的随机变量的均值,第二个参数σ2是此随机变量的方差,所以正态分布记作N(μ,σ2 )。遵从正态分布的随机变量的概率规律为取 μ邻近的值的概率大 ,而取离μ越远的值的概率越小;σ越小,分布越集中在μ附近,σ越大,分布越分散。正态分布的密度函数的特点是:关于μ对称,在μ处达到最大值,在正(负)无穷远处取值为0,在μ±σ处有拐点。它的形状是中间高两边低 ,图像是一条位于x 轴上方的钟形曲线。当μ=0,σ2σ^2σ2 =1时,称为标准正态分布,记为N(0,1)。μ维随机向量具有类似的概率规律时,称此随机向量遵从多维正态分布。多元正态分布有很好的性质,例如,多元正态分布的边缘分布仍为正态分布,它经任何线性变换得到的随机向量仍为多维正态分布,特别它的线性组合为一元正态分布。

一元正态分布

二元正态分布

一、 方差

??方差是各个数据与平均数之差的平方的平均数。在概率论和数理统计中,方差(英文Variance)用来度量随机变量和其数学期望(即均值)之间的偏离程度。在许多实际问题中,研究随机变量和均值之间的偏离程度有着很重要的意义。

概率密度曲线

如果你从网上查找方差的公式,你会发现有2个公式!无偏估计

sN2=1N∑i=1N(xi?xˉ)2和 s2=1N?1∑i=1N(xi?xˉ)2\begin{aligned} &s_{N}^{2}=\frac{1}{N} \sum_{i=1}^{N}\left(x_{i}-\bar{x}\right)^{2}\\ \text { 和 }\\ &s^{2}=\frac{1}{N-1} \sum_{i=1}^{N}\left(x_{i}-\bar{x}\right)^{2} \end{aligned}   ?sN2?=N1?i=1N?(xi??xˉ)2s2=N?11?i=1N?(xi??xˉ)2?
那么哪个是正确的呢?又有什么区别呢?这里就要说下贝赛尔修正:
??在上面的方差公式和标准差公式中,存在一个值为N的分母,其作用为将计算得到的累积偏差进行平均,从而消除数据集大小对计算数据离散程度所产生的影响。不过,使用N所计算得到的方差及标准差只能用来表示该数据集本身(population)的离散程度;如果数据集是某个更大的研究对象的样本(sample),那么在计算该研究对象的离散程度时,就需要对上述方差公式和标准差公式进行贝塞尔修正,将N替换为N-1:
??简单的说,是除以 N 还是 除以 N-1,则要看样本是否全,比如,我要统计全国20岁男性的平均身高,这时间你肯定拿不到全部20岁男性的身高,所以只能随机抽样 500名,这时间要除以 N-1,因为只是部分数据;但是我们算沪深300在2017年3月份的涨跌幅,我们是可以全部拿到3月份的数据的,所以我们拿到的是全部数据,这时间就要除以 N。

二、标准差

??方差开根号。

三、协方差

??在概率论和统计学中,协方差用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。

??可以通俗的理解为:两个变量在变化过程中是否同向变化?还是反方向变化?同向或反向程度如何?

  • 你变大,同时我也变大,说明两个变量是同向变化的,这是协方差就是正的。
  • 你变大,同时我变小,说明两个变量是反向变化的,这时协方差就是负的。
  • 如果我是自然人,而你是太阳,那么两者没有相关关系,这时协方差是0。

从数值来看,协方差的数值越大,两个变量同向程度也就越大,反之亦然。
??可以看出来,协方差代表了两个变量之间的是否同时偏离均值,和偏离的方向是相同还是相反。
公式:如果有X,Y两个变量,每个时刻的“X值与其均值之差”乘以“Y值与其均值之差”得到一个乘积,再对这每时刻的乘积求和并求出均值,即为协方差。
σ(x,y)=1n?1∑i=1n(xi?xˉ)(yi?yˉ)Cov?(X,Y)=E[(X?μx)(Y?μy)]\begin{aligned} &\sigma(x, y)=\frac{1}{n-1} \sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)\left(y_{i}-\bar{y}\right) \\ &\operatorname{Cov}(X, Y)=E\left[\left(X-\mu_{x}\right)\left(Y-\mu_{y}\right)\right] \end{aligned} ?σ(x,y)=n?11?i=1n?(xi??xˉ)(yi??yˉ?)Cov(X,Y)=E[(X?μx?)(Y?μy?)]?

协方差矩阵

??对多维随机变量 X=[X1,X2,X3,…,Xn]T\mathbf{X}=\left[X_{1}, X_{2}, X_{3}, \ldots, X_{n}\right]^{T}X=[X1?,X2?,X3?,,Xn?]T, 我们往往需要计算各维度两两之间的协方差, 这样 各协方差组成了一个 n×nn \times nn×n 的矩阵, 称为协方差矩阵。协方差矩阵是个对称矩阵, 对角线上的元素是各维度上随机变量的方差。我们定义协方差矩阵为 Σ\SigmaΣ, 这个符号与求和 ∑\sum 相同,需要根据上下文区分。矩阵内的元素 Σij\Sigma_{i j}Σij?
Σij=cov?(Xi,Xj)=E[(Xi?E[Xi])(Xj?E[Xj])]\Sigma_{i j}=\operatorname{cov}\left(X_{i}, X_{j}\right)=\mathrm{E}\left[\left(X_{i}-\mathrm{E}\left[X_{i}\right]\right)\left(X_{j}-\mathrm{E}\left[X_{j}\right]\right)\right] Σij?=cov(Xi?,Xj?)=E[(Xi??E[Xi?])(Xj??E[Xj?])]
这样这个矩阵为
Σ=E[(X?E[X])(X?E[X])T]=[cov?(X1,X1)cov?(X1,X2)?cov?(X1,Xn)cov?(X2,X1)cov?(X2,X2)?cov?(X2,Xn)????cov?(Xn,X1)cov?(Xn,X2)?cov?(Xn,Xn)]\begin{gathered} \Sigma=\mathrm{E}\left[(\mathbf{X}-\mathrm{E}[\mathbf{X}])(\mathbf{X}-\mathrm{E}[\mathbf{X}])^{T}\right] \\ =\left[\begin{array}{cccc} \operatorname{cov}\left(X_{1}, X_{1}\right) & \operatorname{cov}\left(X_{1}, X_{2}\right) & \cdots & \operatorname{cov}\left(X_{1}, X_{n}\right) \\ \operatorname{cov}\left(X_{2}, X_{1}\right) & \operatorname{cov}\left(X_{2}, X_{2}\right) & \cdots & \operatorname{cov}\left(X_{2}, X_{n}\right) \\ \vdots & \vdots & \ddots & \vdots \\ \operatorname{cov}\left(X_{n}, X_{1}\right) & \operatorname{cov}\left(X_{n}, X_{2}\right) & \cdots & \operatorname{cov}\left(X_{n}, X_{n}\right) \end{array}\right] \end{gathered} Σ=E[(X?E[X])(X?E[X])T]=??????cov(X1?,X1?)cov(X2?,X1?)?cov(Xn?,X1?)?cov(X1?,X2?)cov(X2?,X2?)?cov(Xn?,X2?)??????cov(X1?,Xn?)cov(X2?,Xn?)?cov(Xn?,Xn?)????????
其中,对角线上的元素为各个随机变量的方差非对角线上的元素为两两随机变量之间的协方差

样本的协方差矩阵

与上面的协方差矩阵相同,只是矩阵内各元素以样本的协方差替换。样本集合为 {x?j=[x1j,x2j,…,xnj]T∣1?j?m}\left\{\mathbf{x}_{\cdot j}=\left[x_{1 j}, x_{2 j}, \ldots, x_{n j}\right]^{T} \mid 1 \leqslant j \leqslant m\right\}{ x?j?=[x1j?,x2j?,,xnj?]T1?j?m},
mmm 为样本数量, 所有样本可以表示成一个 n×mn \times mn×m 的矩阵。我们以Σ^\hat{\Sigma}Σ^表示样本的协方差矩阵, 与 Σ\SigmaΣ 区分。
Σ^=[q11q12?q1nq21q21?q2n????qn1qn2?qnn]\hat{\Sigma}=\left[\begin{array}{cccc} q_{11} & q_{12} & \cdots & q_{1 n} \\ q_{21} & q_{21} & \cdots & q_{2 n} \\ \vdots & \vdots & \ddots & \vdots \\ q_{n 1} & q_{n 2} & \cdots & q_{n n} \end{array}\right] Σ^=??????q11?q21??qn1??q12?q21??qn2???????q1n?q2n??qnn????????
=1m?1[∑j=1m(x1j?xˉ1)(x1j?xˉ1)∑j=1m(x1j?xˉ1)(x2j?xˉ2)?∑j=1m(x1j?xˉ1)(xnj?xˉn)∑j=1m(x2j?xˉ2)(x1j?xˉ1)∑j=1m(x2j?xˉ2)(x2j?xˉ2)?∑j=1m(x2j?xˉ2)(xnj?xˉn)????∑j=1m(xnj?xˉn)(x1j?xˉ1)∑j=1m(xnj?xˉn)(x2j?xˉ2)?∑j=1m(xnj?xˉn)(xnj?xˉn)]=1m?1∑j=1m(x?j?x?)(x?j?x?)T\begin{array}{cccc} =\frac{1}{m-1}\left[\begin{array}{cccc} \sum_{j=1}^{m}\left(x_{1 j}-\bar{x}_{1}\right)\left(x_{1 j}-\bar{x}_{1}\right) & \sum_{j=1}^{m}\left(x_{1 j}-\bar{x}_{1}\right)\left(x_{2 j}-\bar{x}_{2}\right) & \cdots & \sum_{j=1}^{m}\left(x_{1 j}-\bar{x}_{1}\right)\left(x_{n j}-\bar{x}_{n}\right) \\ \sum_{j=1}^{m}\left(x_{2 j}-\bar{x}_{2}\right)\left(x_{1 j}-\bar{x}_{1}\right) & \sum_{j=1}^{m}\left(x_{2 j}-\bar{x}_{2}\right)\left(x_{2 j}-\bar{x}_{2}\right) & \cdots & \sum_{j=1}^{m}\left(x_{2 j}-\bar{x}_{2}\right)\left(x_{n j}-\bar{x}_{n}\right) \\ \vdots & \vdots & \ddots & \vdots \\ \sum_{j=1}^{m}\left(x_{n j}-\bar{x}_{n}\right)\left(x_{1 j}-\bar{x}_{1}\right) & \sum_{j=1}^{m}\left(x_{n j}-\bar{x}_{n}\right)\left(x_{2 j}-\bar{x}_{2}\right) & \cdots & \sum_{j=1}^{m}\left(x_{n j}-\bar{x}_{n}\right)\left(x_{n j}-\bar{x}_{n}\right) \end{array}\right] \\ =\frac{1}{m-1} \sum_{j=1}^{m}\left(\mathbf{x}_{\cdot j}-\overline{\mathbf{x}}\right)\left(\mathbf{x}_{\cdot j}-\overline{\mathbf{x}}\right)^{T} \end{array} =m?11???????j=1m?(x1j??xˉ1?)(x1j??xˉ1?)j=1m?(x2j??xˉ2?)(x1j??xˉ1?)?j=1m?(xnj??xˉn?)(x1j??xˉ1?)?j=1m?(x1j??xˉ1?)(x2j??xˉ2?)j=1m?(x2j??xˉ2?)(x2j??xˉ2?)?j=1m?(xnj??xˉn?)(x2j??xˉ2?)??????j=1m?(x1j??xˉ1?)(xnj??xˉn?)j=1m?(x2j??xˉ2?)(xnj??xˉn?)?j=1m?(xnj??xˉn?)(xnj??xˉn?)???????=m?11?j=1m?(x?j??x)(x?j??x)T?
公式中 mmm 为样本数量, x?\overline{\mathbf{x}}x 为样本的均值, 是一个列向量, x?j\mathbf{x}_{\cdot j}x?j? 为第 jjj 个样本,也是一个列向量
??在写程序计算样本的协方差矩阵时,我们通常用后一种向量形式计算。一个原因是代码更紧江清晰, 另一个原因是计算机对矩阵及向量运算有大量的优化,效率高于在代码中计算每个元素。
??需要注意的是,协方差矩阵是计算样本不同维度之间的协方差,而不是对不同样本计算,所以协方差 矩阵的大小与维度相同。
??很多时候我们只关注不同维度间的线性关系,且要求这种线性关系可以互相比较。所以,在计算协方差矩阵之前,通常会对样本进行归一化,包括两部分:

  1. y?j=x.j?x??\mathbf{y}_{\cdot j}=\mathbf{x}_{. j}-\overline{\mathbf{x}}_{\circ}y?j?=x.j??x?? 即对样本进行平移,使其重心在原点;
  2. zi=yi./σi\mathbf{z}_{i}=\mathbf{y}_{i} . / \sigma_{i}zi?=yi?./σi? 。其中 σi\sigma_{i}σi? 是维度 iii 的标准差。这样消除了数值大小的影响。
    这样, 协方差矩阵 Σ^\hat{\Sigma}Σ^ 可以写成
    Σ^=1m?1∑j=1mz.jz?jT\hat{\Sigma}=\frac{1}{m-1} \sum_{j=1}^{m} \mathbf{z}_{. j} \mathbf{z}_{\cdot j}^{T} Σ^=m?11?j=1m?z.j?z?jT?
    该矩阵内的元素具有可比性。

四、方差,标准差与协方差之间的联系与区别

  1. 方差和标准差都是对一组(一维)数据进行统计的,反映的是一维数组的离散程度;而协方差是对2组数据进行统计的,反映的是2组数据之间的相关性。
  2. 标准差和均值的量纲(单位)是一致的,在描述一个波动范围时标准差比方差更方便。比如一个班男生的平均身高是170cm,标准差是10cm,那么方差就是10cm^2。可以进行的比较简便的描述是本班男生身高分布是170±10cm,方差就无法做到这点。
  3. 方差可以看成是协方差的一种特殊情况,即2组数据完全相同。
    协方差的计算公式为:
    σ(x,y)=1n?1∑i=1n(xi?xˉ)(yi?yˉ)\sigma(\boldsymbol{x}, \boldsymbol{y})=\frac{1}{n-1} \sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)\left(y_{i}-\bar{y}\right) σ(x,y)=n?11?i=1n?(xi??xˉ)(yi??yˉ?)
    其中, nnn 表示样本量,符号 xˉ,yˉ\bar{x}, \bar{y}xˉ,yˉ? 分别表示两个随机变量所对应的观测样本均值。
    y=x\boldsymbol{y}=\boldsymbol{x}y=x 时,有:
    σ(x,x)=1n?1∑i=1n(xi?xˉ)(xi?xˉ)=1n?1∑i=1n(xi?xˉ)2\begin{aligned} \sigma(\boldsymbol{x}, \boldsymbol{x}) &=\frac{1}{n-1} \sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)\left(x_{i}-\bar{x}\right) \\ &=\frac{1}{n-1} \sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2} \end{aligned} σ(x,x)?=n?11?i=1n?(xi??xˉ)(xi??xˉ)=n?11?i=1n?(xi??xˉ)2?
    即:方差 σx2\sigma_{x}^{2}σx2? 可视作随机变量 xxx 关于其自身的协方差 σ(x,x)\sigma(x, x)σ(x,x)
  4. 协方差只表示线性相关的方向,取值正无穷到负无穷。

五、相关系数

??相关度的大小了:相关系数
??协方差的相关系数,不仅表示线性相关的方向,还表示线性相关的程度,取值[-1,1]。也就是说,相关系数为正值,说明一个变量变大另一个变量也变大;取负值说明一个变量变大另一个变量变小,取0说明两个变量没有相关关系。同时,相关系数的绝对值越接近1,线性关系越显著。
相关系数:
1、也可以反映两个变量变化时是同向还是反向,如果同向变化就为正,反向变化就为负。
2、由于它是标准化后的协方差,因此更重要的特性来了:它消除了两个变量变化幅度的影响,而只是单纯反应两个变量每单位变化时的相似程度。
计算公式为:就是用X、Y的协方差除以X的标准差乘以Y的标准差。
ρ=Cov?(X,Y)σXσY\rho=\frac{\operatorname{Cov}(X, Y)}{\sigma_{X} \sigma_{Y}} ρ=σX?σY?Cov(X,Y)?

在概率论中,两个随机变量 X 与 Y 之间相互关系,大致有下列3种情况:

当 X, Y 的联合分布像左图那样时,我们可以看出,大致上有: X 越大 Y 也越大, X 越小 Y 也越小,这种情况,我们称为 “正相关”

当X, Y 的联合分布像中图那样时,我们可以看出,大致上有:X 越大Y 反而越小,X 越小 Y 反而越大,这种情况,我们称为 “负相关”

当X, Y 的联合分布像右图那样时,我们可以看出:既不是X 越大Y 也越大,也不是 X 越大 Y 反而越小,这种情况我们称为 “ 不相关”

怎样将这3种相关情况,用一个简单的数字表达出来呢?

  • 在图中的区域(1)中,有 X>EX ,Y-EY>0 ,所以(X-EX)(Y-EY)>0;

  • 在图中的区域(2)中,有 X<EX ,Y-EY>0 ,所以(X-EX)(Y-EY)<0;

  • 在图中的区域(3)中,有 X<EX ,Y-EY<0 ,所以(X-EX)(Y-EY)>0;

  • 在图中的区域(4)中,有 X>EX ,Y-EY<0 ,所以(X-EX)(Y-EY)<0。

当X 与Y 正相关时,它们的分布大部分在区域(1)和(3)中,小部分在区域(2)和(4)中,所以平均来说,有E(X-EX)(Y-EY)>0 。

当 X与 Y负相关时,它们的分布大部分在区域(2)和(4)中,小部分在区域(1)和(3)中,所以平均来说,有(X-EX)(Y-EY)<0 。

当 X与 Y不相关时,它们在区域(1)和(3)中的分布,与在区域(2)和(4)中的分布几乎一样多,所以平均来说,有(X-EX)(Y-EY)=0 。
所以,我们可以定义一个表示X, Y 相互关系的数字特征,也就是协方差
cov(X,Y)=E(X?EX)(Y?EY)cov(X, Y) = E(X-EX)(Y-EY)cov(X,Y)=E(X?EX)(Y?EY)

  • 当 cov(X, Y)>0时,表明 X与Y 正相关;

  • 当 cov(X, Y)<0时,表明X与Y负相关;

  • 当 cov(X, Y)=0时,表明X与Y不相关。

这就是协方差的意义。

??协方差矩阵的主对角线就是方差,反对角线上的就是两个变量间的协方差。
??就上面的二元高斯分布而言,协方差越大,图像越扁,也就是说两个维度之间越有联系。

参考文献

https://blog.csdn.net/northeastsqure/article/details/50163031

  相关解决方案