数学建模(5)相关系数
两个数据中相关性的指标
总体和样本
总体数据
总体均值:
E(X)=n∑i=1n?Xi??
E(Y)=n∑i=1n?Yi??
总体协方差:
Cov(X,Y)=n∑i=1n?(Xi??E(X)(Yi??E(Y))?
Person相关系数:
ρXY?=σX?σY?Cov(X,Y)?=n∑i=1n?σX?(Xi??E(X)?σY?(Yi??E(Y))??
∣ρXY?∣?1,且当
Y=aX+b时,
ρ=±1
样本数据
样本均值:
E(X)=n∑i=1n?Xi??
E(Y)=n∑i=1n?Yi??
样本协方差:
Cov(X,Y)=n?1∑i=1n?(Xi??E(X)(Yi??E(Y))?
样本Person相关系数:
γXY?=SX?SY?Cov(X,Y)?
所以皮尔逊相关系数只能反映线性相关程度
注意:
非线性相关也会导致相关系数很大
离群点对于相关系数的影响很大
相关系数大,也不能说明相关
计算出相关系数为零,只能说不是线性相关,可能有其他关系。
题目中给了数据,可以做一些描述性统计,使用excel
如果不能确当两个变量是线性相关的,那么不能用相关系数。
matlab相关系数函数
R = corrcoef(A)
% A是矩阵
R = corrcoef(A,B)
% A、B是两个向量