肯德尔相关性系数,又称肯德尔秩相关系数,它也是一种秩相关系数,不过它所计算的对象是分类变量。
分类变量可以理解成有类别的变量,可以分为
无序的,比如性别(男、女)、血型(A、B、O、AB);
有序的,比如肥胖等级(重度肥胖,中度肥胖、轻度肥胖、不肥胖)。
通常需要求相关性系数的都是有序分类变量。
举个例子。比如评委对选手的评分(优、中、差等),我们想看两个(或者多个)评委对几位选手的评价标准是否一致;或者医院的尿糖化验报告,想检验各个医院对尿糖的化验结果是否一致,这时候就可以使用肯德尔相关性系数进行衡量。
维基百科肯德尔相关性系数的计算公式:
R语言:ndarray 变量的相关系数矩阵
import numpy as np
vc=[1,2,39,0,8]
vb=[1,2,38,0,8]
print(np.mean(np.multiply((vc-np.mean(vc)),(vb-np.mean(vb))))/(np.std(vb)*np.std(vc)))
#corrcoef得到相关系数矩阵(向量的相似程度)
print(np.corrcoef(vc,vb))
计算结果为:-0.2611165
这时候就可以理解为两位老师对选手们的看法是呈相反趋势的,不过这种相反的程度不很大
参考:http://blog.sina.com.cn/s/blog_69e75efd0102wmd2.html
https://en.wikipedia.org/wiki/Kendall_rank_correlation_coefficient