参数定义
在机器学习里面,通过会用到一些评价指标提到ROC曲线,F1-score等问题,这篇文章主要讲述了各参数是如何定义的,以及相互之间的关系。
首先,看一张表格:
预测\实际 | 正 | 负 |
正 | TP | FP |
负 | FN | TN |
接下来,解释着四个参数的具体含义
TP:实际是正例,预测为正例
FP:实际为负例,预测为正例
TN:实际为负例,预测为负例FN:实际为正例,预测为负例
公式推导
Recall(召回率)=sensitivity(灵敏性)=TPR=TP/(TP+FN),真正率,可理解为正确的被判断为正确的
Precision(精度)=TP/(TP+FP),准确度,预测为正类中,实际为正类的比例
FPR=FP/(FP+TN),负正类率
specificity(特异性)=TN/(TN+FP)=1-FPR,真负率,可理解为错误的被判断为错误的
2/F1-score=1/P+1/R ,F1值
ROC曲线:以TPR,FPR为Y轴,X轴绘制而成
PR曲线:以Precision,Recall为Y轴,X轴绘制而成