文章目录
- 基本指标
- 精确率(Precision)
- 召回率(Recall)
- 准确率(Accuracy)
- ROC曲线
基本指标
评价模型的常用方法——精确率、召回率、F1 值、ROC、AUC 各自的优缺点是什么?
假如数据可以被分为好数据(1)和坏数据(0),那么根据实际情况和评价结果的不同,总共能将结果分为四种情况:
True Positive(TP):实际为好数据,判定结果为好数据
False Positive(FP):实际为坏数据,判定结果为好数据
True Negative(TN):实际为坏数据,判定结果为坏数据
False Negative(FN):实际为好数据,判定结果为坏数据
注意,TP,FP,TN,FN的选定取决于0和1的情况,而不是数据本身的好坏。0和1的选定要看你自己想得到好数据还是坏数据。这里就认为好数据为1。
精确率(Precision)
在所有预测为好数据的结果中间,实际确实为好数据的占比(预测正确)。
Precision=TPTP+FPPrecision=\frac{TP}{TP+FP} Precision=TP+FPTP?
召回率(Recall)
在所有实际为好数据的数据中间,被预测为好数据的占比。
Recall=TPTP+FNRecall=\frac{TP}{TP+FN} Recall=TP+FNTP?
准确率(Accuracy)
在所有数据中间,被预测正确的占比。
Accuracy=TP+TNTP+TN+FP+FNAccuracy=\frac{TP+TN}{TP+TN+FP+FN} Accuracy=TP+TN+FP+FNTP+TN?
ROC曲线
首先需要介绍曲线的x轴和y轴:
X轴——True Positive Rate (TPR)
TPR=TPTP+FNTPR=\frac{TP}{TP+FN} TPR=TP+FNTP?
Y轴——False Positive Rate(FPR)
FPR=FPFP+TNFPR=\frac{FP}{FP+TN} FPR=FP+TNFP?
绘制曲线就是在坐标系中描上一系列(TPR,FPR)的点,然后连成一条曲线即可。