一、准确率、精确率、召回率和 F 值 是选出目标的重要评价指标。不妨看看这些指标的定义先:
(1)若一个实例是正类,但是被预测成为正类,即为真正类(True Postive TP)
(2)若一个实例是负类,但是被预测成为负类,即为真负类(True Negative TN)
(3)若一个实例是负类,但是被预测成为正类,即为假正类(False Postive FP)
(4)若一个实例是正类,但是被预测成为负类,即为假负类(False Negative FN)
下表中:1代表正类,0代表负类:
TP:正确的匹配数目
FP:误报,没有的匹配不正确
FN:漏报,没有找到正确匹配的数目
TN:正确的非匹配数目
准确率(正确率)=所有预测正确的样本/总的样本 (TP+TN)/总 (预测的真正类+真负类 比上 总共)
精确率= 将正类预测为正类 / 所有预测为正类 TP/(TP+FP) (预测的真正类 比上 预测的真正类 + 假正类)
召回率 = 将正类预测为正类 / 所有正真的正类 TP/(TP+FN) (预测的真正类 比上 实际(Actual )真正类)
当参数a=1时,就是最常见的F1,也即
F1值 = 精确率 * 召回率 * 2 / ( 精确率 + 召回率) (F 值即为精确率和召回率的调和平均值)
可知F1综合了P和R的结果,当F1较高时则能说明试验方法比较有效。