概念定义
按照常用的术语,将两个类分别称为正类 (positive) 和 负类 (negative)。使用数学表示: +1表示正类 , -1 表示负类。
正类通常是少数类,即样本较少的类(例如有缺陷的零件)
负类通常是多数类,即具有更多样本的类(例如合格的零件)
单个类别内的比率
对于一个样本 x ,真实标记 y 和预测标记 f(x) 之间有四种可能的组合,如下表所示:
预测标记 f(x) = +1 | 预测标记 f(x) = -1 | |
---|---|---|
真实标记y=+1 | 真阳性(true positive) | 真阴性(true negative) |
真实标记y=-1 | 伪阳性(false positive) | 伪阴性(false negative) |
在每种可能的情况里,第二个字指的是预测的标记。第一个字用来描述预测是否正确。
例如,伪阳性表示预测的标记是“阳性” (+1),这个预测是错误的(“伪”);因此,真正的标记是“阴性”(-1)
TP:True Positive,分类器预测结果为正样本,实际也为正样本,即正样本被正确识别的数量。
FP:False Positive,分类器预测结果为正样本,实际为负样本,即误报的负样本数量。
TN:True Negative,分类器预测结果为负样本,实际为负样本,即负样本被正确识别的数量。
FN:False Negative,分类器预测结果为负样本,实际为正样本,即漏报的正样本数量。
Accuracy:准确率
Accuracy表征的是预测正确的样本比例。不过通常不用这个概念,主要是因为预测正确的负样本这个没有太大意义。
样本总数: TOTAL = TP+FN+FP+TN
Accuracy = (TP+TN) / 样本总数
Precision:查准率
Precision表征的是预测正确的正样本的准确度,查准率等于预测正确的正样本数量/所有预测为正样本数量。Precision越大说明误检的越少,Precision越小说明误检的越多。
Precision= TP / (TP+FP)
参考:https://zhuanlan.zhihu.com/p/386064764
https://zhuanlan.zhihu.com/p/498846393