大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。
Jetbrains全系列IDE稳定放心使用
近期在做实验的时候一直出现Precision,Recall,F1score,以及accuracy这几个概念,为了防止混淆,在这里写下学习笔记,方便以后复习。
以一个二分类问题为例,样本有正负两个类别。
那么模型预测的结果和真实标签的组合就有4种:TP,FP,FN,TN,如下图所示。
TP实际为正样本你预测为正样本,FN实际为正样本你预测为负样本,
FP实际为负样本你预测为正样本,TN实际为负样本你预测为负样本。
首先我们来谈一个好理解的概念:
Accuracy(准确率)
这个概念的理解就是你预测对的样本数占样本总数的比例,那什么是预测对的样本?什么是总样本? 看上面的图,我们能知道预测正确的样本数是TP,TN;总体的样本数就是四个加起来:TP+FN+FP+TN。 所以根据定义,可以得到Acc的计算公式:
A c c u r a c y = T P + T N / ( T P + T N + F P + F N ) Accuracy = TP+TN / (TP +TN+FP+FN) Accuracy=TP+TN/(TP+TN+FP+FN)
紧接着我们来看什么是Precision(精确率)
很多人容易把accuracy和precision弄混,无论是叫法还是定义。实际上很简单,区别也很明显。
精确率是针对我们预测结果而言的,它表示的是预测为正的样本中有多少是真正的正样本。那么预测为正就有两种可能了,一种就是把正类预测为正类(TP),另一种就是把负类预测为正类(FP)
P r e c i s i o n = T P / ( T P + F P ) Precision = TP / (TP + FP) Precision=TP/(TP+FP)
随后是召回率(Recall):
召回率是针对我们原来的样本而言的,它表示的是样本中的正例有多少被预测正确了。那也有两种可能,一种是把原来的正类预测成正类(TP),另一种就是把原来的正类预测为负类(FN)。
R e c a l l = T P / ( T P + F N ) Recall = TP / (TP + FN) Recall=TP/(TP+FN)
一般情况下,召回率和精确率是针对某一个类别说的,比如正类别的Recall,负类别的Recall等。如果你是10分类,那么可以有1这个类别的Precision,2这个类别的Precision,3这个类别的Recall等。而没有类似全部数据集的Recall或Precision这种说法。 通常对于二分类,我们说正类的recall和precision。
补充:
在信息检索领域,精确率和召回率又被称为查准率和查全率,
查准率=检索出的相关信息量 / 检索出的信息总量
查全率=检索出的相关信息量 / 系统中的相关信息总量
F1-score 是基于召回率和精确率计算的:
F 1 s c o r e = 2 ∗ P r e c i s i o n ∗ R e c a l l / ( P r e c i s i o n + R e c a l l ) F1score = 2*Precision*Recall / (Precision+Recall) F1score=2∗Precision∗Recall/(Precision+Recall)
参考:https://blog.csdn.net/u014380165/article/details/77493978
发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/182038.html原文链接:https://javaforall.cn
【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛
【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...