roc曲线的意义_Pre / Rec / ROC / PR「建议收藏」

roc曲线的意义_Pre / Rec / ROC / PR「建议收藏」Precision和Recall值是既矛盾又统一的两个指标,为了提高Precision值,分类器需要尽量在“更有把握”时(即,提高分类阈值!)才把样本预测为正样本,但此时往往会因为过于保守而漏掉很多“没有把握”的正样本,导致Recall值降低。ROC(ReceiverOperatorCharacteristic)曲线被广泛应用于二分类问题中来评估分类器的可信度,但是当处理一…

大家好,又见面了,我是你们的朋友全栈君。

Precision 和 Recall值是既矛盾又统一的两个指标,为了提高 Precision 值,分类器需要尽量在 “更有把握” 时(即,提高分类阈值!)才把样本预测为正样本,但此时往往会因为过于保守而漏掉很多 “没有把握” 的正样本,导致 Recall 值降低。

ROC(Receiver Operator Characteristic)曲线被广泛应用于二分类问题中来评估分类器的可信度,但是当处理一些高度不均衡的数据集时,PR 曲线能表现出更多的信息,发现更多的问题。

首先理解这四个基本指标:

9f313402767be5e69ef2e89b5881fc57.png

ROC曲线中,是以FPR为x轴,TPR为y轴。

PR曲线中,以Recall为x轴,Precision为y轴。

绘制ROC曲线和PR曲线都是选定不同阈值,从而得到不同的x轴和y轴的值,画出曲线。

在 ROC 空间,ROC 曲线越凸向左上方向效果越好,但是,PR 曲线是右上凸效果越好。

当正负样本比例差距不大时,ROC和PR的趋势是差不多的,当正负样本比例差距很大时,ROC效果依然看似很好,但是PR曲线则会表现的比较差。

所以,PR曲线在正负样本比例悬殊较大时,更能反映分类器的性能。

当正负样本分布发生变化时,ROC 曲线的形状能够基本保持不变,而 P-R 曲线的形状一般会发生较剧烈的变化。这个特点让 ROC 曲线能够尽量降低不同测试集带来的干扰,更加客观地衡量模型本身的性能

这有什么实际意义呢?在很多实际问题中,正负样本数量往往很不均衡。比如,计算广告领域经常涉及转化率模型,正样本的数量往往是负样本数量的 1/1000 甚至 1/10000。若选择不同的测试集,P-R 曲线的变化就会非常大,而 ROC 曲线则能够更加稳定地反映模型本身的好坏。

所以,ROC 曲线的适用场景更多,被广泛用于排序、推荐、广告等领域。但需要注意的是,选择 P-R 曲线还是 ROC 曲线是因实际问题而异的,如果研究者希望更多地看到模型在特定数据集上的表现,P-R 曲线则能够更直观地反映其性能。

AUC(Area Under Curve) 即指曲线下面积占总方格的比例。有时不同分类算法的 ROC 曲线存在交叉,因此很多时候用 AUC 值作为算法好坏的评判标准。面积越大,表示分类性能越好。

wdmad:机器学习之类别不平衡问题 (2) —— ROC和PR曲线​zhuanlan.zhihu.com

10860a781b0eae86afa08179bd55df8f.png

(分析了ROC曲线的优缺点,以及ROC和PR的使用场景)

ROC曲线和PR(Precision-Recall)曲线的联系_SEAN是一只程序猿​www.fullstackdevel.com

7670f2ababefbf9e289a7322a188aff3.png

(解释了ROC和PR曲线的概念与画法)

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/145450.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • 用电脑浏览器模拟手机浏览器

    用电脑浏览器模拟手机浏览器最近开发手机网站,需要测试不同的手机,比较麻烦,所以想到了用电脑浏览器来模拟手机浏览.在网上找了些资料,在些方便有需要的朋友。1.用谷歌Chrome浏览器: 在Windows的【开始】–>【运行】中输入以下命令,自动启动后就只可以模拟相应手机的浏览器去访问3G手机网页: 谷歌Android:chrome.exe–user-agent=”Mozilla/5.0(Lin

  • 外键(FOREIGN KEY)

    外键(FOREIGN KEY)引子:把所有数据都存放于一张表的弊端  1、表的组织结构复杂不清晰  2、浪费空间  3、扩展性极差为了解决上述的问题,就需要用多张表来存放数据。表与表的记录之间存在着三种关系:一对多、多对多、一对一的关系。处理表之间关系问题就会利用到FOREIGNKEY多对一关系:寻找表与表之间的关系的套路  举例:雇员表:emp表  部门:dep表    part1:    …

  • 一个新的敲诈者病毒

    一个新的敲诈者病毒

  • 学了那么久爬虫,快来看看这些反爬,你能攻破多少?【对应看看自己修炼到了哪个等级~】

    ????在爬虫技术泛滥的今天,有不少小伙伴或是因为兴趣,或是因为工作所需,决定去学习爬虫,一入爬虫坑~????《一篇万字博文带你入坑爬虫这条不归路【万字图文】》????<-????但是,从最近我的技术交流群内粉丝们交流的一些问题中,我发现了一个很严重很严重的大问题——他们只是单纯想爬,却连一些最基础的反爬技术都不知晓。????->????《两万字博文教你python爬虫requests库【详解篇】》《万字博文教你python爬虫BeautifulSoup库【详解篇】》《万字博

  • checkbox选中和不选中 jqu_jquery checkbox 选中不选中

    checkbox选中和不选中 jqu_jquery checkbox 选中不选中展开全部$(function(){//动态绑定默认状态//$(“#ck”).attr(“checked”,true)//选中//$(“#ck”).attr(“checked”,false)//未选中//点击判断选中还是未选中$(“#ck”).click(function(){if($(this).is(“:checked”)){alert(“选中”);}else{alert…

  • 怎么给idea配置jdk_ideaj配置tomcat

    怎么给idea配置jdk_ideaj配置tomcat这里写自定义目录标题如何给Idea配置Tomcat安装Tomcat过程中出现的问题:怎么给idea配置idea如何给Idea配置Tomcat思路:首先下载好Tomcat安装包,然后安装好Tomcat,Tomcat安装成功后,再打开idea进行tomcat的配置。一、怎么安装Tomcat1.首先去官网(镜像网站)下载idea对应版本的tomcat2.下载完成tomcat后,放到你自己选择的文件位置。比如说我这里就是放在了D:\ProgramFiles\Java文件夹下面3.然后给Tomcat配

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号