召回率、AUC、ROC模型评估指标精要

混淆矩阵

精准率/查准率，presicion 预测为正的样本中实际为正的概率

召回率/查全率，recall 实际为正的样本中被预测为正的概率 TPR

F1分数，同时考虑查准率和查全率，二者达到平衡，=2*查准率*查全率/（查准率+查全率）

真正率 = 灵敏度 sensitivity 召回率 TP/TP+FN ，只关注正样本中有多少被准确预测

假正率 = 1- 特异度 = FP/（FP+TN），有多少负样本被错误预测

在正负样本足够的情况下，可以用ROC曲线、AUC、KS评价模型区分能力和排序能力，在确定阈值后，可以根据精准率、召回率、F1评价模型效果

KS反映模型的最优区分效果，定义为好坏的最优阈值。

AUC是评估模型排序能力的指标，logloss是评估准确度的指标，用来排序的依据是概率值

auc值是一个概率值，意味着正样本排在负样本前面的概率

roc,auc,ks评估模型，这几个指标对于比例失衡的数据是相对比较客观的评估指标。

roc 曲线

横坐标是假正率，纵坐标是真正率.roc曲线尽可能的靠近左上边(0,1)的位置，效果越好

(0,0):真正率和假正率都是0，所有样本全部预测为负样本

(1,1):真正率和假正率都是1，所有样本全部预测为正样本

(0,1):真正率为1，假正率为0，正样本全部预测正确，负样本全部预测正确最完美的

情况

(1,0):真正率为0，假正率为1，正样本全部预测错误，负样本全部预测正确

confusion matrix

roc_curve

AUC曲线

ROC曲线下的面积，常介于0.5和1之间(极端情况下低于0.5)，可以直观的评价分类器的好

坏，值越大越好。

AUC值是一个概率值，当你随机挑选一个坏样本以及好样本，当前的分类算法根据计算得

到的概率值将这个

坏样本排在好样本前面的概率就是AUC值，AUC值越大，当前分类算法越有可能将坏样本

排在好样本前面，从而能够更好地分类。

AUC的常用阈值 >0.7;有很强的区分度 0.6~0.7;有一定的区分度 0.5~0.6,有较弱的区分度;

低于0.5,区分度弱于随机猜测

KS曲线

ks值大于0.3说明模型的区分里比较好，ks值大于0.2模型可用，但是区分力较差;ks值小于0.2大于0，模型的区分力差不可用; 如果ks值为负数，说明评分与好坏程度相悖，模型出现错误。ks指标的缺点是:只能表示区分度最好的分数的区分度，不能衡量其他分数。

召回率、AUC、ROC模型评估指标精要的更多相关文章

混淆矩阵、准确率、召回率、ROC曲线、AUC
混淆矩阵.准确率.召回率.ROC曲线.AUC 假设有一个用来对猫(cats).狗(dogs).兔子(rabbits)进行分类的系统,混淆矩阵就是为了进一步分析性能而对该算法测试结果做出的总结.假设总共 ...
[机器学习] 性能评估指标（精确率、召回率、ROC、AUC)
混淆矩阵介绍这些概念之前先来介绍一个概念:混淆矩阵(confusion matrix).对于 k 元分类,其实它就是一个k x k的表格,用来记录分类器的预测结果.对于常见的二元分类,它的混淆矩阵是 ...
【机器学习】--模型评估指标之混淆矩阵，ROC曲线和AUC面积
一.前述怎么样对训练出来的模型进行评估是有一定指标的,本文就相关指标做一个总结. 二.具体 1.混淆矩阵混淆矩阵如图: 第一个参数true,false是指预测的正确性. 第二个参数true,p ...
基于sklearn的metrics库的常用有监督模型评估指标学习
一.分类评估指标准确率(最直白的指标)缺点:受采样影响极大,比如100个样本中有99个为正例,所以即使模型很无脑地预测全部样本为正例,依然有99%的正确率适用范围:二分类(准确率):二分类.多分类( ...
精确率与召回率，RoC曲线与PR曲线
在机器学习的算法评估中,尤其是分类算法评估中,我们经常听到精确率(precision)与召回率(recall),RoC曲线与PR曲线这些概念,那这些概念到底有什么用处呢? 首先,我们需要搞清楚几个拗口 ...
【Model Log】模型评估指标可视化，自动画Loss、Accuracy曲线图工具，无需人工参与!
1. Model Log 介绍 Model Log 是一款基于 Python3 的轻量级机器学习(Machine Learning).深度学习(Deep Learning)模型训练评估指标可视化工具, ...
机器学习性能评估指标（精确率、召回率、ROC、AUC）
http://blog.csdn.net/u012089317/article/details/52156514 ,y^)=1nsamples∑i=1nsamples(yi−y^i)2
Python机器学习笔记：常用评估指标的用法
在机器学习中,性能指标(Metrics)是衡量一个模型好坏的关键,通过衡量模型输出y_predict和y_true之间的某种“距离”得出的. 对学习器的泛化性能进行评估,不仅需要有效可行的试验估计方法 ...
Spark ML机器学习库评估指标示例
本文主要对 Spark ML库下模型评估指标的讲解,以下代码均以Jupyter Notebook进行讲解,Spark版本为2.4.5.模型评估指标位于包org.apache.spark.ml.eval ...

随机推荐

JS对象 window对象屏幕可用高和宽度 1. screen.availWidth 属性返回访问者屏幕的宽度，以像素计，减去界面特性，比如任务栏。 2. screen.availHeight 属
屏幕可用高和宽度 1. screen.availWidth 属性返回访问者屏幕的宽度,以像素计,减去界面特性,比如任务栏. 2. screen.availHeight 属性返回访问者屏幕的高度,以像素 ...
第七章 yaml格式
一.简单说明 yaml是一个可读性高,用来表达数据序列的格式.YAML 的意思其实是:仍是一种标记语言,但为了强调这种语言以数据做为中心,而不是以标记语言为重点二.基本语法缩进时不允许使用Tab键 ...
LinkedBlockingQueue 学习
LinkedBlockingQueue 链表队列,其元素构成为: static class Node<E> { E item; Node<E> next; Node(E x) ...
设置ll命令
ll 是 ls -l的别名,之所以 ll出现错误是因为没有定义别名. 如果要实现ll 命令,可以做如下操作: 1.编辑 ~./bashrc 添加 ls -l 的别名为 ll即可. vi /root/. ...
cf期望概率专题
cf1009E:求到第i段期望和的比较困难,但是单独求每段的期望是比较容易的,所以单独对每段求和,然后累计总和 E[i]=1/2*a1+1/4*a2+...+1/2^(i-1)*ai-1+1/2^(i ...
Service4
DNS解析的作用• 为什么需要DNS系统– www.baidu.com 与 119.75.217.56,哪个更好记?– 互联网中的114查号台/导航员 • DNS服务器的功能– 正向解析:根据注册的域 ...
vue笔记一：设置表头的背景颜色以及下边框颜色
最近做的一个项目有个小小的需求,就是把表头的背景颜色改为黑色,表格边框颜色改为这个颜色,中间出了些问题,因为vue的表格样式是内联样式,一修改就影响到其他地方的表格样式,尽管我单独加了id还是不行,经 ...
PHP学习(MVC架构与面向对象)
想好好的学一下php中的一些面向对象的知识,以前只是为了打CTF随意的学了一下,但是为了以后的代码审计(准备PHP这边把thinkphp这个框架好好的学一下). PHP面向对象的基本知识类与对象类 ...
docker核心技术(2)
鸟瞰容器生态系统一谈到容器,大家都会想到 Docker. Docker 现在几乎是容器的代名词.确实,是 Docker 将容器技术发扬光大.同时,大家也需要知道围绕 Docker 还有一个生态系统. ...
[NOIP模拟测试7]visit 题解(组合数学+CRT+Lucas定理)
Orz 因为有T的限制,所以不难搞出来一个$O(T^3)$的暴力dp 但我没试据说有30分? 正解的话显然是组合数学啦首先$n,m$可能为负,但这并没有影响, 我们可以都把它搞成正的即都看作向右 ...

召回率、AUC、ROC模型评估指标精要

召回率、AUC、ROC模型评估指标精要的更多相关文章

随机推荐

热门专题