ROC 准确率，召回率 F-measure理解（转载）

ROC曲线、AUC、Precision、Recall、F-measure理解及Python实现

原文连接：http://www.cnblogs.com/haoguoeveryone/p/haoguo_5.html

本文首先从整体上介绍ROC曲线、AUC、Precision、Recall以及F-measure，然后介绍上述这些评价指标的有趣特性，最后给出ROC曲线的一个Python实现示例。

一、ROC曲线、AUC、Precision、Recall以及F-measure

二分类问题的预测结果可能正确，也可能不正确。结果正确存在两种可能：原本对的预测为对（True Positive 真正），原本错的预测为错（True Negative 真负）；结果错误也存在两种可能：原本是错类预测为正类数（False Positive 假正误报），原本是正类预测为错类数（False Negative 假负漏报），如Fig 1左侧所示。其中Y代表预测为正类，N代表预测错类，p代表原本为对，n代表原本为错。如何评价两个二分类模型的好坏呢？二分类模型的理想状态是什么呢？

首先回答第二个问题，理想的二分类模型能将原本是对的预测为对，原本是错的预测为错。一般情况下，我们很难收集到完备的“原本是对的，原本是错的”数据集，也就是说，通常情况下我们获得是完备的“原本是对的，原本是错的”数据集的一个子集。因此，评价二分类模型的优劣就是在该子集上进行的。我们希望在该子集上对二分类模型的评价是无偏的，也就是说，在概率上保证在该子集上对二分类模型的评价与在完备集上的评价一致。

针对第一个问题，其实很简单，数数就行了。数数原本是对的预测为对的个数，原本是错的预测为错的个数，原本是对的预测为错的比例，原本是错的预测为对的比例（评价二分类问题的四个基本元素，后续评价指标都是在此基础上做出的）。评价一个模型的好坏用四个参数是不是有点不太直观哦，要是只有一个评价指标，如果一个模型的这指标比别的模型大，那这个模型就比别的模型好（或者反过来，一个模型的这指标比别的模型小，那这个模型比别的模型好），该多好哦！哈哈！

precision的含义是：预测为对的当中，原本为对的比例（越大越好，1为理想状态）

recall的含义是：原本为对的当中，预测为对的比例（越大越好，1为理想状态）

F-measure的含义是：用precision和recall两个指标不直观（任性），索性把他们合并为一个，这就是F-measure（越大越好，1为理想状态，此时precision为1，recall为1）

accuracy的含义是：预测对的（包括原本是对预测为对，原本是错的预测为错两种情形）占整个的比例（越大越好，1为理想状态）

fp rate的含义是：原本是错的预测为对的比例（越小越好，0为理想状态）

tp rate的含义是：原本是对的预测为对的比例（越大越好，1为理想状态）

ROC曲线的含义是：得到算法的一组（fp rate， tp rate）然后做出的曲线（没办法用大小来衡量，不开心，因此有了AUC），如Fig 2所示

AUC的含义：ROC曲线下的面积（越大越好，1为理想状态）

Fig 2 ROC曲线示意图

二、上述评价评价指标的有趣特性

1）实际中应用测试数据集可能存在以下三种情况之一：原本是对的与原本是错的比例一致，原本是对的所占比例较小，原本是对的所占比例较大。在上述三种情况下，由于（fp rate， tp rate）基本保持不变，因此ROC曲线、AUC在一定程度上具备对数据集正负样本比例的不变性。

2）如果单纯蒙的话会是什么结果呢（假设原本是对的预测为对的比例，原本是错的预测为错的比例，原本是对的预测为错的比例，原本是错的预测为对的比例都为0.5，其实也就是蒙的直接结果了）？此时，precision、recall以及综合两者的F-measure值不能作为判断模型好坏的标准（因为原本是错的数量不确定，考虑原本是对的数据只有1，原本是错的数据有10000这种极端情况根据他们的定义即可得知precision近似为0，正负样本比例一致则precision约为0.5），也就是说上述三个指标受数据集正负样本比例影响。

3）（fp rate， tp rate）是如何获得呢？对于一个数据集应该只有一组（fp rate， tp rate）吧！这里面涉及到一个问题，就是二分类模型的输出通常是输入为对的概率，如果我们认为概率大于T的为对，那么如果T不同则（fp rate， tp rate）不同，因此我们获得了一组（fp rate， tp rate）。

三、ROC曲线的Python实现实例

读者可根据http://scikit-learn.org/stable/install.html提示方法安装scikit-learn

import numpy as np

from sklearn.metrics import roc_curve

y = np.array([1,1,2,2])

pred = np.array([0.1,0.4,0.35,0.8])

fpr, tpr, thresholds = roc_curve(y, pred, pos_label=2)

print(fpr)

print(tpr)

print(thresholds)

from sklearn.metrics import auc

print(auc(fpr, tpr))

上述代码可以得到ROC曲线数据对（fp rate，tp rate）（因为thresholds取不同值的缘故），AUC

总结：由二分类问题的四个基本元素出发，得出ROC曲线、AUC、Precision、Recall以及F-measure的定义及特性，最后给出Python的一个简单实现。

ROC 准确率，召回率 F-measure理解（转载）的更多相关文章

准确率,召回率,F值,ROC,AUC
度量表 1.准确率 (presion) p=TPTP+FP 理解为你预测对的正例数占你预测正例总量的比率,假设实际有90个正例,10个负例,你预测80(75+,5-)个正例,20(15+,5-)个负例 ...
分类器评估方法：精确度-召回率-F度量（precision-recall-F_measures）
注:本文是人工智能研究网的学习笔记 Precision和Recall都能够从下面的TP,TN,FP,FN里面计算出来. 几个缩写的含义: 缩写含义 P condition positive N co ...
信息检索（IR）的评价指标介绍 - 准确率、召回率、F1、mAP、ROC、AUC
原文地址:http://blog.csdn.net/pkueecser/article/details/8229166 在信息检索.分类体系中,有一系列的指标,搞清楚这些指标对于评价检索和分类性能非常 ...
准确率P 召回率R
Evaluation metricsa binary classifier accuracy,specificity,sensitivety.(整个分类器的准确性,正确率,错误率)表示分类正确:Tru ...
准确率(Accuracy), 精确率(Precision), 召回率(Recall)和F1-Measure
yu Code 15 Comments 机器学习(ML),自然语言处理(NLP),信息检索(IR)等领域,评估(Evaluation)是一个必要的工作,而其评价指标往往有如下几点:准确率(Accu ...
机器学习 F1-Score 精确率 - P 准确率 -Acc 召回率 - R
准确率召回率精确率 : 准确率->accuracy, 精确率->precision. 召回率-> recall. 三者很像,但是并不同,简单来说三者的目的对象并不相同. 大多时候 ...
准确率、精确率、召回率、F1
在搭建一个AI模型或者是机器学习模型的时候怎么去评估模型,比如我们前期讲的利用朴素贝叶斯算法做的垃圾邮件分类算法,我们如何取评估它.我们需要一套完整的评估方法对我们的模型进行正确的评估,如果模型效果比 ...
fashion_mnist 计算准确率、召回率、F1值
本文发布于 2020-12-27,很可能已经过时 fashion_mnist 计算准确率.召回率.F1值 1.定义首先需要明确几个概念: 假设某次预测结果统计为下图: 那么各个指标的计算方法为: A ...
一文让你彻底理解准确率，精准率，召回率，真正率，假正率，ROC/AUC
参考资料:https://zhuanlan.zhihu.com/p/46714763 ROC/AUC作为机器学习的评估指标非常重要,也是面试中经常出现的问题(80%都会问到).其实,理解它并不是非常难 ...
机器学习算法中的评价指标（准确率、召回率、F值、ROC、AUC等）
参考链接:https://www.cnblogs.com/Zhi-Z/p/8728168.html 具体更详细的可以查阅周志华的西瓜书第二章,写的非常详细~ 一.机器学习性能评估指标 1.准确率(Ac ...

随机推荐

javascript快速入门15--表单
大多数Web页面与用户之间的交互都发生在表单中,表单中有许多交互式HTML元素如:文本域,按钮,复选框,下拉列表等.从文档对象层次图中可以看到,表单是包含在文档中的,所以要访问表单,仍然需要通过doc ...
Render Texture coordinates
https://docs.unity3d.com/550/Documentation/Manual/SL-PlatformDifferences.html Render Texture coordin ...
【C语言疯狂讲义】（七）C语言进制转换
1.计算机中的进制 2进制:逢二进1 0 1 8进制:逢八进1 0 1 2 3 4 5 6 7 10进制:逢十进1 默认的进制 0 - 9 16进制:逢十六进 ...
$HTTP_RAW_POST_DATA 与$_POST
出处:http://blog.163.com/gwo-cce@126/blog/static/325736492008101142422345/ 这是手册里写的总是产生变量包含有原始的 POST 数 ...
php 实现 html转js
[php] <?php function htmltojs($str){ $re=''; $str=str_replace('\','\\',$str); $str=str_replace(&q ...
Session值的存储与删除
private static void SetSession<T>(string key, T val) { HttpContext.Current.Session[key] = (T)v ...
10张思维导图带你学习【JavaScript】
思维导图小tips:思维导图又叫心智图.是表达发射性思维的有效的图形思维工具 ,它简单却又极其有效,是一种革命性的思维工具.思维导图运用图文并重的技巧.把各级主题的关系用相互隶属与相关的层级图表现出来 ...
C#取调用堆栈StackTrace
Environment.StackTrace or System.Diagnostics.StackTrace if you need a more convienient (i.e. not str ...
NYOJ 诡异的电梯 && nyoj 1204 魔法少女
诡异的电梯[Ⅰ] 时间限制:1000 ms | 内存限制:65535 KB 难度:3 描述新的宿舍楼有 N(1≤N≤100000) 层 and M(1≤M≤100000)个学生. 在新的宿舍楼里 ...
C++ regex
我TM看了很久的文档,还是无法理解为什么我用MinGW GCC 4.8.1编译的C++11 <regex>总是抛出异常:regex_error 还是下载boost regex吧或者c语言 ...

ROC 准确率，召回率 F-measure理解（转载）

ROC 准确率，召回率 F-measure理解（转载）的更多相关文章

随机推荐

热门专题