二分类问题中混淆矩阵、PR以及AP评估指标

快到皖里来 2024-08-11 22:53:12 原文

仿照上篇博文对于混淆矩阵、ROC和AUC指标的探讨，本文简要讨论机器学习二分类问题中的混淆矩阵、PR以及AP评估指标；实际上，（ROC,AUC）与（PR,AP）指标对具有某种相似性。

按照循序渐进的原则，依次讨论混淆矩阵、PR和AP：

设定一个机器学习问题情境：给定一些肿瘤患者样本，构建一个分类模型来预测肿瘤是良性还是恶性，显然这是一个二分类问题。

本文中，将良性肿瘤视为正类标签（可能在具体实践中更为关注恶性肿瘤，不过这并不影响技术上的操作）。

当分类模型选定以后，将其在测试数据集上进行评估，分别可以得到以下评估指标：

混淆矩阵

TP表示预测为良性，真实情况是良性的样例数；

FN表示预测为恶性，真实情况是良性的样例数；

FP表示预测为良性，真实情况是恶性的样例数；

TN表示预测为恶性，真实情况是恶性的样例数；

以上四类数据构成混淆矩阵。

PR

在混淆矩阵的基础上，进一步地定义两个指标。

按照下式定义precision（P）指标

precision表示，预测为正的样本中有多少是真正的正样本；精准率强调对某类样本识别的准确性。

按照下式定义recall（R）指标

recall表示，样本中的正例有多少被预测正确了；召回率强调对某类样本识别的全面性。

precision,recall分别反映分类器对某一类样本鉴别能力的两个方面；通常，这两个指标呈现互斥关系，即一个指标高了往往会致使另一指标降低。

由上，一个混淆矩阵对应一对（precision,recall）

需要明确的是，P和R是建立在类别明确的预测结果之上的，即分类模型明确地指出待预测样本的类别。

然而，在二分类问题（0，1）中，一般模型最后的输出是一个概率值，表示结果是1的概率。此时需要确定一个阈值，若模型的输出概率超过阈值，则归类为1；若模型的输出概率低于阈值，则归类为0。

不同的阈值会导致分类的结果不同，也就是混淆矩阵有差，P和R也就不同。

当阈值从0开始慢慢移动到1的过程，就会形成很多对（precision,recall）的值，将它们画在坐标系上，就是所谓的PR曲线了。

AP

得到PR曲线后，就可以计算曲线下方的面积，计算出来的面积就是AP值。

一般而言，AP越大，模型的性能越好。

示例

二分类问题中混淆矩阵、PR以及AP评估指标的更多相关文章

E. Arson In Berland Forest（思维，找二维阵列中的矩阵，二分）
题:https://codeforces.com/contest/1262/problem/E 分析:预处理出阵列中的矩阵,然后二分答案还原题目的烧火过程,判断是否满足要求 #include<b ...
二分类算法的评价指标：准确率、精准率、召回率、混淆矩阵、AUC
评价指标是针对同样的数据,输入不同的算法,或者输入相同的算法但参数不同而给出这个算法或者参数好坏的定量指标. 以下为了方便讲解,都以二分类问题为前提进行介绍,其实多分类问题下这些概念都可以得到推广. ...
【分类问题中模型的性能度量(二)】超强整理，超详细解析，一文彻底搞懂ROC、AUC
文章目录 1.背景 2.ROC曲线 2.1 ROC名称溯源(选看) 2.2 ROC曲线的绘制 3.AUC(Area Under ROC Curve) 3.1 AUC来历 3.2 AUC几何意义 3.3 ...
[机器学习]-分类问题常用评价指标、混淆矩阵及ROC曲线绘制方法
分类问题分类问题是人工智能领域中最常见的一类问题之一,掌握合适的评价指标,对模型进行恰当的评价,是至关重要的. 同样地,分割问题是像素级别的分类,除了mAcc.mIoU之外,也可以采用分类问题的一些 ...
【分类问题中模型的性能度量(一)】错误率、精度、查准率、查全率、F1详细讲解
文章目录 1.错误率与精度 2.查准率.查全率与F1 2.1 查准率.查全率 2.2 P-R曲线(P.R到F1的思维过渡) 2.3 F1度量 2.4 扩展性能度量是用来衡量模型泛化能力的评价标准,错 ...
混淆矩阵(Confusion matrix)的原理及使用(scikit-learn 和 tensorflow)
原理在机器学习中, 混淆矩阵是一个误差矩阵, 常用来可视化地评估监督学习算法的性能. 混淆矩阵大小为 (n_classes, n_classes) 的方阵, 其中 n_classes 表示类的数量. ...
scikit-learn机器学习(二)逻辑回归进行二分类(垃圾邮件分类),二分类性能指标，画ROC曲线，计算acc,recall,presicion,f1
数据来自UCI机器学习仓库中的垃圾信息数据集数据可从http://archive.ics.uci.edu/ml/datasets/sms+spam+collection下载转成csv载入数据 im ...
基于Keras的imdb数据集电影评论情感二分类
IMDB数据集下载速度慢,可以在我的repo库中找到下载,下载后放到~/.keras/datasets/目录下,即可正常运行.)中找到下载,下载后放到~/.keras/datasets/目录下,即可正 ...
【sklearn】性能度量指标之ROC曲线（二分类）
原创博文,转载请注明出处! 1.ROC曲线介绍 ROC曲线适用场景二分类任务中,positive和negtive同样重要时,适合用ROC曲线评价 ROC曲线的意义 TPR的增长是以FPR的增长为代价 ...

随机推荐

Eureka详解系列(二)--如何使用Eureka(原生API，无Spring)
简介通过上一篇博客 Eureka详解系列(一)--先谈谈负载均衡器 ,我们知道了 Eureka 是什么以及为什么要使用它,今天,我们开始研究如何使用 Eureka. 在此之前,先说明一点.网上几乎所 ...
RabbitMq消费者在初始配置之后进行数据消费
RabbitMq消费者在初始配置之后进行数据消费问题背景在写一个消费rabbitmq消息的程序是,发现了一个问题,消费者的业务逻辑里面依赖这一些配置信息,但是当项目启动时,如果队列里面有积压数据的 ...
Simple decorator that intercepts connection errors and ignores these if settings specify this.
django-redis/cache.py at master · jazzband/django-redis https://github.com/jazzband/django-redis/blo ...
What is the difference between btree and rtree indexing?
https://softwareengineering.stackexchange.com/questions/113256/what-is-the-difference-between-btree- ...
python 11 模块
模块在计算机程序的开发过程中,随着程序代码越写越多,在一个文件里代码就会越来越长,越来越不容易维护. 为了编写可维护的代码,我们把很多函数分组,分别放到不同的文件里,这样,每个文件包含的代码就相对较 ...
Solon rpc 1.3.1 发布，推出Cloud接口与配置规范
Solon 是一个微型的Java RPC开发框架.项目从2018年启动以来,参考过大量前人作品:历时两年,3500多次的commit:内核保持0.1m的身材,超高的跑分,良好的使用体验.支持:Rpc. ...
理解前端模块概念：CommonJs与ES6Module
前言现代前端开发每时每刻都和模块打交道.例如,在项目中引入一个插件,或者实现一个供全局使用组件的JS文件.这些都可以称为模块. 在设计程序结构时,不可能把所有代码都放在一起.更为友好的组织方式时按照 ...
CNN(Convolutional Neural Network)
CNN(Convolutional Neural Network) 卷积神经网络(简称CNN)最早可以追溯到20世纪60年代,Hubel等人通过对猫视觉皮层细胞的研究表明,大脑对外界获取的信息由多层的 ...
Linux下部署tp5项目如何隐藏URL中index.php
找到nginx配置文件,加入以下代码: location / { if (!-e $request_filename){ rewrite ^/(.*)$ /index.php?s=/$1 last; ...
centos编译安装vim7.4
./configure --with-features=huge --enable-fontset --enable-gui=gtk2 --enable-multibyte --enable-pyth ...