机器学习评价方法 - Recall & Precision

刚开始看这方面论文的时候对于各种评价方法特别困惑，还总是记混，不完全统计下，备忘。

关于召回率和精确率，假设二分类问题，正样本为x，负样本为o：

准确率存在的问题是当正负样本数量不均衡的时候：

精心设计的分类器最后算准确率还不如直接预测所有的都是正样本。

用Recall和Precision来衡量分类效果，可以使用F1 Score = 2PR/(P+R)来判断分类效果。

调整分类器，移动到这里：

Recall达到百分之一百，但同时Precision也下降了：把不是负样本也分类成了正样本。一般来说，R高，P低，或者R低，P高。大概长这样：

从这里偷来的图

一个好的分类方法当然是希望二者都尽量高，也就是右图红色线那样，所以提出又提出了一个衡量标准：mAP=∫P(R)dR,（PR曲线面积越大越好）。

当然不同应用有不同需求，还是要根据具体应用设计。

记得微软ECCV14的人脸检测就是先用OpenCV里的VJ方法，把Recall调得很高，尽量保证不漏检，同时带来的问题是Precision很低，有很多不是脸的东西，再通过3000帧人脸对齐方法，迭代几次，一边对齐人脸一边把不是脸的排除掉。

另外还有 ROC AUC及其他各种......

ROC和AUC也是针对正负样本数量不均衡的，参考这里

ROC曲线越靠近左上角,试验的准确性就越高。最靠近左上角的ROC曲线的点是错误最少的最好阈值，其假阳性和假阴性的总数最少。亦可通过分别计算各个试验的ROC曲线下的面积(AUC)进行比较，哪一种试验的 AUC最大，则哪一种试验的诊断价值最佳。

kISSME（cvpr12）里的ROC曲线：

关于Precision和Recall，在Ng的cousera课程 week6 lecture11里有

机器学习评价方法 - Recall & Precision的更多相关文章

机器学习classification_report方法及precision精确率和recall召回率说明
classification_report简介 sklearn中的classification_report函数用于显示主要分类指标的文本报告．在报告中显示每个类的精确度,召回率,F1值等信息. 主要 ...
目标检测的评价标准mAP, Precision, Recall, Accuracy
目录 metrics 评价方法 TP , FP , TN , FN 概念计算流程 Accuracy , Precision ,Recall Average Precision PR曲线 AP计算 A ...
机器学习 F1-Score, recall, precision
在机器学习,模式识别中,我们做分类的时候,会用到一些指标来评判算法的优劣,最常用的就是识别率,简单来说,就是 Acc=Npre/Ntotal 这里的 Npre表示预测对的样本数,Ntotal表示测试集 ...
图像质量评价方法PSNR+SSIM&&评估指标SROCC,PLCC
update:2018-04-07 今天发现ssim的计算里面有高斯模糊,为了快速计算,先对每个小块进行计算,然后计算所有块的平均值.可以参考源代码实现,而且代码实现有近似的在里面!matlab中中图 ...
Spark Mllib里决策树二元分类使用.areaUnderROC方法计算出以AUC来评估模型的准确率和决策树多元分类使用.precision方法以precision来评估模型的准确率（图文详解）
不多说,直接上干货! Spark Mllib里决策树二元分类使用.areaUnderROC方法计算出以AUC来评估模型的准确率具体,见 Hadoop+Spark大数据巨量分析与机器学习整合开发实战的 ...
多准则决策模型-TOPSIS评价方法-源码
? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 ...
自动文档摘要评价方法：Edmundson，ROUGE
自动文档摘要评价方法大致分为两类: (1)内部评价方法(Intrinsic Methods):提供参考摘要,以参考摘要为基准评价系统摘要的质量.系统摘要与参考摘要越吻合, 质量越高. (2)外部评价方 ...
全参考视频质量评价方法（PSNR，SSIM）以及与MOS转换模型
转载处:http://blog.csdn.NET/leixiaohua1020/article/details/11694369 最常用的全参考视频质量评价方法有以下2种: PSNR(峰值信噪比):用 ...
视频质量评价方法：VQM
如何确定一个视频质量的好坏一直以来都是个棘手的问题.目前常用的方法就是通过人眼来直接观看,但是由于人眼的主观性及观看人员的单体差异性,对于同样的视频质量,不同的人的感受是不一样的.为此多个研究机构提出 ...

随机推荐

SQL server 2005数据库的还原与备份
一.SQL数据库的备份: 1.依次打开开始菜单 → 程序 → Microsoft SQL Server 2005→SQL Server Management Studio ,这里我以UMVTEST命 ...
【PyQt5-Qt Designer】QSpinBox-微调框
QSpinBox-微调框 QSpinBox类提供了一个微调框小部件. QSpinBox被设计为处理整数和离散值集合(例如,月份名称):使用QDoubleSpinBox 可以作为浮点数的调整. QSpi ...
安装 Samba服务
参考摘录的是博客园的文章:https://www.cnblogs.com/zhaopengcheng/p/5481048.html ubuntu系统:16.04 1. 首先用管理员权限创建一个新用户, ...
WordPress如何屏蔽恶意关键词搜索
我们在用WordPress建站比较方便,但如果网站有一定的权重后,一些不怀好意的人就会过来制作恶意内容,比如故意搜索邪恶的关键词.垃圾评论等,那我们如何屏蔽恶意搜索关键词呢?不会很难,会写点代码的朋友 ...
what's the python之模块
正则表达式首先,我们引入了正则表达式的知识.所谓正则表达式,就是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符.及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对 ...
006-Object.assign
一.Object.assign简要使用是ES6新添加的接口,主要的用途是用来合并多个JavaScript的对象. Object.assign()接口可以接收多个参数,第一个参数是目标对象,后面的都是 ...
windows media player 官方修复工具下载及修复方法
http://download.microsoft.com/download/E/2/3/E237A32D-E0A9-4863-B864-9E820C1C6F9A/MicrosoftFixit.Win ...
VS2008生成数据库连接字串
在写WEB程序的时候~通常需要在Web.config文件的<connectionStrings>节点上写数据库的链接字符串,因为是一串字符代码我们常常需要写在固定的文本里便于下次使用,其实 ...
testrem
<!DOCTYPE html> <html> <head> <meta charset="utf-8"> <meta http ...
Visual Studio Code的常用快捷键
一.Visual Studio Code简介 Visual Studio Code是个牛逼的编辑器,启动非常快,完全可以用来代替其他文本文件编辑工具.又可以用来做开发,支持各种语言,相比其他IDE,轻 ...

机器学习评价方法 - Recall & Precision

机器学习评价方法 - Recall & Precision的更多相关文章

随机推荐

热门专题