Classification week6: precision & recall 笔记

华盛顿大学 machine learning ：classification 笔记

第6周 precision & recall

1.accuracy 局限性

　　我们习惯用 accuracy 评价一个分类器模型的准确程度，accuracy即正确预测的样本数/预测样本总数，一般情况下这种评价都适用。

　　但假设一个这样的二分类器，95%的数据都是 +1 ，分类器直接把所有数据预测为 +1，那这个分类器的accuracy 为95%, 很高，但显然这不是个好的分类器。对于这样的数　　据，评价一个分类器模型准确程度还需别的评价标准。

2.True Positive & False Positive & False Negative & True Negative

　　对于一个二分类器，预测结果可能有以下几种情况:

　　True Positive: 实际为 +1，预测也为 +1。

　　False Positive: 实际为 -1，预测为 +1。

　　False Negative: 实际为 +1，预测为 -1。

　　True Negative: 实际为 -1，预测也为 -1。

3. Accuracy & precision & recall

　　Accuracy 表示为：

　　考虑另外两个评价参数 precision 和 recall。

4.Optimistic model & pessimistic model

Optimistic model：

　　一个预测模型过于乐观，即几乎对于所有样本都预测为 +1，这种情况往往发生在数据集多数为 +1 ，且模型过拟合的情况下。

　　这种模型的预测结果中， False Negative很少（实际+1 被预测为 -1），False Positive较多（实际-1 被预测为 +1）。即precision 较低， recall较高，Precision 和recall 中主要应注意 precision。

　　对于这种模型，需要注意减少false positive 的数量, 即：

　　计算Cost时false positive 与 false negative权重不同，false positive 的权重应更高；

　　提高预测为 +1 的confidence level，即提高判断为+1的阈值（+1 if probability >= threshold else -1），模型需要在更有把握的时候才能预测为 +1。

pessimistic model：

　　一个预测模型过于悲观，即只有在非常肯定的情况下才会预测为 +1，

　　这种模型的预测结果中， False Negative很多（实际+1 被预测为 -1），False Positive较少（实际-1 被预测为 +1）。即 precision较高， recall较低，应主要注意 recall。

　　对于这种模型，需要注意减少false negative 的数量，即

　　计算Cost时提高false negative 的权重。

　　降低预测为 +1 的confidence level。

5. 用Precision & recall评价模型好坏

　　显然，最理想的模型 precision、recall 都为1，然而实际情况中面临着 precision & recall 之间的权衡问题，precision 和recall 往往是此消彼长，例如有两个分类器模型A 和B，如下图所示，考虑到precision 和 recall, 哪个模型更好?

一个评价方法是：比较曲线下的面积大小（area-under-the-curve, AUC）。以这种方法进行比较，显然B分类器更好。

Classification week6: precision & recall 笔记的更多相关文章

评价指标整理：Precision, Recall, F-score, TPR, FPR, TNR, FNR, AUC, Accuracy
针对二分类的结果,对模型进行评估,通常有以下几种方法: Precision.Recall.F-score(F1-measure)TPR.FPR.TNR.FNR.AUCAccuracy 真实结果 1 ...
查准与召回（Precision & Recall）
Precision & Recall 先看下面这张图来理解了,后面再具体分析.下面用P代表Precision,R代表Recall 通俗的讲,Precision 就是检索出来的条目中(比如网页) ...
TP Rate ,FP Rate, Precision, Recall, F-Measure, ROC Area,
TP Rate ,FP Rate, Precision, Recall, F-Measure, ROC Area, https://www.zhihu.com/question/30643044 T/ ...
机器学习：评价分类结果（Precision - Recall 的平衡、P - R 曲线）
一.Precision - Recall 的平衡 1)基础理论调整阈值的大小,可以调节精准率和召回率的比重: 阈值:threshold,分类边界值,score > threshold 时分类为 ...
Precision,Recall,F1的计算
Precision又叫查准率,Recall又叫查全率.这两个指标共同衡量才能评价模型输出结果. TP: 预测为1(Positive),实际也为1(Truth-预测对了) TN: 预测为0(Negati ...
目标检测的评价标准mAP, Precision, Recall, Accuracy
目录 metrics 评价方法 TP , FP , TN , FN 概念计算流程 Accuracy , Precision ,Recall Average Precision PR曲线 AP计算 A ...
Handling skewed data---trading off precision& recall
preision与recall之间的权衡依然是cancer prediction的例子,预测为cancer时,y=1;一般来说做为logistic regression我们是当hθ(x)>=0 ...
通过Precision/Recall判断分类结果偏差极大时算法的性能
当我们对某些问题进行分类时,真实结果的分布会有明显偏差. 例如对是否患癌症进行分类,testing set 中可能只有0.5%的人患了癌症. 此时如果直接数误分类数的话,那么一个每次都预测人没有癌症的 ...
机器学习基础梳理—(accuracy,precision,recall浅谈)
一.TP TN FP FN TP:标签为正例,预测为正例(P),即预测正确(T) TN:标签为负例,预测为负例(N),即预测正确(T) FP:标签为负例,预测为正例(P),即预测错误(F) FN:标签 ...

随机推荐

利用Teensy进行EM410x卡模拟以及暴力破解EM410X类门禁系统可行性猜想
前些天Open入手了Teensy++2.0模拟EM410X,并且针对EM410X的门禁进行了一次暴力破解测试,以下就是相关代码以及内容. 什么是低频?什么是EM410x? 首先,我不得不再次提一下那些 ...
smokeping网络监控
一.smokeping介绍我们在选择机房的时候,如何知道这个机房的网络情况,这个时候就要用到网络监控软件:smokeping 本文主要介绍如何使用smokeping来监控idc机房的网络质量情况,从 ...
HA分布式集群一hadoop+zookeeper
一:HA分布式配置的优势: 1,防止由于一台namenode挂掉,集群失败的情形 2,适合工业生产的需求二:HA安装步骤: 1,安装虚拟机 1,型号:VMware_workstation_full_ ...
本地搭建ELK系统
ELK系统主要由三部分组成,各自是elasticsearch.logstash.kibana. ELK系统收到推送过来的日志后.首先由logstash解析日志中的字段,分解成一个一个的关键字. ela ...
各大网站css初始化代码【转】
文章来源:http://blog.sina.com.cn/s/blog_71ed1b870101a52w.html 腾讯QQ官网(http://www.qq.com)样式初始化 body,ol,ul, ...
[转载]linux 更新yum源改成阿里云源
原文链接:https://www.cnblogs.com/bincoding/p/7892762.html 1.备份 mv /etc/yum.repos.d/CentOS-Base.repo /etc ...
HTTP——请求和响应格式
HTTP请求格式:<request-line><headers><blank line>[<request-body>]说明:第一行必须是一个请求行(r ...
基于ShaderX5的顶点动画
关于顶点动画,ShaderX5里有篇专门来讲,在虚幻3引擎里也有一个更加丰富的实现.使用了一个Pivot Painter的3dmax脚本.其实自己灵活用vertex color可以避开使用Pivot ...
使用 Visual Studio 2012进行C语言开发
1.打开visual studio,选择菜单[文件]->[新建]->[项目],将会弹出新建项目对话框 2.在弹出的新建项目对话框中,选择和填补相应的属性. 3.点击确定之后,会跟着弹出应用 ...
【C#系列】你应该知道的委托和事件
[C#系列]你应该知道的委托和事件本篇文章更适合具有一定开发经验,一定功底,且对底层代码有所研究的朋友!!! 本篇文章主要采用理论和代码实例相结合方式来论述委托和事件,涉及到一些边界技术,如软件 ...

Classification week6: precision & recall 笔记

Classification week6: precision & recall 笔记的更多相关文章

随机推荐

热门专题