NLP任务中的基本指标(precision and recall )

》》以下内容参考wikipedia。

https://en.wikipedia.org/wiki/Precision_and_recall

精确度 precision = (true positive)/(selected elements) = tp/(tp+fp) ，表示预测为正例的样本中，真正的正例所占的比例。
召回率 recall = (true positive)/(relevant elements) = tp/(tp+fn) ，表示被预测出的真正的正例，占真正的正例的比例。

注：实际任务中经常使用这两个基本指标的加权组合（即，F-measure，也称F-score），至于权值根据不同任务酌情使用。

经常使用的而是两者的调和平均数，即(其中p表示precision， r表示recall)：

对于多分类（如N分类），可以看成是N分类，对N个类别的p,r,F1值的平均方法有两种：marco-（即宏平均），micro-（即微平均）。

macro-：先分别计算出各类的指标，再取平均值。如macro_p= (p₁+p₂+...+p_N)/N

micro-：先计算出所有类别的tp, fp等的平均值，再代入指标计算公式中求出结果。如micro_p= ave_tp/(ave_tp+ave_fp)

类似方法计算得 macro-r, micro-r

最后：

macro_f1 = 2*macro_p*macro_r / (macro_p+macro_r)

micro_f1 = 2*micro_p*micro_r / (micro_p+micro_r)

补充机器学习分类任务中其他指标：

准确率(accuracy)

　　　其定义是: 对于给定的测试数据集，正确分类的样本数与总样本数之比。

　　　accuracy = (true positive + true negative) / (tp + tn + fp + fn)

混淆矩阵（Confusion Matrix）

　　在机器学习领域，混淆矩阵（confusion matrix），又称为可能性表格或是错误矩阵。

　　例如：　　

　　　　实际值：8只cat， 6条dog， 13只rabbit

　　　　预测值：7只cat， 8条dog， 12只rabbit

　　　　则混淆矩阵为：

从上表中能看出：

Cat的召回率(recall)： 5/8

Dog的召回率(recall)： 3/6

Rabbit 的召回率(recall)：11/13

Cat的精确率(precision)： 5/7

Dog的精确率(precision)： 3/8

Rabbit 的精确率(precision)：11/12

上例参考自：http://blog.csdn.net/vesper305/article/details/44927047

对数损失（Log-Loss）

曲线下面积（AUC

NLP任务中的基本指标(precision and recall )的更多相关文章

机器学习常用性能度量中的Accuracy、Precision、Recall、ROC、F score等都是些什么东西？
一篇文章就搞懂啦,这个必须收藏! 我们以图片分类来举例,当然换成文本.语音等也是一样的. Positive 正样本.比如你要识别一组图片是不是猫,那么你预测某张图片是猫,这张图片就被预测成了正样本. ...
利用sklearn对MNIST手写数据集开始一个简单的二分类判别器项目（在这个过程中学习关于模型性能的评价指标，如accuracy，precision，recall，混淆矩阵）
.caret, .dropup > .btn > .caret { border-top-color: #000 !important; } .label { border: 1px so ...
从NLP任务中文本向量的降维问题，引出LSH（Locality Sensitive Hash 局部敏感哈希）算法及其思想的讨论
1. 引言 - 近似近邻搜索被提出所在的时代背景和挑战 0x1:从NN(Neighbor Search)说起 ANN的前身技术是NN(Neighbor Search),简单地说,最近邻检索就是根据数据 ...
行人重识别和车辆重识别（ReID）中的评测指标——mAP和Rank-k
1.mAP mAP的全称是mean Average Precision,意为平均精度均值(如果按照原来的顺利翻译就是平均均值精度).这个指标是多目标检测和多标签图像分类中长常用的评测指标,因为这类任务 ...
评估指标：ROC，AUC，Precision、Recall、F1-score
一.ROC,AUC ROC(Receiver Operating Characteristic)曲线和AUC常被用来评价一个二值分类器(binary classifier)的优劣 . ROC曲线一般的 ...
如何在nlp问题中定义自己的数据集
我之前大致写了一篇在pytorch中如何自己定义数据集合,在这里如何自定义数据集不过这个例子使用的是image,也就是图像.如果我们用到的是文本呢,处理的是NLP问题呢? 在解决这个问题的时候,我在 ...
机器学习中的 precision、recall、accuracy、F1 Score
1. 四个概念定义:TP.FP.TN.FN 先看四个概念定义: - TP,True Positive - FP,False Positive - TN,True Negative - FN,False ...
ROC曲线、AUC、Precision、Recall、F-measure理解及Python实现
本文首先从整体上介绍ROC曲线.AUC.Precision.Recall以及F-measure,然后介绍上述这些评价指标的有趣特性,最后给出ROC曲线的一个Python实现示例. 一.ROC曲线.AU ...
分类问题的几个评价指标（Precision、Recall、F1-Score、Micro-F1、Macro-F1
轉自 https://blog.csdn.net/sinat_28576553/article/details/80258619 四个基本概念TP.True Positive 真阳性:预测为正,实 ...

随机推荐

Android在其他线程中更新UI
public class TransferTools { private static final int MSG_START = 1001; private static final int MSG ...
android清除缓存为什么总是存在12k？
转载请注明出处:http://blog.csdn.net/droyon/article/details/41116529 android手机在4.2之后.清除缓存总是会残留12k的大小.预计强迫症患者 ...
【Todo】Java学习路线（方向指导）
在网上搜了下Java学习路线(关键词:学习,因为众所周知,实践出牛人,在平时工作不怎么深入的情况下,才强调学习的方向的重要性 ^_^) 发现下面知乎这个回答写的真好.mark如下: https://w ...
maven编译maven-surefire-plugin插件报错
1.编译错误信息: [INFO] ------------------------------------------------------------------------ [ERROR] Fa ...
阿里巴巴为什么主推HSF?比Dubbo有哪些优势?
作者:匿名用户链接:https://www.zhihu.com/question/39560697/answer/187538165来源:知乎著作权归作者所有.商业转载请联系作者获得授权,非商业转载请 ...
vue2.0 自定义下拉刷新和上拉加载更多（Scroller）组件
1.下拉刷新和上拉加载更多组件 Scroller.vue  <template> <div :style="mar ...
vue-class-component 以class的模式写vue组件
vue英文官网推荐了一个叫vue-class-component的包,可以以class的模式写vue组件.vue-class-component(以下简称Component)带来了很多便利: 1.me ...
Effective Go（官方文档）笔记
Effective Go(官方文档)笔记自己主动局部变量提升(编译期完毕?):return &...; 内置函数: new/make copy, append delete range(这是 ...
python（33）- 模块与包
一模块 1 什么是模块? 一个模块就是一个包含了python定义和声明的文件,文件名就是模块名字加上.py的后缀. 2 为何要使用模块? 如果你退出python解释器然后重新进入,那么你之前定义的函 ...
windows下redis安装以及简单配置
1.下载redis 下载地址https://github.com/dmajkic/redis/downloads.有32bit和64bit根据自己需要选择就可以了. 2.安装redis 首先使用cmd ...

NLP任务中的基本指标(precision and recall )

NLP任务中的基本指标(precision and recall )的更多相关文章

随机推荐

热门专题