ML01 机器学习后利用混淆矩阵Confusion matrix 进行结果分析
目标: 快速理解什么是混淆矩阵, 混淆矩阵是用来干嘛的。
首先理解什么是confusion matrix
看定义,在机器学习领域,混淆矩阵(confusion matrix),又称为可能性表格或是错误矩阵。它是一种特定的矩阵用来呈现算法性能的效果,通常是监督学习(非监督学习,通常用匹配矩阵:matching matrix)。
大白话来讲,就是对机器学习算法的运行结果进行评价,效果如何,精确度怎么样而已。
举个例子,在什么场景下需要这个confusion matrix
假设有一个用来对猫(cats)、狗(dogs)、兔子(rabbits)进行机器学习分类,预测结果(Predicted class)如下图所示。
而实际上共有 27 只动物:8只猫, 6条狗, 13只兔子,如(actual class)所示。
从上表中能看出机器学习预测后的结果了吧,
Cat的正确率: 5/8, 3只猫误判成狗了。
Dog的正确率: 3/6, 2只当成猫,一只误判成兔子。
Rabbit 的正确率:11/13, 准确率还不错,只有2只误判成狗
场景弄明白了,接下来,confusion matrix的介绍真正开始了。
confusion matrix 的组成
混淆矩阵是由false positives,falsenegatives,true positives和true negatives组成的两行两列的表格。它允许我们做出更多的分析,而不仅仅是局限在正确率。准确率对于分类器的性能分析来说,并不是一个很好地衡量指标,因为如果数据集不平衡(每一类的数据样本数量相差太大),很可能会出现误导性的结果。
例如,如果在一个数据集中有95只猫,但是只有5条狗,那么某些分类器很可能偏向于将所有的样本预测成猫。整体准确率为95%,但是实际上该分类器对猫的识别率是100%,而对狗的识别率是0%。
对于上面的混淆矩阵,其对应的对猫这个类别的混淆表格如下:
大白话有来了,其实这个矩阵就是告诉你一下信息:
总共8只猫给你预测:
5只猫都对了(true positive) 2只狗错当成了猫
3只猫错当成狗了(false negative) 剩下的(27-5-2-3)=17 都对啦。
如何使用confusion matrix
直接利用Accord 提供的类进行统计。
using Accord.Statistics.Analysis // 机器学习的预测结构
bool[] expected = Classes.Decide(table.GetColumn()); // 实际结果
bool[] output = svm.Decide(inputs); // Use confusion matrix to compute some performance metrics
dgvPerformance.DataSource = new [] { new ConfusionMatrix(output, expected) };
reference:https://en.wikipedia.org/wiki/Confusion_matrix
ML01 机器学习后利用混淆矩阵Confusion matrix 进行结果分析的更多相关文章
- 混淆矩阵(Confusion matrix)的原理及使用(scikit-learn 和 tensorflow)
		
原理 在机器学习中, 混淆矩阵是一个误差矩阵, 常用来可视化地评估监督学习算法的性能. 混淆矩阵大小为 (n_classes, n_classes) 的方阵, 其中 n_classes 表示类的数量. ...
 - python画混淆矩阵(confusion matrix)
		
混淆矩阵(Confusion Matrix),是一种在深度学习中常用的辅助工具,可以让你直观地了解你的模型在哪一类样本里面表现得不是很好. 如上图,我们就可以看到,有一个样本原本是0的,却被预测成了1 ...
 - 【分类模型评判指标 一】混淆矩阵(Confusion Matrix)
		
转自:https://blog.csdn.net/Orange_Spotty_Cat/article/details/80520839 略有改动,仅供个人学习使用 简介 混淆矩阵是ROC曲线绘制的基础 ...
 - WEKA “Detailed Accuracy By Class”和“Confusion Matrix”含义
		
原文 === Summary ===(总结) Correctly Classified Instances(正确分类的实例) 45 90 % I ...
 - 机器学习-Confusion Matrix混淆矩阵、ROC、AUC
		
本文整理了关于机器学习分类问题的评价指标——Confusion Matrix.ROC.AUC的概念以及理解. 混淆矩阵 在机器学习领域中,混淆矩阵(confusion matrix)是一种评价分类模型 ...
 - 10. 混淆矩阵、总体分类精度、Kappa系数
		
一.前言 表征分类精度的指标有很多,其中最常用的就是利用混淆矩阵.总体分类精度以及Kappa系数. 其中混淆矩阵能够很清楚的看到每个地物正确分类的个数以及被错分的类别和个数.但是,混淆矩阵并不能一眼就 ...
 - 机器学习 - 案例 - 样本不均衡数据分析 -  信用卡诈骗 ( 标准化处理,  数据不均处理, 交叉验证, 评估,  Recall值, 混淆矩阵, 阈值 )
		
案例背景 银行评判用户的信用考量规避信用卡诈骗 ▒ 数据 数据共有 31 个特征, 为了安全起见数据已经向了模糊化处理无法读出真实信息目标 其中数据中的 class 特征标识为是否正常用户 (0 代表 ...
 - [机器学习]-分类问题常用评价指标、混淆矩阵及ROC曲线绘制方法
		
分类问题 分类问题是人工智能领域中最常见的一类问题之一,掌握合适的评价指标,对模型进行恰当的评价,是至关重要的. 同样地,分割问题是像素级别的分类,除了mAcc.mIoU之外,也可以采用分类问题的一些 ...
 - 利用sklearn对MNIST手写数据集开始一个简单的二分类判别器项目(在这个过程中学习关于模型性能的评价指标,如accuracy,precision,recall,混淆矩阵)
		
.caret, .dropup > .btn > .caret { border-top-color: #000 !important; } .label { border: 1px so ...
 
随机推荐
- 从零开始搭建Vue组件库 VV-UI
			
前言: 前端组件化是当今热议的话题之一,也是我们在开发单页应用经常会碰到的一个问题,现在我们有了功能非常完善的Element-UI.各个大厂也相继宣布开源XXX-UI.但是也会存在一些问题,比如每个公 ...
 - 【2】hadoop搭建准备软件
			
准备一:VMware虚拟工具: 链接:http://pan.baidu.com/s/1o7F4A6I 密码:w5ti 准备二:CentOS6.8虚拟机(64位):如果64位不允许安装,可能是电脑设置问 ...
 - python视频教程全集
			
由于Python语言的简洁.易读以及可扩展性,在国外用Python做科学计算的研究机构日益增多,一些知名大学已经用它来教授程序设计课程.如果你想找python视频教程全集,来这就对了!这是链接: py ...
 - HQL连接查询和注解
			
HQL连接查询和注解 一:HQL连接查询 各种连接查询: 内连接:inner join或join From Entity inner [inner] join [fetch] Entity.prope ...
 - Unity跨平台C/CPP动态库编译---可靠UDP网络库kcp基于CMake的各平台构建实践
			
1.为什么需要动态库 a)提供原生代码(native code)的支持,也叫原生插件,但是我实践的是c/cpp跨平台动态库,这里不具体涉及安卓平台java库和ios平台的objectc库构建. b)某 ...
 - 安装scrapy框架的常见问题及其解决方法
			
下面小编讲一下自己在windows10安装及配置Scrapy中遇到的一些坑及其解决的方法,现在总结如下,希望对大家有所帮助. 常见问题一:pip版本需要升级 如果你的pip版本比较老,可能在安装的过程 ...
 - [转载] 《Hadoop基础教程》之初识Hadoop
			
转载自http://blessht.iteye.com/blog/2095675 Hadoop一直是我想学习的技术,正巧最近项目组要做电子商城,我就开始研究Hadoop,虽然最后鉴定Hadoop不适用 ...
 - [转载] java垃圾回收机制
			
转载自http://blog.csdn.net/randyjiawenjie/article/details/7551228 http://www.daniel-journey.com/archive ...
 - Server 2008 R2远程桌面授权,解决120天过期问题
			
平时在使用远程桌面过程,我们经常会遇到这样的两个问题. 问题一.远程桌面的连接数限制 Server 2008 R2默认远程桌面连接数是2个用户,如果多余两个用户进行远程桌面连接时,系统就会提示超过连接 ...
 - Gotorch - 多机定时任务管理系统
			
* { color: #3e3e3e } body { font-family: "Helvetica Neue", Helvetica, "Hiragino Sans ...