分类器

1.分类模型也称为分类器，用于对样本进行标注，表明这个样本属于一个有限的类别集合中的那个类。
2.单分类学习中，训练集中的数据仅来自一个类别，目标是学习一个模型以预测某个样本是否属于这个类别；
3.二分类学习中，训练集中的样本全部来自两个类别（通常称为阳性和阴性）,目标是找到一个可以区分两个类别的边界；
4.多分类学习的目标是可以找到可以将多个类别区分开来的边界。

分类器的评估

1.每种分类器在训练 数据上的准确度可以计算如下：
   准确度 = （真阳性+真阴性）/（真阳性+真阴性+假阳性+假阴性）    
    当两个类的大小差不多时，用准确度评价分类器是非常合适的。存在严重类别不平衡时，用准确度评价分类器会得到非常糟糕的结果。
2.当存在类别不平衡时，仍有一些统计量评估分类器：
    灵敏度 = 真阳性 / （真阳性 + 假阴性）
    特异度 = 真阴性 / （真阴性 + 假阳性）
    阳性预测值 = 真阳性 / （真阳性 + 假阳性）
    阴性预测值 = 真阴性 /（真阴性 + 假阴性）
灵敏度（某些领域称为召回率）即真阳性率，也就是正确识别阴性数量与实际阳性数量的比例；
特异度（某些领域称为精确率）即真阴性率，也就是正确识别阴性数量与实际阴性数量的比例；
阳性预测值是一个被分类为阳性的样本确实是阳性的概率；
阴性预测值是一个被分类为阴性的样本确实是阴性的概率。

K近邻

1.K最近邻可能是最简单的分类算法。通过这种方法“学习”的模型就是训练集本身。对新样本进行标注时，就是根据他们与训练集样本的相似度而进行的。
2.kNN是一种基本的分类和回归方法。kNN的输入是测试数据和训练样本数据集，输出是测试样本的类别。kNN没有显示的训练过程，在测试时，计算测试样本和所有训练样本的距离，根据最近的K个训练样本的类别，通过多数投票的方式进行预测。
3.KNN算法三要素，分别是距离度量、K的大小、分类规则，在KNN中，当训练数据集和三要素确定后，相当于将特征空间划分为一些子空间，对于每个训练实例xi,距离该点比距离其他店更近的所有点组成了一个区域，每个区域的类别由决策规则确定且唯一，从而将整个区域划分。对于任何一个测试点，找到其所属的子空间，其类别即为该子空间的类别。

logistic回归

1.Python库sklearn对logistic回归进行了非常好的实现，并提供了很多与机器学习相关的实用函数和类；
    LogisticRegression类包含在模块sklearn.linear_model中，这个类的__init__方法有很多参数 可以进行设置，比如用来求解回归方程的最优化算法；这些参数都有默认值，在多数情况下，实用默认值即可；
    LogisticRegression类的核心方法是fit，这个方法使用两个同样长度的序列（元组、列表、数组）作为参数，第一个参数是特征向量序列，第二个参数是与特征向量对应的标签序列，在文献中，这些标签通常被称为结果；
    fit方法返回一个LogisticRegression类型的对象，对于其中特征向量的每个特征，已经通过学习得到了相应的系数，这些系数通常称为特征权重，反映了特征与结果之间的关系，特征权重为正，表明特征与结果是正相关；特征权重为否，表明特征与结果负相关。权重的绝对值则会影响相关性的强度，这些权重的值可以通过LogisticRegression的属性coef_进行访问。因为可以训练处具有多个结果的LogisticRegression对象，所以coef_的值是一个序列，序列中每个元素都是对应于某个结果的权重序列。eg：model.coef_[1][0]表示第二个结果的第一个特征的系数的值。
    一旦学习了这些写系数，就可以使用LogisticRegresion类的predict_proba方法预测与某个特征向量对应的结果。predict_proba方法只需要1个参数，即特征向量的序列。它返回一个数组的数组，每个数组表示一个特征向量。在返回的数组中，每个元素都包含一个相应特征向量的预测值。预测值也是一个数组，因为它包含了建立model时所用的标签的概率。
2.对于线性回归模型，知道改变决策阈值所带来的影响非常容易，因此人们通常使用受试者工作曲线，或称ROC曲线，来形象地表示灵敏度和特异度之间的折中关系。这种曲线可以绘制出多个决策阈值的真阳性率（灵敏度）和假阳性率（1-特异度）之间的关系。

分类器、logistic回归的更多相关文章

《机器学习实战》-逻辑(Logistic)回归
目录 Logistic 回归本章内容回归算法 Logistic 回归的一般过程 Logistic的优缺点基于 Logistic 回归和 Sigmoid 函数的分类 Sigmoid 函数 Logi ...
七，专著研读（Logistic回归）
七,专著研读(Logistic回归) 分类:k-近邻算法,决策树,朴素贝叶斯,Logistic回归,支持向量机,AdaBoost算法. 运用 k-近邻算法,使用距离计算来实现分类决策树,构建直观的树 ...
【导包】使用Sklearn构建Logistic回归分类器
官方英文文档地址:http://scikit-learn.org/dev/modules/generated/sklearn.linear_model.LogisticRegression.html# ...
机器学习——Logistic回归
1.基于Logistic回归和Sigmoid函数的分类 2.基于最优化方法的最佳回归系数确定 2.1 梯度上升法参考:机器学习--梯度下降算法 2.2 训练算法:使用梯度上升找到最佳参数 Logis ...
如何在R语言中使用Logistic回归模型
在日常学习或工作中经常会使用线性回归模型对某一事物进行预测,例如预测房价.身高.GDP.学生成绩等,发现这些被预测的变量都属于连续型变量.然而有些情况下,被预测变量可能是二元变量,即成功或失败.流失或 ...
Logistic回归分类算法原理分析与代码实现
前言本文将介绍机器学习分类算法中的Logistic回归分类算法并给出伪代码,Python代码实现. (说明:从本文开始,将接触到最优化算法相关的学习.旨在将这些最优化的算法用于训练出一个非线性的函数 ...
第五章：Logistic回归
本章内容 □sigmod函数和logistic回归分类器 □最优化理论初步□梯度下降最优化算法□数据中的缺失项处理这会是激动人心的一章,因为我们将首次接触到最优化算法.仔细想想就会发现,其实我们日常 ...
机器学习笔记—Logistic回归
本文申明:本系列笔记全部为原创内容,如有转载请申明原地址出处.谢谢序言:what is logistic regression? Logistics 一词表示adj.逻辑的;[军]后勤学的n.[逻] ...
Logistic回归模型和Python实现
回归分析是研究变量之间定量关系的一种统计学方法,具有广泛的应用. Logistic回归模型线性回归先从线性回归模型开始,线性回归是最基本的回归模型,它使用线性函数描述两个变量之间的关系,将连续或离 ...

随机推荐

.pyc是个什么 python的执行过程
1. Python是一门解释型语言? 我初学Python时,听到的关于Python的第一句话就是,Python是一门解释性语言,我就这样一直相信下去,直到发现了*.pyc文件的存在.如果是解释型语言, ...
c语言中堆栈和静态空间
什么是堆空间.栈空间与静态空间堆空间:由程序员自己分配空间,如malloc需要指定分配多少个多大的字节空间,不用的时候需要自己释放栈空间:栈空间是由系统自动分配与释放,如int,char等大小都已 ...
Docker：dockerfile构建php项目 [八]
一.把项目封装成docker镜像的步骤把项目封装成docker镜像的步骤: 1.先运行一个基础容器,手动制作docker镜像 2.编写dockerfile,构建镜像 3.测试运行二.dockerf ...
浏览器UI多线程及JavaScript单线程运行机制的理解
在上一篇博客中,我对jQuery的队列(queue)机制和动画(animate)机制做了一个深入的解析,在animate的实现机制其核心是依靠queue来完成的,其中在jQuery的链式调用部分,之前 ...
tr1
tr echo 12345 | tr '0-9' '9876543210' echo 87654 | tr '9876543210' '0-9' ROT13 echo "tr came, t ...
Element ui select同时获取value和label的值
代码如下: <el-form-item v-if="isMD" label="业务员名称"> <el-select v-model=" ...
shell ip变量加法运算
#!/bin/bash for ip in `cat a.txt`;do a=`echo $ip|awk -F '.' '{print $1}'` b=`echo $ip|awk -F '.' '{p ...
Codeforces Round #501 (Div. 3) D. Walking Between Houses
题目链接题意:给你三个数n,k,sn,k,sn,k,s,让你构造一个长度为k的数列,使得相邻两项差值的绝对值之和为sss, ∑i=1n∣a[i]−a[i−1]∣,a[0]=1\sum_{i=1}^n ...
day 16 - 1 内置函数（二）
内置函数(二) reversed() 返回一个反向的迭代器 k = [1,2,3,4,5] k.reverse() #反转 print(k) k = [1,2,3,4,5] k2 = reverse ...
论文笔记：Cross-Domain Visual Matching via Generalized Similarity Measure and Feature Learning
Cross-Domain Visual Matching,即跨域视觉匹配.所谓跨域,指的是数据的分布不一样,简单点说,就是两种数据「看起来」不像.如下图中,(a)一般的正面照片和各种背景角度下拍摄的照 ...

分类器、logistic回归

相关性

分类器

分类器的评估

K近邻

logistic回归

分类器、logistic回归的更多相关文章

随机推荐

热门专题