机器学习实战（Machine Learning in Action）学习笔记———

机器学习实战（Machine Learning in Action）学习笔记————05.Logistic回归

关键字：Logistic回归、python、源码解析、测试
作者：米仓山下
时间：2018-10-26
机器学习实战（Machine Learning in Action,@author: Peter Harrington）
源码下载地址：https://www.manning.com/books/machine-learning-in-action
git@github.com:pbharrin/machinelearninginaction.git

*************************************************************
一、Logistic回归

Sigmoid函数输入为z，z=w0x0+w1x1+w2x2+…wnxn,又写成z=WTX
Sigmoid函数为σ(z)=1/(1+exp(-z))

#Logistic回归分类的原理：训练得到系数矩阵W，将位置特征向量带入Sigmoid，计算得到一个位于0~1之间的数，大于0.5则属于1类，小于0.5则属于0类。

梯度上升法：要找到某个函数的最大值，最好的方法就是沿着该函数梯度的方向探寻。如果梯度记为▽，则函数f(x,y)的梯度表示为：

梯度上升算法到达每个点后都会重新估计移动的方向。从P0开始，计算该点的梯度，函数就根据梯度移动到下一个点P1。在P1点，梯度再次被重新计算，并沿新的梯度方向移动到P2。如此迭代，直到满足停止条件。迭代的过程中，梯度算子总是保证我们能够取到最佳的移动方向。

梯度的方向就是导数最大值的方向，即函数变化率最快的方向。梯度可以通过对函数求导得到。向梯度相反方向移动保证每一次迭代都在减少下降局部全局最小值

用向量来表示的话，梯度算法的迭代公式为：w:=w+α▽wf(w)公式一直迭代下去，直到某个指定值或算法达到某个可以允许的误差范围。
这本书中用的是梯度上升，平时听到比较多的是梯度下降法，其实是一样的，只是移动的方向不同：梯度上升用来求解最大值，梯度下降用来求解最小值。接触过深度学习就知道，梯度下降在求解参数矩阵时非常重要。

主要看两个函数：

#Logistic函数σ(z)=1/(1+exp(-z))

def sigmoid(inX):

    return 1.0/(1+exp(-inX))

#Logistic回归梯度上升优化算法

def gradAscent(dataMatIn, classLabels):

    dataMatrix = mat(dataMatIn)             #convert to NumPy matrix

    labelMat = mat(classLabels).transpose() #convert to NumPy matrix

    m,n = shape(dataMatrix)

    alpha = 0.001                           #移动步长

    maxCycles = 500                         #迭代次数

    weights = ones((n,1))                   #初始化系数向量

    for k in range(maxCycles):              #heavy on matrix operations

        h = sigmoid(dataMatrix*weights)     #matrix mult

        error = (labelMat - h)              #[注].vector subtraction

        weights = weights + alpha * dataMatrix.transpose()* error #[注].matrix mult

    return weights

[注]书中省略了梯度的推导过程。构造的损失函数为P(y|x;θ)=(hθ(x))^y * (1-hθ(x))^(1-y)，其中h即Logistic函数σ，取其似然函数和最大似然函数，求最大似然估计，然后求导就可以得到上面的结果。参考网址************或则书*******
--------------------------------------------------------------
测试：

>>> import logRegres

>>> data,lable=logRegres.loadDataSet()

>>> w=logRegres.gradAscent(data,lable)

>>> w

matrix([[ 4.12414349],

        [ 0.48007329],

        [-0.6168482 ]])

>>>

#画出决策边界

>>> logRegres.plotBestFit(w.getA())

>>>

（图-画出决策边界）
--------------------------------------------------------------
方法优化1：随机梯度上升————每次迭代仅用一个样本点来更新回归系数。
对应logRegres.stocGradAscent0方法，迭代次数为数据的条数

方法优化2：改进的随机梯度上升————每次迭代时，调整alpha大小，alpha = 4/(1.0+j+i)+0.0001
alpha随着迭代次数增加不断减小，但又不等于零

--------------------------------------------------------------
#分类函数，在求得参数weights后将其和测试数据inX（向量）带入如下公式，就可以完成二类判别

def classifyVector(inX, weights):

    prob = sigmoid(sum(inX*weights))

    if prob > 0.5: return 1.0

    else: return 0.0

*************************************************************
二、示例：从疝气病症预测马的死亡率

处理数据中的缺失值的方法：
#使用可用特征的均值来填补缺失值；
#使用特殊值来填补缺失值，如-1；
#忽略有缺失值的样本；
使用相似样本均值补缺缺失值；
使用另外的机器学习算法预测缺失值

这个例子中用了0来补缺失值,数据包含28个特征和1列标签（分类两类），horseColicTraining.txt为训练数据，horseColicTest.txt为测试数据。
使用改进的随机梯度上升stocGradAscent1算法，对数据进行测试

>>> logRegres.colicTest()#colicTest()为循环训练1000次再进行测试的效果

logRegres.py:: RuntimeWarning: overflow encountered in exp

  return 1.0/(+exp(-inX))

the error rate of this test is: 0.373134

0.373134328358209

>>>

>>> logRegres.multiTest()#colicTest()执行10次的平均错误率

the error rate of this test is: 0.343284

the error rate of this test is: 0.358209

the error rate of this test is: 0.343284

the error rate of this test is: 0.343284

the error rate of this test is: 0.268657

the error rate of this test is: 0.253731

the error rate of this test is: 0.343284

the error rate of this test is: 0.268657

the error rate of this test is: 0.447761

the error rate of this test is: 0.283582

after  iterations the average error rate is: 0.325373

>>>

其他代码：

sigmoidPlot.py #s = 1/(1 + exp(-t))函数在[-5,5]和[-60,60]上的形态对比
plotSDerror.py #stocGradAscent1算法，在迭代过程中，三个参数的变化趋势
plotGD.py #梯度下降示意图
plot2D.py #stocGradAscent0进行梯度下降，决策边界

机器学习实战（Machine Learning in Action）学习笔记————05.Logistic回归的更多相关文章

学习笔记之机器学习实战 (Machine Learning in Action)
机器学习实战 (豆瓣) https://book.douban.com/subject/24703171/ 机器学习是人工智能研究领域中一个极其重要的研究方向,在现今的大数据时代背景下,捕获数据并从中 ...
K近邻 Python实现机器学习实战(Machine Learning in Action)
算法原理 K近邻是机器学习中常见的分类方法之间,也是相对最简单的一种分类方法,属于监督学习范畴.其实K近邻并没有显式的学习过程,它的学习过程就是测试过程.K近邻思想很简单:先给你一个训练数据集D,包括 ...
机器学习实战 [Machine learning in action]
内容简介机器学习是人工智能研究领域中一个极其重要的研究方向,在现今的大数据时代背景下,捕获数据并从中萃取有价值的信息或模式,成为各行业求生存.谋发展的决定性手段,这使得这一过去为分析师和数学家所专属 ...
机器学习实战 - 读书笔记(05) - Logistic回归
解释 Logistic回归用于寻找最优化算法. 最优化算法可以解决最XX问题,比如如何在最短时间内从A点到达B点?如何投入最少工作量却获得最大的效益?如何设计发动机使得油耗最少而功率最大? 我们可以看 ...
Coursera 机器学习第6章（下） Machine Learning System Design 学习笔记
Machine Learning System Design下面会讨论机器学习系统的设计.分析在设计复杂机器学习系统时将会遇到的主要问题,给出如何巧妙构造一个复杂的机器学习系统的建议.6.4 Buil ...
【python与机器学习实战】感知机和支持向量机学习笔记（一）
对<Python与机器学习实战>一书阅读的记录,对于一些难以理解的地方查阅了资料辅以理解并补充和记录,重新梳理一下感知机和SVM的算法原理,加深记忆. 1.感知机感知机的基本概念感知机 ...
Machine Learning(Andrew Ng)学习笔记
1.监督学习(supervised learning)&非监督学习(unsupervised learning) 监督学习:处理具有若干属性且返回值不同的对象.分为回归型和分类型:回归型的返回 ...
Machine Learning With Spark学习笔记（在10万电影数据上训练、使用推荐模型）
我们如今開始训练模型,还输入參数例如以下: rank:ALS中因子的个数.通常来说越大越好,可是对内存占用率有直接影响,通常rank在10到200之间. iterations:迭代次数,每次迭代都会降 ...
Machine Learning With Spark学习笔记（提取10万电影数据特征）
注:原文中的代码是在spark-shell中编写运行的,本人的是在eclipse中编写运行,所以结果输出形式可能会与这本书中的不太一样. 首先将用户数据u.data读入SparkContext中.然后 ...

随机推荐

【从0到1学Web前端】CSS定位问题二（float和display的使用）分类： HTML+CSS 2015-05-28 22:03 812人阅读评论(1) 收藏
display 属性规定元素应该生成的框的类型. 这个属性用于定义建立布局时元素生成的显示框类型.对于 HTML 等文档类型,如果使用 display 不谨慎会很危险,因为可能违反 HTML 中已经定 ...
Android开发艺术探索学习笔记（六）
第六章 Android的Drawable Drawable的优点:使用简单,比自定义view的成本要低:非图片类型的Drawable占用空间小,有利于减小APK安装包的大小. 6.1Drawable ...
ring3下的IAT HOOK
标题: [原创]ring3下的IAT HOOK作者: hostzhen时间: 2013-03-28,11:30:53链接: http://bbs.pediy.com/showthread.ph ...
【Java初探03】——流程控制语句
做任何事情都应当遵守一定的原则,程序设计也是如此,需要有流程控制语言来实现与用户的交流.流程控制对于任何一门编程语言来说都是至关重要的,它提供了控制程序步骤的基本手段,如果没有流程控制语句,整个程序将 ...
DROP TABLE 恢复【一】
当DROP TABLE指令敲下的时候,你很爽,你有考虑过后果么?如果该表真的没用,你DROP到无所谓,如果还有用的,这时你肯定吓惨了吧,如果你有备份,那么恭喜你,逃过一劫,如果没有备份呢?这时就该绝望 ...
Spring注解 @Configuration
Spring注解 @Configuration 一.@Configuration的作用二.@Configuration的Spring容器启动方式三.不加@Configuration的@Bean的解 ...
linux 安装 nvm
curl -o- https://raw.githubusercontent.com/creationix/nvm/v0.31.1/install.sh | bash 或者 wget -qO- htt ...
JAVA里的VO、BO、PO分别指什么？
VO(value object) 值对象通常用于业务层之间的数据传递,和PO一样也是仅仅包含数据而已.但应是抽象出的业务对象,可以和表对应,也可以不,这根据业务的需要.个人觉得同DTO(数据传输对象 ...
[Angularjs]ng-bind-html指令
摘要在为html标签绑定数据的时,如果绑定的内容是纯文本,你可以使用{{}}或者ng-bind.但在为html标签绑定带html标签的内容的时候,angularjs为了安全考虑,不会将其渲染成htm ...
基于spring boot的定时器
首先,搭建好一个springboot项目方法一:通过springboot自带入口来开启定时器. 首先我们都知道,springboot有一个自己的入口,也就是@SpringBootApplicatio ...

机器学习实战（Machine Learning in Action）学习笔记————05.Logistic回归

机器学习实战（Machine Learning in Action）学习笔记————05.Logistic回归的更多相关文章

随机推荐

热门专题