Python机器学习算法 — 逻辑回归（Logistic Regression）

逻辑回归--简介

逻辑回归(Logistic Regression)就是这样的一个过程：面对一个回归或者分类问题，建立代价函数，然后通过优化方法迭代求解出最优的模型参数，然后测试验证我们这个求解的模型的好坏。
Logistic回归虽然名字里带“回归”，但是它实际上是一种分类方法，主要用于两分类问题（即输出只有两种，分别代表两个类别）。
回归模型中，y是一个定性变量，比如y=0或1，logistic方法主要应用于研究某些事件发生的概率。

逻辑回归--优缺点

优点：
      1、速度快，适合二分类问题；
      2、简单易于理解，直接看到各个特征的权重；
      3、能容易地更新模型吸收新的数据；
缺点：
      1、对数据的场景的适应能力有局限性，不如决策树算法适应性强；

逻辑回归--用途

用途：
        1、寻找危险因素：寻找某一疾病的危险因素等；
        2、预测：根据模型，预测在不同的自变量情况下，发生某病或某种情况的概率有多大；
      3、判别：实际上跟预测有些类似，也是根据模型，判断某人属于某病或属于某种情况的概率有多大，也就是看一下这个人有多大的可能性是属于某病

逻辑回归--原理

Logistic Regression和Linear Regression的原理是相似的，按照我自己的理解，可以简单的描述为这样的过程：
（1）找一个合适的预测函数（Andrew Ng的公开课中称为hypothesis），一般表示为h函数，该函数就是我们需要找的分类函数，它用来预测输入数据的判断结果。这个过程时非常关键的，需要对数据有一定的了解或分析，知道或者猜测预测函数的“大概”形式，比如是线性函数还是非线性函数。
（2）构造一个Cost函数（损失函数），该函数表示预测的输出（h）与训练数据类别（y）之间的偏差，可以是二者之间的差（h-y）或者是其他的形式。综合考虑所有训练数据的“损失”，将Cost求和或者求平均，记为J(θ)函数，表示所有训练数据预测值与实际类别的偏差。
（3）显然，J(θ)函数的值越小表示预测函数越准确（即h函数越准确），所以这一步需要做的是找到J(θ)函数的最小值。找函数的最小值有不同的方法，Logistic Regression实现时有的是梯度下降法（Gradient Descent）。

逻辑回归--具体过程

一、构造预测函数

Logistic回归虽然名字里带“回归”，但是它实际上是一种分类方法，主要用于两分类问题（即输出只有两种，分别代表两个类别），所以利用了Logistic函数（或称为Sigmoid函数），函数形式为：

Sigmoid 函数在有个很漂亮的“S”形，如下图所示：

下面左图是一个线性的决策边界，右图是非线性的决策边界：

对于线性边界的情况，边界形式如下：

构造预测函数为：

函数的值有特殊的含义，它表示结果取1的概率，因此对于输入x分类结果为类别1和类别0的概率分别为：

二、构造损失函数

Cost 函数和 J 函数如下，它们是基于最大似然估计推导得到的：

下面详细说明推导的过程：
（1）式综合起来可以写成：

取似然函数为：

对数似然函数为：

最大似然估计就是求使取最大值时的θ，其实这里可以使用梯度上升法求解，求得的θ就是要求的最佳参数。但是，在Andrew Ng的课程中将 J(θ) 取为下式，即：

因为乘了一个负的系数-1/m，所以取 J(θ) 最小值时的θ为要求的最佳参数。

三、梯度下降法求的最小值

求J(θ)的最小值可以使用梯度下降法，根据梯度下降法可得θ的更新过程：

式中为α学习步长，下面来求偏导：

θ更新过程可以写成：

逻辑回归--实例

# -*- coding: utf-8 -*-

from numpy import *

import matplotlib.pyplot as plt

#从文件中加载数据：特征X，标签label

def loadDataSet():

    dataMatrix=[]

    dataLabel=[]

    #这里给出了python 中读取文件的简便方式

    f=open('testSet.txt')

    for line in f.readlines():

        #print(line)

        lineList=line.strip().split()

        dataMatrix.append([1,float(lineList[0]),float(lineList[1])])

        dataLabel.append(int(lineList[2]))

    #for i in range(len(dataMatrix)):

    #   print(dataMatrix[i])

    #print(dataLabel)

    #print(mat(dataLabel).transpose())

    matLabel=mat(dataLabel).transpose()

    return dataMatrix,matLabel

#logistic回归使用了sigmoid函数

def sigmoid(inX):

    return 1/(1+exp(-inX))

#函数中涉及如何将list转化成矩阵的操作：mat()

#同时还含有矩阵的转置操作：transpose()

#还有list和array的shape函数

#在处理矩阵乘法时，要注意的便是维数是否对应

#graAscent函数实现了梯度上升法，隐含了复杂的数学推理

#梯度上升算法，每次参数迭代时都需要遍历整个数据集

def graAscent(dataMatrix,matLabel):

    m,n=shape(dataMatrix)

    matMatrix=mat(dataMatrix)

    w=ones((n,1))

    alpha=0.001

    num=500

    for i in range(num):

        error=sigmoid(matMatrix*w)-matLabel

        w=w-alpha*matMatrix.transpose()*error

    return w

#随机梯度上升算法的实现，对于数据量较多的情况下计算量小，但分类效果差

#每次参数迭代时通过一个数据进行运算

def stocGraAscent(dataMatrix,matLabel):

    m,n=shape(dataMatrix)

    matMatrix=mat(dataMatrix)

    w=ones((n,1))

    alpha=0.001

    num=20  #这里的这个迭代次数对于分类效果影响很大，很小时分类效果很差

    for i in range(num):

        for j in range(m):

            error=sigmoid(matMatrix[j]*w)-matLabel[j]

            w=w-alpha*matMatrix[j].transpose()*error

    return w

#改进后的随机梯度上升算法

#从两个方面对随机梯度上升算法进行了改进,正确率确实提高了很多

#改进一：对于学习率alpha采用非线性下降的方式使得每次都不一样

#改进二：每次使用一个数据，但是每次随机的选取数据，选过的不在进行选择

def stocGraAscent1(dataMatrix,matLabel):

    m,n=shape(dataMatrix)

    matMatrix=mat(dataMatrix)

    w=ones((n,1))

    num=200  #这里的这个迭代次数对于分类效果影响很大，很小时分类效果很差

    setIndex=set([])

    for i in range(num):

        for j in range(m):

            alpha=4/(1+i+j)+0.01

            dataIndex=random.randint(0,100)

            while dataIndex in setIndex:

                setIndex.add(dataIndex)

                dataIndex=random.randint(0,100)

            error=sigmoid(matMatrix[dataIndex]*w)-matLabel[dataIndex]

            w=w-alpha*matMatrix[dataIndex].transpose()*error

    return w

#绘制图像

def draw(weight):

    x0List=[];y0List=[];

    x1List=[];y1List=[];

    f=open('testSet.txt','r')

    for line in f.readlines():

        lineList=line.strip().split()

        if lineList[2]=='0':

            x0List.append(float(lineList[0]))

            y0List.append(float(lineList[1]))

        else:

            x1List.append(float(lineList[0]))

            y1List.append(float(lineList[1]))

    fig=plt.figure()

    ax=fig.add_subplot(111)

    ax.scatter(x0List,y0List,s=10,c='red')

    ax.scatter(x1List,y1List,s=10,c='green')

    xList=[];yList=[]

    x=arange(-3,3,0.1)

    for i in arange(len(x)):

        xList.append(x[i])

    y=(-weight[0]-weight[1]*x)/weight[2]

    for j in arange(y.shape[1]):

        yList.append(y[0,j])

    ax.plot(xList,yList)

    plt.xlabel('x1');plt.ylabel('x2')

    plt.show()

if __name__ == '__main__':

    dataMatrix,matLabel=loadDataSet()

    #weight=graAscent(dataMatrix,matLabel)

    weight=stocGraAscent1(dataMatrix,matLabel)

    print(weight)

    draw(weight)

Python机器学习算法 — 逻辑回归（Logistic Regression）的更多相关文章

机器学习 (三) 逻辑回归 Logistic Regression
文章内容均来自斯坦福大学的Andrew Ng教授讲解的Machine Learning课程,本文是针对该课程的个人学习笔记,如有疏漏,请以原课程所讲述内容为准.感谢博主Rachel Zhang 的个人 ...
机器学习总结之逻辑回归Logistic Regression
机器学习总结之逻辑回归Logistic Regression 逻辑回归logistic regression,虽然名字是回归,但是实际上它是处理分类问题的算法.简单的说回归问题和分类问题如下: 回归问 ...
Coursera公开课笔记: 斯坦福大学机器学习第六课“逻辑回归(Logistic Regression)” 清晰讲解logistic-good!!!!!!
原文:http://52opencourse.com/125/coursera%E5%85%AC%E5%BC%80%E8%AF%BE%E7%AC%94%E8%AE%B0-%E6%96%AF%E5%9D ...
机器学习（四）--------逻辑回归(Logistic Regression)
逻辑回归(Logistic Regression) 线性回归用来预测,逻辑回归用来分类. 线性回归是拟合函数,逻辑回归是预测函数逻辑回归就是分类. 分类问题用线性方程是不行的线性方程拟合的是连 ...
机器学习入门11 - 逻辑回归 (Logistic Regression)
原文链接:https://developers.google.com/machine-learning/crash-course/logistic-regression/ 逻辑回归会生成一个介于 0 ...
机器学习方法（五）：逻辑回归Logistic Regression，Softmax Regression
欢迎转载,转载请注明:本文出自Bin的专栏blog.csdn.net/xbinworld. 技术交流QQ群:433250724,欢迎对算法.技术.应用感兴趣的同学加入. 前面介绍过线性回归的基本知识, ...
逻辑回归(Logistic Regression)详解,公式推导及代码实现
逻辑回归(Logistic Regression) 什么是逻辑回归: 逻辑回归(Logistic Regression)是一种基于概率的模式识别算法,虽然名字中带"回归",但实际上 ...
ML 逻辑回归 Logistic Regression
逻辑回归 Logistic Regression 1 分类 Classification 首先我们来看看使用线性回归来解决分类会出现的问题.下图中,我们加入了一个训练集,产生的新的假设函数使得我们进行 ...
【机器学习】Octave 实现逻辑回归 Logistic Regression
ex2data1.txt ex2data2.txt 本次算法的背景是,假如你是一个大学的管理者,你需要根据学生之前的成绩(两门科目)来预测该学生是否能进入该大学. 根据题意,我们不难分辨出这是一种二分 ...

随机推荐

Spring之HelloWorld
[Spring是什么?] 1.Spring是一个开源框架. 2.Spring为简化企业级应用开发而生,使用Spring可以使简单的JavaBean实现以前只有EJB(EJB是sun的JavaEE服务器 ...
node学习的一些网站
Node.js 包教不包会篇幅比较少 node express 入门教程 nodejs定时任务一个nodejs博客 [NodeJS 学习笔记04]新闻发布系统过年7天乐,学nodejs 也快乐 ...
2017 CCPC 杭州 HDU6265B 积性函数
题目链接 http://acm.hdu.edu.cn/downloads/CCPC2018-Hangzhou-ProblemSet.pdf B题数论题 h(n)=∑ d|n φ(d) × ...
[bzoj1578][Usaco2009 Feb]Stock Market 股票市场_完全背包dp
Stock Market 股票市场 bzoj-1578 Usaco-2009 Feb 题目大意:给定一个$S\times D$的大矩阵$T$,其中$T[i][j]$表示第i支股票第j天的价格.给定初始 ...
Spring基础入门（一）
一.Spring概念 1.什么是Spring Spring是一个开源框架,它由Rod Johnson创建.它是为了解决企业应用开发的复杂性而创建的.Spring使用基本的JavaBean来完成以前 ...
LENOVO System x3850 X6
http://appserver.lenovo.com.cn/Lenovo_Series_List.aspx?CategoryCode=A31B01
spring，spring mvc之所以起作用是因为开启了注解解释器，即spring的annotation on
spring,spring mvc之所以起作用是因为开启了注解解释器,即spring的annotation on
struts2学习笔记（二）—— 获取登录信息及计算在线人数
实现目的: 1.点击"Login"的超链接.进入登录页面 2.填写登录信息.提交表单,将用户信息保存进Session 3.显示用户名,并计算在线 ...
[GraphQL] Query Local and Remote Data in Apollo Link State
In this lesson, you will learn how to query local and remote data in Apollo Link State in the same c ...
Java 实现一个链表
public class MyList { static class Node {// 节点类 Object data; Node next; public Node(Object data) {// ...