logistic回归梯度上升优化算法

 # Author Qian Chenglong

 from numpy import *

 from numpy.ma import arange

 def loadDataSet():

     dataMat = []

     labelMat = []

     fr = open('testSet.txt')

     for line in fr.readlines():

         lineArr = line.strip().split()

         dataMat.append([1.0, float(lineArr[0]), float(lineArr[1])])

         labelMat.append(int(lineArr[2]))

     return dataMat, labelMat

 #sigmoid归一化函数

 #输入：z=w1x1+w2x2+w3x3......

 #s输出：归一化结果

 def sigmoid(inX):

     return 1.0 / (1 + exp(-inX))

 '''

 logistic回归梯度上升优化算法

 param dataMatIn: 处理后的数据集

 param classLabels: 分类标签

 return: 权重值

  '''

 def gradAscent(dataMatIn, classLabels):

     dataMatrix = mat(dataMatIn)  # convert to NumPy matrix（矩阵）

     labelMat = mat(classLabels).transpose()  # convert to NumPy matrix

     m, n = shape(dataMatrix)          #m行  n列

     alpha = 0.001                       #步长

     maxCycles = 500

     weights = ones((n, 1))              #系数，权重

     for k in range(maxCycles):  # heavy on matrix operations

         h = sigmoid(dataMatrix * weights)  # matrix mult

         error = (labelMat - h)  # vector subtraction

         weights = weights + alpha * dataMatrix.transpose() * error  # transpose()矩阵转置

     return weights

 '''

 画出数据集和logisitic回归最佳拟合直线的函数

 param weights:

 return:

 最后的分割方程是y=(-w0-w1*x)/w2

 '''

 def plotBestFit(weights):

     import matplotlib.pyplot as plt

     dataMat, labelMat = loadDataSet()

     dataArr = array(dataMat)

     n = shape(dataArr)[0]

     xcord1 = []

     ycord1 = []

     xcord2 = []

     ycord2 = []

     for i in range(n):

         if int(labelMat[i]) == 1:

             xcord1.append(dataArr[i, 1]);

             ycord1.append(dataArr[i, 2])

         else:

             xcord2.append(dataArr[i, 1]);

             ycord2.append(dataArr[i, 2])

     fig = plt.figure()

     ax = fig.add_subplot(111)

     ax.scatter(xcord1, ycord1, s=30, c='red', marker='s')

     ax.scatter(xcord2, ycord2, s=30, c='green')

     x = arange(-3.0, 3.0, 0.1)

     y = (-weights[0] - weights[1] * x) / weights[2]

     ax.plot(x, y)

     plt.xlabel('X1')

     plt.ylabel('X2')

     plt.show()

 '''随机梯度上升

 param dataMatIn: 处理后的数据集

 param classLabels: 分类标签

 return: 权重值'''

 def stocGradAscent0(dataMatrix, classLabels):

     m, n = shape(dataMatrix)

     alpha = 0.01

     weights = ones(n)  # initialize to all ones

     for i in range(m):

         h = sigmoid(sum(dataMatrix[i] * weights))

         error = classLabels[i] - h

         weights = weights + alpha * error * dataMatrix[i]

     return weights

 '''改进的随机梯度上升

 param dataMatIn: 处理后的数据集

 param classLabels: 分类标签

 return: 权重值'''

 def stocGradAscent1(dataMatrix, classLabels, numIter=150):

     m, n = shape(dataMatrix)

     weights = ones(n)  # initialize to all ones

     for j in range(numIter):

         dataIndex = range(m)

         for i in range(m):

             alpha = 4 / (1.0 + j + i) + 0.0001  # apha decreases with iteration, does not

             randIndex = int(random.uniform(0, len(dataIndex)))  # go to 0 because of the constant

             h = sigmoid(sum(dataMatrix[randIndex] * weights))

             error = classLabels[randIndex] - h

             weights = weights + alpha * error * dataMatrix[randIndex]

             del (dataIndex[randIndex])

     return weights

logistic回归梯度上升优化算法的更多相关文章

梯度下降优化算法综述与PyTorch实现源码剖析
现代的机器学习系统均利用大量的数据,利用梯度下降算法或者相关的变体进行训练.传统上,最早出现的优化算法是SGD,之后又陆续出现了AdaGrad.RMSprop.ADAM等变体,那么这些算法之间又有哪些 ...
第三集欠拟合与过拟合的概念、局部加权回归、logistic回归、感知器算法
课程大纲欠拟合的概念(非正式):数据中某些非常明显的模式没有成功的被拟合出来.如图所示,更适合这组数据的应该是而不是一条直线. 过拟合的概念(非正式):算法拟合出的结果仅仅反映了所给的特定数据的特质 ...
(CV学习笔记)梯度下降优化算法
梯度下降法梯度下降法是训练神经网络最常用的优化算法梯度下降法(Gradient descent)是一个 ==一阶最优化算法== ,通常也称为最速下降法.要使用梯度下降法找到一个函数的 ==局部最小 ...
L-BFGS算法详解（逻辑回归的默认优化算法）
python信用评分卡建模(附代码,博主录制) https://study.163.com/course/introduction.htm?courseId=1005214003&utm_ca ...
Logistic 回归梯度上升优化函数
In [183]: def loadDataSet(): dataMat = [] labelMat = [] fr = open('testSet.txt') for line ...
用 theano 求解 Logistic Regression （SGD 优化算法）
1. model 这里待求解的是一个 binary logistic regression,它是一个分类模型,参数是权值矩阵 W 和偏置向量 b.该模型所要估计的是概率 P(Y=1|x),简记为 p, ...
机器学习之Logistic 回归算法
1 Logistic 回归算法的原理 1.1 需要的数学基础我在看机器学习实战时对其中的代码非常费解,说好的利用偏导数求最值怎么代码中没有体现啊,就一个简单的式子:θ= θ - α Σ [( hθ( ...
机器学习算法( 五、Logistic回归算法)
一.概述这会是激动人心的一章,因为我们将首次接触到最优化算法.仔细想想就会发现,其实我们日常生活中遇到过很多最优化问题,比如如何在最短时间内从A点到达B点?如何投入最少工作量却获得最大的效益?如何设 ...
机器学习——Logistic回归
1.基于Logistic回归和Sigmoid函数的分类 2.基于最优化方法的最佳回归系数确定 2.1 梯度上升法参考:机器学习--梯度下降算法 2.2 训练算法:使用梯度上升找到最佳参数 Logis ...

随机推荐

关于List、Map循环时，进行删除的结论
通过一些测试发现,List 使用for(int i=0;i<list.size();i++),可以正常删除,不会抛出异常:使用增强for循环,for(String x:list)会抛出Concu ...
Android四大组件-Content Provider
http://www.jianshu.com/p/c3ce81b638bd 一.基础回顾. 简介ContentProvider(数据提供者)是在应用程序间共享数据的一种接口机制,虽然我们可以采用文件存 ...
Java虚拟机 - 结构原理与运行时数据区域
http://liuwangshu.cn/java/jvm/1-runtime-data-area.html 前言本来计划要写Android内存优化的,觉得有必要在此之前介绍一下Java虚拟机的相关 ...
HUD6182
A Math Problem Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)To ...
HDU1074(KB12-D 状态压缩dp)
Doing Homework Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others)To ...
js同时获取多个同name的input框的值
demo代码 <!doctype html> <html ng-app="a3_4"> <head> <title>表头排序< ...
css选取table元素的第一列
table tr td:first-child
Django工程的建立以及小网站的编写
这篇博文会详细的介绍如何创建django工程,介绍我如何做了第一个网站.本文基于windows7安装了python2.7.12,Django1.8.18(LTS)版.采用的IDE为pycharm.建议 ...
语义SLAM的数据关联和语义定位（二）Semantic Localization Via the Matrix Permanent
论文假设和单目标模型这部分想讲一下Semantic Localization Via the Matrix Permanent这篇文章的一些假设. 待求解的问题可以描述为假设从姿态\(x\)看到的 ...
(Stanford CS224d) Deep Learning and NLP课程笔记（二）：word2vec
本节课将开始学习Deep NLP的基础--词向量模型. 背景 word vector是一种在计算机中表达word meaning的方式.在Webster词典中,关于meaning有三种定义: the ...

logistic回归梯度上升优化算法

logistic回归梯度上升优化算法的更多相关文章

随机推荐

热门专题