logistic regression教程1

实现线性拟合

我们用python2.7实现上一篇的推导结果。请先安装python matplotlib包和numpy包。

具体代码如下:

#!/usr/bin/env python

#! -*- coding:utf-8 -*-

import matplotlib.pyplot as plt

from numpy import *

#创建数据集

def load_dataset():

    n = 100

    X = [[1, 0.005*xi] for xi in range(1, 100)]

    Y = [2*xi[1]  for xi in X]

    return X, Y

#梯度下降法求解线性回归

def grad_descent(X, Y):

    X = mat(X)

    Y = mat(Y)

    row, col = shape(X)

    alpha = 0.001

    maxIter = 5000

    W = ones((1, col))

    for k in range(maxIter):

        W = W + alpha * (Y - W*X.transpose())*X

    return W

def main():

    X, Y = load_dataset()

    W = grad_descent(X, Y)

    print "W = ", W

    #绘图

    x = [xi[1] for xi in X]

    y = Y

    plt.plot(x, y, marker="*")

    xM = mat(X)

    y2 = W*xM.transpose()

    y22 = [y2[0,i] for i in range(y2.shape[1]) ]

    plt.plot(x, y22, marker="o")

    plt.show()

if __name__ == "__main__":

    main()

代码超级简单，load_dataset函数创建了一个y=2x的数据集，grad_descent函数求解优化问题。

在grad_descent里多了两个小东西，alpha是学习速率，一般取0.001～0.01，太大可能会导致震荡，求解不稳定。maxIter是最大迭代次数，它决定结果的精确度，通常是越大越好，但越大越耗时，所以通常需要试算以下，也可以另外写一个判定标准，比如当Y−WXT小于多少的时候就不再迭代。

我们来看一下效果：
当maxIter=5时，拟合结果是这样的：

如果maxIter=50，拟合结果是这样的：

如果maxIter=500，拟合结果是这样的：

如果maxIter=1000，拟合结果是这样的：

如果maxIter=5000，拟合结果是这样的：

5000次的结果几乎完美，两条曲线图形重合。就酱。
本篇到此结束，下一篇，我们开始把logistic函数加进来，推导logistic regression。

logistic regression教程1的更多相关文章

logistic regression教程3
在线性拟合的基础上,我们实现logistic regression. 如前所述,样本集是 {x1,y1},{x2,y2},...,{xn,yn}[1] 其中,xi=[1,xi,1,xi,2,xi,3, ...
ufldl学习笔记与编程作业：Logistic Regression（逻辑回归）
ufldl学习笔记与编程作业:Logistic Regression(逻辑回归) ufldl出了新教程,感觉比之前的好,从基础讲起.系统清晰,又有编程实践. 在deep learning高质量群里面听 ...
[机器学习] Coursera ML笔记 - 逻辑回归（Logistic Regression）
引言机器学习栏目记录我在学习Machine Learning过程的一些心得笔记,涵盖线性回归.逻辑回归.Softmax回归.神经网络和SVM等等.主要学习资料来自Standford Andrew N ...
逻辑回归 Logistic Regression
逻辑回归(Logistic Regression)是广义线性回归的一种.逻辑回归是用来做分类任务的常用算法.分类任务的目标是找一个函数,把观测值匹配到相关的类和标签上.比如一个人有没有病,又因为噪声的 ...
logistic regression与SVM
Logistic模型和SVM都是用于二分类,现在大概说一下两者的区别 ① 寻找最优超平面的方法不同形象点说,Logistic模型找的那个超平面,是尽量让所有点都远离它,而SVM寻找的那个超平面,是只 ...
Logistic Regression - Formula Deduction
Sigmoid Function \[ \sigma(z)=\frac{1}{1+e^{(-z)}} \] feature: axial symmetry: \[ \sigma(z)+ \sigma( ...
SparkMLlib之 logistic regression源码分析
最近在研究机器学习,使用的工具是spark,本文是针对spar最新的源码Spark1.6.0的MLlib中的logistic regression, linear regression进行源码分析,其 ...
[OpenCV] Samples 06: [ML] logistic regression
logistic regression,这个算法只能解决简单的线性二分类,在众多的机器学习分类算法中并不出众,但它能被改进为多分类,并换了另外一个名字softmax, 这可是深度学习中响当当的分类算法 ...
Stanford机器学习笔记-2.Logistic Regression
Content: 2 Logistic Regression. 2.1 Classification. 2.2 Hypothesis representation. 2.2.1 Interpretin ...

随机推荐

windows服务器监控多个tomcat运行状态
第一步,修改tomcat默认的进程名因为所有的tomcat项目的进程名默认都叫java.exe,所以需要修改tomcat容器bin目录下的setclasspath.bat.注释掉:(在set前加上 ...
[Windows Server 2003] 初识Windows Server 2003
★ 欢迎来到[护卫神·V课堂],网站地址:http://v.huweishen.com ★ 护卫神·V课堂是护卫神旗下专业提供服务器教学视频的网站,每周更新视频. ★ 本节我们将带领大家:初次见识W ...
梦想CAD控件 2019.05.05更新
下载地址: http://www.mxdraw.com/ndetail_20141.html 1. 增加vs2017版本控件 2. 增加windows触摸屏支持 3. 增加手写签名功能 4. 修改PL ...
Redis系列(九)--几道面试题
这里只是一点面试题,想了解更多,可以查看本人的Redis系列:https://www.cnblogs.com/huigelaile/category/1461895.html 1.Redis和Memc ...
python多进程和多线程编程
17 多线程和多进程并发 The modules described in this chapter provide support for concurrent execution of code. ...
面试总结——Java高级工程师（一）
一.无笔试题不知道是不是职位原因还是没遇到,面试时,都不需要做笔试题,而是填张个人信息表格,或者直接面试二.三大框架方面问题 1.Spring 事务的隔离性,并说说每个隔离性的区别解答:spri ...
Linux 安装 JDK 详解
安装 JDK 说明:Linux 系统中安装软件需在 root 用户下进行. (1) 首先下载 jdk-8u131-linux-x64.rpm (2)将用户切换至 root,在 opt 文件夹下新建 s ...
Xshell(smarTTY)连接Linux虚拟机失败（未开放22端口）解决办法
1.关闭防火墙: 命令:sudo ufw disable 2.安装openssh-server以及openssh-client: 命令:sudo apt-get install openssh-ser ...
洛谷 2777 [AHOI2016初中组]自行车比赛
[题解] 为了让某个选手能够获得总分第一,就让他最后一天的得分是n,并且让别的选手的得分的最大值尽量小.于是我们先把目前积分排序,并且让他们最后一天的排名刚好与积分排名相反.即某个积分排名为X的人最后 ...
关于pom.xml中的dependency中的顺序
特别注意: <dependency> <groupId>org.apache.logging.log4j</groupId> <artifactId>l ...

logistic regression教程1

实现线性拟合

logistic regression教程1的更多相关文章

随机推荐

热门专题