一、总述

线性回归算法属于监督学习的一种，主要用于模型为连续函数的数值预测。

过程总得来说就是初步建模后，通过训练集合确定模型参数，得到最终预测函数，此时输入自变量即可得到预测值。

二、基本过程

1、初步建模。确定假设函数h(x)（最终预测用）

2、建立价值函数J(θ)（也叫目标函数、损失函数等，求参数θ用）

3、求参数θ。对价值函数求偏导（即梯度），再使用梯度下降算法求出最终参数θ值

4、将参数θ值代入假设函数

三、约定符号

x：自变量，即特征值

y：因变量，即结果

h(x)：假设函数

J(θ)：价值函数

n：自变量个数，即特征值数量

m：训练集数据条数

α：学习速率，即梯度下降时的步长

四、具体过程

1、初步建模

根据训练集的数据特点创建假设函数，这里我们创建如下基本线性函数

这里需要说明的一点是公式的最后一步，如果把各组参数和自变量组织成矩阵，也可以利用矩阵方式计算。

我们说到矩阵，默认是指的列矩阵。这里先将参数矩阵转置行矩阵，然后就可以和X列矩阵做内积以得结果。

2、建立价值函数

为了让我们的假设函数更好的拟合实际情况，我们可以使用最小二乘法（LMS）建立价值函数，然后将训练集数据代入，然后想办法让该函数的所有结果尽可能小。

这里前面的1/2只是为了后面求导计算时方便而特地加上的。

怎么让其值尽可能小呢？

方法就是求该价值函数对θ的偏导数，再利用梯度下降算法进行收敛。

3、求参数

使用梯度下降算法，不断修正各θ的值，直到收敛。

判断是否收敛，可以用如下方法：

1、直到θ值变化不再明显（差值小于某给定值）；

2、将训练集代入假设函数，判断所有假设函数值之和的变化情况，直到变化不再明显；

3、当然，特殊情况下也可以强制限制迭代次数（可用于最大循环上限，防止死循环）。

下面就是迭代中用到的公式：

α为学习速率，即每次迭代的步长，如果太小则迭代速度过慢，如果太大则因为跨度太大无法有效找到期望的最小值，该值需要根据实际情况进行调整。

要使用代码实现的话，出现一堆导数可不成，所以要先求最右边的偏导数部分，将价值函数代入：

其实这里参数的数量和自变量的数量是一致的，也就是j=n。

所以梯度下降公式就变成了这样：

再代入训练集合的话公式就是：

（公式左边theta上面的尖号表示这是期望值）

这就得到了传说中的批量梯度下降算法。

但该算法在训练集合非常大的情况下将会非常低效，因为每次更新theta值时都要将整个训练集的数据代入计算。

所以通常实际情况中会使用改进的增量梯度下降（随机梯度下降）算法：

该算法每次更新只会使用训练集中的一组数据。

这样虽然牺牲了每次迭代时的最优下降路线，但是从整体来看路线还是下降的，只是中间走了写弯路而已，但是效率却大大改善了。

4、得到最终预测函数

将最终的θ值代入最初的假设函数，即得到了最终的预测函数。

五、代码实现

增量梯度下降，Python代码实现：

# -*- coding:utf-8 -*-

"""

增量梯度下降

y=1+0.5x

"""

import sys

# 训练数据集

# 自变量x(x0,x1)

x = [(1,1.15),(1,1.9),(1,3.06),(1,4.66),(1,6.84),(1,7.95)]

# 假设函数 h(x) = theta0*x[0] + theta1*x[1]

# y为理想theta值下的真实函数值

y = [1.37,2.4,3.02,3.06,4.22,5.42]

# 两种终止条件

loop_max = 10000 # 最大迭代次数

epsilon = 0.0001 # 收敛精度

alpha = 0.005 # 步长

diff = 0 # 每一次试验时当前值与理想值的差距

error0 = 0 # 上一次目标函数值之和

error1 = 0 # 当前次目标函数值之和

m = len(x) # 训练数据条数

#init the parameters to zero

theta = [0,0]

count = 0

finish = 0

while count<loop_max:

    count += 1

    # 遍历训练数据集，不断更新theta值

    for i in range(m):

        # 训练集代入，计算假设函数值h(x)与真实值y的误差值

        diff = (theta[0] + theta[1]*x[i][1]) - y[i]

    

        # 求参数theta，增量梯度下降算法，每次只使用一组训练数据

        theta[0] = theta[0] - alpha * diff * x[i][0]

        theta[1] = theta[1] - alpha * diff * x[i][1]

    # 此时已经遍历了一遍训练集，求出了此时的theta值

    # 判断是否已收敛

    if abs(theta[0]-error0) < epsilon and abs(theta[1]-error1) < epsilon:

        print 'theta:[%f, %f]'%(theta[0],theta[1]),'error1:',error1

        finish = 1

    else:

        error0,error1 = theta

    if finish:

        break

print 'FINISH count:%s' % count

运行的最终结果是：

theta:[1.066522, 0.515434] error1: 0.515449819658
FINISH count:564

理想的真实值θ1=1，θ2=0.5

计算出来的是θ1=1.066522，θ2=0.515434

迭代了564次

需要注意一点，实际过程中需要反复调整收敛精度和学习速率这两个参数，才可得到满意的收敛结果！

另外，如果函数有局部极值问题，则可以将θ随机初始化多次，寻找多个结果，然后从中找最优解。

正规方程法这里先不做讨论了~

-- EOF --

[笔记]线性回归&梯度下降的更多相关文章

线性回归 Linear regression(2)线性回归梯度下降中学习率的讨论
这篇博客针对的AndrewNg在公开课中未讲到的,线性回归梯度下降的学习率进行讨论,并且结合例子讨论梯度下降初值的问题. 线性回归梯度下降中的学习率上一篇博客中我们推导了线性回归,并且用梯度下降来求 ...
机器学习(1)之梯度下降(gradient descent)
机器学习(1)之梯度下降(gradient descent) 题记:最近零碎的时间都在学习Andrew Ng的machine learning,因此就有了这些笔记. 梯度下降是线性回归的一种(Line ...
Python实现——一元线性回归(梯度下降法)
2019/3/25 一元线性回归--梯度下降/最小二乘法_又名:一两位小数点的悲剧_ 感觉这个才是真正的重头戏,毕竟前两者都是更倾向于直接使用公式,而不是让计算机一步步去接近真相,而这个梯度下降就不一 ...
ng机器学习视频笔记（一）——线性回归、代价函数、梯度下降基础
ng机器学习视频笔记(一) --线性回归.代价函数.梯度下降基础 (转载请附上本文链接--linhxx) 一.线性回归线性回归是监督学习中的重要算法,其主要目的在于用一个函数表示一组数据,其中横轴是 ...
斯坦福机器学习视频笔记 Week1 线性回归和梯度下降 Linear Regression and Gradient Descent
最近开始学习Coursera上的斯坦福机器学习视频,我是刚刚接触机器学习,对此比较感兴趣:准备将我的学习笔记写下来, 作为我每天学习的签到吧,也希望和各位朋友交流学习. 这一系列的博客,我会不定期的更 ...
Andrew Ng机器学习公开课笔记 -- 线性回归和梯度下降
网易公开课,监督学习应用.梯度下降 notes,http://cs229.stanford.edu/notes/cs229-notes1.pdf 线性回归(Linear Regression) 先看个 ...
吴恩达机器学习笔记7-梯度下降III(Gradient descent intuition) --梯度下降的线性回归
梯度下降算法和线性回归算法比较如图: 对我们之前的线性回归问题运用梯度下降法,关键在于求出代价函数的导数,即: 我们刚刚使用的算法,有时也称为批量梯度下降.实际上,在机器学习中,通常不太会给算法起名字 ...
机器学习算法整理（一）线性回归与梯度下降 python实现
回归算法以下均为自己看视频做的笔记,自用,侵删! 一.线性回归 θ是bias(偏置项) 线性回归算法代码实现 # coding: utf-8 get_ipython().run_line_mag ...
【深度学习】线性回归（Linear Regression）——原理、均方损失、小批量随机梯度下降
1. 线性回归回归(regression)问题指一类为一个或多个自变量与因变量之间关系建模的方法,通常用来表示输入和输出之间的关系. 机器学习领域中多数问题都与预测相关,当我们想预测一个数值时,就会 ...

随机推荐

redis安装方法
redis安装方法1.通过lnmp一键安装包,然后执行./addons.sh install redis2.yum -y install redis3.wget http://redis.google ...
Python 提示 no module named win32api
Windows下运行Python程序提示错误说是没有win32api的模块解决办法 : 安装pywin32对应于Python的版本可从https://sourceforge.net/pro ...
sudo apt-get update
要用apt-get这种方式安装LAMP时,最好先运行下面在命令升级自己的系统这样是为了更新源,而如果你找的源不好,可能安装LMAP失败.#sudo apt-get update 获得最近的软件包的列表 ...
MFC使用Windows media player播放声音文件
一.在需要播放声音的资源上添加控件资源视图 . 选择添加控件的资源(如对话框).右键单击.插入ActiveX控件.调整你需要的控件属性并记录ID 二.在项目中添加播放声音的类点击菜单中的项目.添 ...
很详细、很移动的Linux makefile教程：介绍，总述，书写规则，书写命令，使用变量，使用条件推断，使用函数，Make 的运行，隐含规则使用make更新函数库文件后序
很详细.很移动的Linux makefile 教程内容如下: Makefile 介绍 Makefile 总述书写规则书写命令使用变量使用条件推断使用函数 make 的运行隐含规则使用m ...
Spring、实例化Bean的三种方法
1.使用类构造器进行实例化 <bean id="personIService" class="cn.server.impl.PersonServiceImpl&qu ...
linux安装mongodb并启动
CentOS6.4 安装MongoDB 1.下载MongoDB(64位) http://fastdl.mongodb.org/linux/mongodb-linux-x86_64-2.4.9.tg ...
HBASE学习笔记--API
HBaseConfiguration HBaseConfiguration是每一个hbase client都会使用到的对象,它代表的是HBase配置信息.它有两种构造方式: public HBaseC ...
IO库 8.6
题目:重写7.1.1节的书店程序(P229),从一个文件中读取交易记录.将文件名作为一个参数传递给main. #include <iostream> #include <fstrea ...
<s:if>标签与ActionContext.getContext().getSession()
今天在做<s:if>标签中的属性值从 ActionContext.getContext().getSession().put("WW_TRANS_I18N_LOCALE" ...

[笔记]线性回归&梯度下降