Gradient Descent 梯度下降法-R实现

梯度下降法：

【转载时请注明来源】：http://www.cnblogs.com/runner-ljt/

Ljt

作为一个初学者，水平有限，欢迎交流指正。

应用：求线性回归方程的系数

目标：最小化损失函数 (损失函数定义为残差的平方和)

搜索方向：负梯度方向，负梯度方向是下降最快的方向

梯度下降法的R实现

#Gradient Descent 梯度下降法

# 在直接设置固定的step时，不宜设置的过大，当步长过大时会报错：

# Error in while ((newerror > error) | (iter < maxiter)) { :  missing value where TRUE/FALSE needed

#原因是step过大，会导致在迭代过程中梯度会特别的大，当超过1e+309时就会直接变成无穷Inf  

#梯度下降法求线性回归方程系数theta

#x为数据矩阵（mxn m:样本数 n:特征数 ）;y观测值(mx1);error终止条件,相邻两次搜索结果的幅度;

#step为设定的固定步长;maxiter最大迭代次数,alpha,beta为回溯下降法的参数

GradientDescent<-function(x,y,error,maxiter,stepmethod=T,step=0.001,alpha=0.25,beta=0.8)

{

  m<-nrow(x)

  x<-cbind(matrix(1,m,1),x)

  n<-ncol(x)

  theta<-matrix(rep(0,n),n,1)  #theta初始值都设置为0

  iter<-1

  newerror<-1 

while((newerror>error)|(iter<maxiter)){

    iter<-iter+1

    h<-x%*%theta

    des<-t(t(h-y)%*%x)  #梯度

#回溯下降法求步长t

       if(stepmethod==T){

            sstep=1

            new_theta<-theta-sstep*des

            new_h<-x%*%new_theta

            costfunction<-t(h-y)%*%(h-y)  #最小二乘损失函数

            new_costfunction<-t(new_h-y)%*%(new_h-y)

            #回溯下降法求步长sstep

            while(new_costfunction>costfunction-alpha*sstep*sum(des*des)){

                  sstep<-sstep*beta

                  new_theta<-theta-sstep*des

                  new_h<-x%*%new_theta

                  new_costfunction<-t(new_h-y)%*%(new_h-y)

                 }

            newerror<-t(theta-new_theta)%*%(theta-new_theta)

            theta<-new_theta

         }

#直接设置固定步长

      if(stepmethod==F){

          new_theta<-theta-step*des

          new_h<-x%*%new_theta

         # new_costfunction<-t(new_h-y)%*%(new_h-y)

          newerror<-t(theta-new_theta)%*%(theta-new_theta)

          theta<-new_theta

       }

 }

      costfunction<-t(x%*%theta-y)%*%(x%*%theta-y)

      result<-list(theta,iter,costfunction)

      names(result)<-c('系数','迭代次数','误差')

      result

}

选取 IRIS 数据中种类为setosa的Sepal.Length和Sepal.Width数据分别作为x,y进行拟合，拟合函数为 y=α+βx

结果如下

> x<-matrix(iris[1:50,1],50,1)

> y<-matrix(iris[1:50,2],50,1)

> l<-lm(y~x)

> summary(l)

Call:

lm(formula = y ~ x)

Residuals:

     Min       1Q   Median       3Q      Max

-0.72394 -0.18273 -0.00306  0.15738  0.51709 

Coefficients:

            Estimate Std. Error t value Pr(>|t|)

(Intercept)  -0.5694     0.5217  -1.091    0.281

x             0.7985     0.1040   7.681 6.71e-10 ***

---

Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.2565 on 48 degrees of freedom

Multiple R-squared:  0.5514,	Adjusted R-squared:  0.542

F-statistic: 58.99 on 1 and 48 DF,  p-value: 6.71e-10

>

> GradientDescent(x,y,1e-14,1000,stepmethod=T,step=0.001,alpha=0.25,beta=0.8)

$系数

           [,1]

[1,] -0.5692863

[2,]  0.7984992

$迭代次数

[1] 23785

$误差

         [,1]

[1,] 3.158675

>

> GradientDescent(x,y,1e-14,1000,stepmethod=F,step=0.001,alpha=0.25,beta=0.8)

$系数

           [,1]

[1,] -0.5690111

[2,]  0.7984445

$迭代次数

[1] 31882

$误差

         [,1]

[1,] 3.158675

Gradient Descent 梯度下降法-R实现的更多相关文章

深度学习课程笔记（四）Gradient Descent 梯度下降算法
深度学习课程笔记(四)Gradient Descent 梯度下降算法 2017.10.06 材料来自:http://speech.ee.ntu.edu.tw/~tlkagk/courses_MLDS1 ...
Stochastic Gradient Descent 随机梯度下降法-R实现
随机梯度下降法 [转载时请注明来源]:http://www.cnblogs.com/runner-ljt/ Ljt 作为一个初学者,水平有限,欢迎交流指正. 批量梯度下降法在权值更新前对所有样本汇总 ...
ML笔记：Gradient Descent
Review: Gradient Descent Tip 1: Tuning your learning rates eta恰好,可以走到局部最小值点; eta太小,走得太慢,也可以走到局部最小值点; ...
【笔记】机器学习 - 李宏毅 - 4 - Gradient Descent
梯度下降 Gradient Descent 梯度下降是一种迭代法(与最小二乘法不同),目标是解决最优化问题:\({\theta}^* = arg min_{\theta} L({\theta})\), ...
机器学习基础——梯度下降法（Gradient Descent）
机器学习基础--梯度下降法(Gradient Descent) 看了coursea的机器学习课,知道了梯度下降法.一开始只是对其做了下简单的了解.随着内容的深入,发现梯度下降法在很多算法中都用的到,除 ...
Gradient Descent 和 Stochastic Gradient Descent（随机梯度下降法）
Gradient Descent(Batch Gradient)也就是梯度下降法是一种常用的的寻找局域最小值的方法.其主要思想就是计算当前位置的梯度,取梯度反方向并结合合适步长使其向最小值移动.通过柯 ...
One-hot 编码/TF-IDF 值来提取特征,LAD/梯度下降法（Gradient Descent），Sigmoid
1. 多值无序类数据的特征提取: 多值无序类问题(One-hot 编码)把“耐克”编码为[0,1,0],其中“1”代表了“耐克”的中间位置,而且是唯一标识.同理我们可以把“中国”标识为[1,0],把 ...
[机器学习] ML重要概念：梯度（Gradient）与梯度下降法（Gradient Descent）
引言机器学习栏目记录我在学习Machine Learning过程的一些心得笔记,涵盖线性回归.逻辑回归.Softmax回归.神经网络和SVM等等,主要学习资料来自网上的免费课程和一些经典书籍,免费课 ...
（3）梯度下降法Gradient Descent
梯度下降法不是一个机器学习算法是一种基于搜索的最优化方法作用:最小化一个损失函数梯度上升法:最大化一个效用函数举个栗子直线方程:导数代表斜率曲线方程:导数代表切线斜率导数可以代表方向, ...

随机推荐

安卓新版本获取wifi状态网络是否可用等
写下这篇文章目的:当我学习的和百度看看如何获取网络状态发现都是一些比较老的方法 API23已结过时所以在此写下记录 ,我不明白国内为什么那么少那么我们来看看旧方法 package com.che ...
python模块collections中namedtuple()的理解
Python中存储系列数据,比较常见的数据类型有list,除此之外,还有tuple数据类型.相比与list,tuple中的元素不可修改,在映射中可以当键使用.tuple元组的item只能通过index ...
Python 函数参数*expression 之后为什么只能跟关键字参数
python 为何要设计这种? 正确: def f(a=2,b=2,c=3): return a+b+c print(f(*(1,1),c=1)) 错误: def f(a=2,b=2,c=3): re ...
【安卓开发】为什么不能往Android的Application对象里存储数据
在一个App里面总有一些数据需要在多个地方用到.这些数据可能是一个 session token,一次费时计算的结果等.通常为了避免activity之间传递对象的开销 ,这些数据一般都会保存到持久化存储 ...
2014 BDTC 参会有感
中国大数据技术大会(Big Data Technology Conference,BDTC)是目前国内最具影响.规模最大的大数据领域的技术盛会.大会的前身是Hadoop中国云计算大会(Hadoop i ...
RxJava（九）zip操作符在Android中的实际使用场景
欢迎转载,转载请标明出处: http://blog.csdn.net/johnny901114/article/details/51614927 本文出自:[余志强的博客] 一.zip操作符概述官方 ...
好用的有多种样式的搜索界面创建UISearchBar
之前看到一个别人封装的第三方PYSearch,相当于一个完整的搜索界面,今天在这里进行代码说明一下. 将PYSearch拖进项目或者使用Pods进行加库,我是直接拖进项目中进行使用 PYSearch库 ...
Tomcat的系统安全管理
Tomcat是一个Web容器,我们开发的Web项目运行在Tomcat平台,这就好比将一个应用嵌入到一个平台上面运行,要使嵌入的程序能正常运行,首先平台要能安全正常运行.并且要最大程度做到平台不受嵌入的 ...
x264源代码简单分析：熵编码（Entropy Encoding）部分
===================================================== H.264源代码分析文章列表: [编码 - x264] x264源代码简单分析:概述 x26 ...
x264源代码简单分析：宏块分析（Analysis）部分-帧内宏块（Intra）
===================================================== H.264源代码分析文章列表: [编码 - x264] x264源代码简单分析:概述 x26 ...

Gradient Descent 梯度下降法-R实现

Gradient Descent 梯度下降法-R实现的更多相关文章

随机推荐

热门专题