SGD/BGD/MBGD使用python简单实现

算法具体可以参照其他的博客：

随机梯度下降：

# coding=utf-8

'''

随机梯度下降

'''

import numpy as np

# 构造训练数据

x = np.arange(0., 10., 0.2)

m = len(x)

x0 = np.full(m, 1.0)

input_data = np.vstack([x0, x]).T  # 将偏置b作为权向量的第一个分量

target_data = 3 * x + 8 + np.random.randn(m)

max_iter = 10000  # 最大迭代次数

epsilon = 1e-5

# 初始化权值

w = np.random.randn(2)

# w = np.zeros(2)

alpha = 0.001  # 步长

diff = 0.

error = np.zeros(2)

count = 0  # 循环次数

print '随机梯度下降算法'.center(60, '=')

while count < max_iter:

    count += 1

    for j in range(m):

        diff = np.dot(w, input_data[j]) - target_data[j]  # 训练集代入,计算误差值

        # 这里的随机性表现在：一个样本更新一次参数！

        w = w - alpha * diff * input_data[j]

    if np.linalg.norm(w - error) < epsilon:  # 直接通过np.linalg包求两个向量的范数

        break

    else:

        error = w

print 'loop count = %d' % count, '\tw:[%f, %f]' % (w[0], w[1])

# coding=utf-8

"""

批量梯度下降

"""

import numpy as np

# 构造训练数据

x = np.arange(0., 10., 0.2)

m = len(x)

x0 = np.full(m, 1.0)

input_data = np.vstack([x0, x]).T  # 将偏置b作为权向量的第一个分量

target_data = 3 * x + 8 + np.random.randn(m)

# 停止条件

max_iter = 10000

epsilon = 1e-5

# 初始化权值

w = np.random.randn(2)

# w = np.zeros(2)

alpha = 0.001  # 步长

diff = 0.

error = np.zeros(2)

count = 0  # 循环次数

while count < max_iter:

    count += 1

    sum_m = np.zeros(2)

    for i in range(m):

        dif = (np.dot(w, input_data[i]) - target_data[i]) * input_data[i]

        sum_m = sum_m + dif

    '''

    for j in range(m):

        diff = np.dot(w, input_data[j]) - target_data[j]  # 训练集代入,计算误差值

        w = w - alpha * diff * input_data[j]

    '''

    w = w - alpha * sum_m

    if np.linalg.norm(w - error) < epsilon:

        break

    else:

        error = w

print 'loop count = %d' % count, '\tw:[%f, %f]' % (w[0], w[1])

小批量梯度下降：

# coding=utf-8

"""

小批量梯度下降

"""

import numpy as np

import random

# 构造训练数据

x = np.arange(0., 10., 0.2)

m = len(x)

x0 = np.full(m, 1.0)

input_data = np.vstack([x0, x]).T  # 将偏置b作为权向量的第一个分量

target_data = 3 * x + 8 + np.random.randn(m)

# 两种终止条件

max_iter = 10000

epsilon = 1e-5

# 初始化权值

np.random.seed(0)

w = np.random.randn(2)

# w = np.zeros(2)

alpha = 0.001  # 步长

diff = 0.

error = np.zeros(2)

count = 0  # 循环次数

while count < max_iter:

    count += 1

    sum_m = np.zeros(2)

    index = random.sample(range(m), int(np.ceil(m * 0.2)))

    sample_data = input_data[index]

    sample_target = target_data[index]

    for i in range(len(sample_data)):

        dif = (np.dot(w, input_data[i]) - target_data[i]) * input_data[i]

        sum_m = sum_m + dif

    w = w - alpha * sum_m

    if np.linalg.norm(w - error) < epsilon:

        break

    else:

        error = w

print 'loop count = %d' % count, '\tw:[%f, %f]' % (w[0], w[1])

通过迭代，结果会收敛到8和3:

loop count =      w:[8.025972, 2.982300]

参考：http://www.cnblogs.com/pinard/p/5970503.html

SGD/BGD/MBGD使用python简单实现的更多相关文章

深度学习——优化器算法Optimizer详解（BGD、SGD、MBGD、Momentum、NAG、Adagrad、Adadelta、RMSprop、Adam）
在机器学习.深度学习中使用的优化算法除了常见的梯度下降,还有 Adadelta,Adagrad,RMSProp 等几种优化器,都是什么呢,又该怎么选择呢? 在 Sebastian Ruder 的这篇论 ...
【深度学习】深入理解优化器Optimizer算法（BGD、SGD、MBGD、Momentum、NAG、Adagrad、Adadelta、RMSprop、Adam）
在机器学习.深度学习中使用的优化算法除了常见的梯度下降,还有 Adadelta,Adagrad,RMSProp 等几种优化器,都是什么呢,又该怎么选择呢? 在 Sebastian Ruder 的这篇论 ...
Python简单爬虫入门三
我们继续研究BeautifulSoup分类打印输出 Python简单爬虫入门一 Python简单爬虫入门二前两部主要讲述我们如何用BeautifulSoup怎去抓取网页信息以及获取相应的图片标题等信 ...
Python简单爬虫入门二
接着上一次爬虫我们继续研究BeautifulSoup Python简单爬虫入门一上一次我们爬虫我们已经成功的爬下了网页的源代码,那么这一次我们将继续来写怎么抓去具体想要的元素首先回顾以下我们Bea ...
亲身试用python简单小爬虫
前几天基友分享了一个贴吧网页,有很多漂亮的图片,想到前段时间学习的python简单爬虫,刚好可以实践一下. 以下是网上很容易搜到的一种方法: #coding=utf-8 import urllib i ...
GJM : Python简单爬虫入门（二） [转载]
感谢您的阅读.喜欢的.有用的就请大哥大嫂们高抬贵手"推荐一下"吧!你的精神支持是博主强大的写作动力以及转载收藏动力.欢迎转载! 版权声明:本文原创发表于 [请点击连接前往] ,未经 ...
Selenium + PhantomJS + python 简单实现爬虫的功能
Selenium 一.简介 selenium是一个用于Web应用自动化程序测试的工具,测试直接运行在浏览器中,就像真正的用户在操作一样 selenium2支持通过驱动真实浏览器(FirfoxDrive ...
【美妙的Python之中的一个】Python简单介绍及环境搭建
美妙的Python之Python简单介绍及安装简而言之: Python 是能你无限惊喜的语言,与众不同. 1.Python: ...
python 简单图像识别--验证码
python 简单图像识别--验证码记录下,准备工作安装过程很是麻烦. 首先库:pytesseract,image,tesseract,PIL windows安装PIL,直接exe进行安装更方便( ...

随机推荐

Window NodeJs安装
1.下载NodeJs 官网下载地址:http://nodejs.cn/download/ 2.安装双击,全程next安装. 安装完成,在cmd下面执行查看版本命令,命令如下 C:\Users\A ...
nexus3安装 - CentOS7环境
nexus3安装 - CentOS7环境使用nexus3管理docker镜像,配合rancher进行部署. 建资料卷资料卷默认地址:/var/lib/docker/volumes/资料卷名/_da ...
.equal()和==的区别
1.首先,equal和==最根本的区别在于equal是一个方法,而==是一个运算符. 2.一般来说,==运算符比较的是在内存中的物理地址,.equal()比较的是哈希算法值是否相等(即hashcode ...
周末畅谈 | 我是如何在硅谷获得年薪30万美金Offer的？
本文讲述了一位硅谷软件工程师的面试经验,他分享了他如何在硅谷拿到最终30万美金年薪的Offer,原文摘自:https://blog.usejournal.com/how-i-negotiated-a- ...
Cookie的作用范围、设置、创建、获取的方法
cookie的作用范围同一浏览器,同一路径默认情况下, 上级目录设置的cookie,下级目录可以获取到, 而下级目录设置的cookie,上级目录不能获取. 即:在一个页面设置cookie,那么这个 ...
通过geopandas.sjoin()函数按多边形范围分割点
最近有一批点和多变型的数据,需要将点按照多边形的区域进行分割. 经过若干尝试,终于通过geopandas的sjoin函数得以实现. 这里首先感谢博主“张da统帅”的分享,使得本人获得该实现方法的灵感, ...
使用idea出现的错误
错误:打开maven项目时出现"程序包 com.sun.org.apache.xpath.internal 不可见 "的错误这个问题出现的原因是: jdk版本的问题.可能是因为有 ...
客户主题分析（tableau）—客户留存
客户留存分析(客户漏斗分析),关键在于找到影响客户留存的因素,设计场景测试,验证关键因素.即可以通过关键因素影响留存,从而重塑客户漏斗到更有价值的形状. 案例:母婴产品客户留存分析数据结构: 1) ...
OpenMP笔记(五)
任务调度主要用于并行的for循环中,当循环中每次迭代的计算量不相等时,如果简单地给各个线程分配相同次数的迭代的话,会造成各个线程计算负载不均衡,这会使得有些线程先执行完,有些后执行完,造成某些CPU核 ...
intellij idea安卓开发配置
1.java sdk 2.java ndk 3.gradle https://gradle.org/install/#manually 配置properties 删除根目录下android{} htt ...

SGD/BGD/MBGD使用python简单实现

SGD/BGD/MBGD使用python简单实现的更多相关文章

随机推荐

热门专题