BGD(批量梯度下降）--学习笔记

函数凸凹性：

用到的范数知识：

详细解释：每一个元素的平方再开方。

补充损失函数： Huber Loss知识点

loss函数可以通过loss参数进行设置。SGDRegressor支持以下的loss函数：

SGD:随机梯度下降四个损失函数：

事例代码：

import numpy as np

import matplotlib.pyplot as plt

np.random.seed(0)  #随机数种子

#构造训练数据，这个数据不包括x0;

x=np.arange(0,10,0.2) #生成50个样本

#训练样本的个数

m=len(x)

#构造x0

x0=np.full(m,1.0)   #50个1

#将x0和x拼接起来，组成完整的训练数据

input_data=np.vstack([x0,x]).T  #将偏置b作为权向量的第一个分量

featureNum=input_data.shape[1]    #维度

print(input_data)

#y_train生成y，其实就是input_data对应的标签

target_data=2*x+5+np.random.randn(m)    #最后一项是偏差m=5就行了，x是50的向量

#两种终止条件

loop_max=1000000 #最大迭代次数，防止死循环

epsilon=1e-5    #阈值

#初始化权值

theta=np.random.randn(featureNum)

alpha=0.00001   #步长(注意取值过大会导致震荡即不收敛，过小收敛速度变慢)

#记录误差变量

error=np.zeros(featureNum)

count=0 #循环次数

#全部用向量表示，theta的维度和error维度一样。

while count < loop_max:

    count += 1

    sum_m=np.zeros(2)

    for i in range(m):

        diff = (np.dot(theta,input_data[i])-target_data[i])*input_data[i]

        sum_m=sum_m+diff #当alpha取值过大时，sum_m会在迭代过程中溢出

    theta = theta-alpha*sum_m   #注意步长alpha（0.005的时候会震荡）的取值，过大会导致震荡

    #判断是否已经收敛

    if np.linalg.norm(theta-error)<epsilon: #norm()范数:error是之前的theta,theta是更新后的，相减是求距离，也就是求相关性：距离很小的时候，相当于theta值没有更新

        break

    else:

        error=theta

    print('loop count=%d'%count,'\tw:',theta)

print('loop count=%d'%count,'\tw:',theta)

plt.plot(x,target_data,'g*')

plt.plot(x,theta[1]*x+theta[0],'r')

plt.show()

输出：
省略···

BGD(批量梯度下降）--学习笔记的更多相关文章

批量梯度下降(BGD)、随机梯度下降(SGD)以及小批量梯度下降(MBGD)的理解
梯度下降法作为机器学习中较常使用的优化算法,其有着三种不同的形式:批量梯度下降(Batch Gradient Descent).随机梯度下降(Stochastic Gradient Descent ...
online learning，batch learning&批量梯度下降，随机梯度下降
以上几个概念之前没有完全弄清其含义及区别,容易混淆概念,在本文浅析一下: 一.online learning vs batch learning online learning强调的是学习是实时的,流 ...
随机梯度下降（Stochastic gradient descent）和批量梯度下降（Batch gradient descent ）的公式对比、实现对比[转]
梯度下降(GD)是最小化风险函数.损失函数的一种常用方法,随机梯度下降和批量梯度下降是两种迭代求解思路,下面从公式和实现的角度对两者进行分析,如有哪个方面写的不对,希望网友纠正. 下面的h(x)是要拟 ...
【转】随机梯度下降（Stochastic gradient descent）和批量梯度下降（Batch gradient descent ）的公式对比、实现对比
梯度下降(GD)是最小化风险函数.损失函数的一种常用方法,随机梯度下降和批量梯度下降是两种迭代求解思路,下面从公式和实现的角度对两者进行分析,如有哪个方面写的不对,希望网友纠正. 下面的h(x)是要拟 ...
batch gradient descent（批量梯度下降）和 stochastic gradient descent（随机梯度下降）
批量梯度下降是一种对参数的update进行累积,然后批量更新的一种方式.用于在已知整个训练集时的一种训练方式,但对于大规模数据并不合适. 随机梯度下降是一种对参数随着样本训练,一个一个的及时updat ...
NN优化方法对照：梯度下降、随机梯度下降和批量梯度下降
1.前言这几种方法呢都是在求最优解中常常出现的方法,主要是应用迭代的思想来逼近.在梯度下降算法中.都是环绕下面这个式子展开: 当中在上面的式子中hθ(x)代表.输入为x的时候的其当时θ參数下的输出值 ...
机器学习-随机梯度下降（Stochastic gradient descent）和批量梯度下降（Batch gradient descent ）
梯度下降(GD)是最小化风险函数.损失函数的一种常用方法,随机梯度下降和批量梯度下降是两种迭代求解思路,下面从公式和实现的角度对两者进行分析,如有哪个方面写的不对,希望网友纠正. 下面的h(x)是要拟 ...
Tensorflow细节-P84-梯度下降与批量梯度下降
1.批量梯度下降批量梯度下降法是最原始的形式,它是指在每一次迭代时使用所有样本来进行梯度的更新.从数学上理解如下: 对应的目标函数(代价函数)即为: (1)对目标函数求偏导: (2)每次迭代对参数进 ...
【Python】机器学习之单变量线性回归利用批量梯度下降找到合适的参数值
[Python]机器学习之单变量线性回归利用批量梯度下降找到合适的参数值本题目来自吴恩达机器学习视频. 题目: 你是一个餐厅的老板,你想在其他城市开分店,所以你得到了一些数据(数据在本文最下方), ...

随机推荐

yum报错， yum相关配置信息，yum重装
docker源的问题 yum有很多错,比如网络问题,dns问题,timeout 错,还有不知道什么错误网上有很多,网络问题,dns问题,但是我ping www.baidu.com通,所以不是这个问题 ...
Python：pandas（二）——pandas函数
Python:pandas(一) 这一章翻译总结自:pandas官方文档--General functions 空值:pd.NaT.np.nan //判断是否为空 if a is np.nan: .. ...
【python】pip安装库时出现Read timed out.解决办法
昨天第一次用python画圆,当时并没有安装numpy库(导入数据包)和matplotlib库(导入图形包),于是尝试用pip安装库首先,我先更新了pip,如下图: 顺便附上成功截图: 然后安装nu ...
Jmeter-根据负载计算并发用户实际案例
业务场景假设公司领导现在给你分配了一个性能测试需求如下: 1:公司有1000人在上班时间段会登录平台进行打卡操作,可能会登录打卡多次2:业务高峰时间段在8:00-8:30,半小时3:需要保证90%用 ...
tp5.0 composer下载phpexcel 实现导出excel 表格
tp5.0 composer下载phpexcel 实现导出excel 表格 1.在下载好的tp5.0 框架里面使用 composer 下载phpexcel 的插件 composer require p ...
php 23种设计模式 - 设计模式简介以及分类
一. Introduction[介绍] 设计模式:提供了一种广泛的可重用的方式来解决我们日常编程中常常遇见的问题.设计模式并不一定就是一个类库或者第三方框架,它们更多的表现为一种思想并且广泛地应用在系 ...
总结一下Java基础知识
重中之重-----------基础底层结构决定上层建筑,所以,基础很重要. 自信心在开始说基础之前先说明一下自信心的重要性,没有自信心学什么东西都学不好. 核心自信***** 核心自信从三个方面来 ...
Scipy的stats模块包含了多种概率分布的随机变量，随机变量分为连续和离散两种。+忽略程序中警告信息+np.newaxis解释
在命令行运行 python 抛出 ModuleNotFoundError 的解决方法
所要运行的 py 文件在子目录中,并且该文件引用了另一个子目录中的 py 模块.类似这样: 原因在运行环境下, a.py 找不到 b.py 所以抛出 ModuleNotFoundError. 解决 ...
040_Eureka 服务注册与发现
目录什么是Eureka 原理讲解 Eureka的基本架构三大角色盘点目前工程状况创建Eureka服务端子模块 springcloud-eureka-7001 导入依赖 pom.xml 配置文件 ...

BGD(批量梯度下降）--学习笔记

BGD(批量梯度下降）--学习笔记的更多相关文章

随机推荐

热门专题