2.9 logistic回归中的梯度下降法(非常重要,一定要重点理解)
- 怎么样计算偏导数来实现logistic回归的梯度下降法
- 它的核心关键点是其中的几个重要公式用来实现logistic回归的梯度下降法
 
 - 接下来开始学习logistic回归的梯度下降法
 
- logistic回归的公式

- 现在只考虑单个样本的情况,关于该样本的损失函数定义如上面第三个公式,其中a是logistic回归的输出,y是样本的基本真值标签值,
 
 - 下面写出该样本的偏导数流程图
- 假设样本只有两个特征x1和x2
 - 为了计算Z,我们需要输入参数w1和w2和b

- 因此在logistic回归中,我们要做的就是变换参数w和b的值,来最最小化损失函数,
 
 - 在前面,我们已经前向传播步骤,在单个训练样本上,计算损失函数,现在我们开始讨论怎么样向后计算偏导数,(重点)

- 要想计算损失函数L的导数,
- 首先,我们需要向前一步,先计算损失函数的导数,计算函数L关于a的导数,在代码中,只需要使用da来表示这个变量,
- 事实上,

 - 损失函数导数的计算公式就是这样,最终结果关于变量a的导数
 
 - 事实上,
 - 现在可以再向后一步,计算dz,dz是损失函数关于z的导数,
- 事实上

 
 - 事实上
 - 现在,向后传播的最后一步,w和b需要如何变化,
- 特别的关于w1的导数(函数L对w1求导)
 - 关于w2的求导
 - 关于b的求导
- db=dz=a-y
 
 
 - 特别的关于w1的导数(函数L对w1求导)
 - 因此,关于单个样本的梯度下降法,所需要做的就是使用这个计算公式计算dz,然后计算dw1、dw2、db,然后
- 更新w1位w1减去学习率乘以dw1

 - 更新w2位w2减去学习率乘以dw2

 - 更新b为b减去学习率乘以db

 
 - 更新w1位w1减去学习率乘以dw1
 - 这就是单个样本实例的一次梯度更新步骤
 
 - 首先,我们需要向前一步,先计算损失函数的导数,计算函数L关于a的导数,在代码中,只需要使用da来表示这个变量,
 
 - 但是训练logistic回归模型,不仅仅只有一个训练样本,而是有m个训练样本的整个训练集,
- 下一节将会介绍,这些想法是如何应用到整个训练样本集当中的。而不仅仅是单个样本。
 
 
 
2.9 logistic回归中的梯度下降法(非常重要,一定要重点理解)的更多相关文章
- 斯坦福《机器学习》Lesson4感想--1、Logistic回归中的牛顿方法
		
在上一篇中提到的Logistic回归是利用最大似然概率的思想和梯度上升算法确定θ,从而确定f(θ).本篇将介绍还有一种求解最大似然概率ℓ(θ)的方法,即牛顿迭代法. 在牛顿迭代法中.如果一个函数是,求 ...
 - 对数几率回归法(梯度下降法,随机梯度下降与牛顿法)与线性判别法(LDA)
		
本文主要使用了对数几率回归法与线性判别法(LDA)对数据集(西瓜3.0)进行分类.其中在对数几率回归法中,求解最优权重W时,分别使用梯度下降法,随机梯度下降与牛顿法. 代码如下: #!/usr/bin ...
 - 在matlab中实现梯度下降法
		
梯度下降法的原理,本文不再描述,请参阅其它资料. 梯度下降法函数function [k ender]=steepest(f,x,e),需要三个参数f.x和e,其中f为目标函数,x为初始点,e为终止误差 ...
 - Logistic回归中损失函数求导证明过程
 - Logistic 回归(sigmoid函数,手机的评价,梯度上升,批处理梯度,随机梯度,从疝气病症预测病马的死亡率
		
(手机的颜色,大小,用户体验来加权统计总体的值)极大似然估计MLE 1.Logistic回归 Logistic regression (逻辑回归),是一种分类方法,用于二分类问题(即输出只有两种).如 ...
 - 机器学习公开课笔记(3):Logistic回归
		
Logistic 回归 通常是二元分类器(也可以用于多元分类),例如以下的分类问题 Email: spam / not spam Tumor: Malignant / benign 假设 (Hypot ...
 - 对线性回归,logistic回归和一般回归的认识
		
原文:http://www.cnblogs.com/jerrylead/archive/2011/03/05/1971867.html#3281650 对线性回归,logistic回归和一般回归的认识 ...
 - 线性回归,logistic回归和一般回归
		
1 摘要 本报告是在学习斯坦福大学机器学习课程前四节加上配套的讲义后的总结与认识.前四节主要讲述了回归问题,回归属于有监督学习中的一种方法.该方法的核心思想是从连续型统计数据中得到数学模型,然后将该数 ...
 - Logistic回归(逻辑回归)和softmax回归
		
一.Logistic回归 Logistic回归(Logistic Regression,简称LR)是一种常用的处理二类分类问题的模型. 在二类分类问题中,把因变量y可能属于的两个类分别称为负类和正类, ...
 
随机推荐
- vue移动端项目在手机上调试
			
1.电脑和手机要连同一个wifi 一定是复制无线网的IP,而不是以太网的IP 2.在你的电脑上查找无线网络的ipv4地址: 查找方法:windows+r 然后再输入框里输入cmd 回车 会出现这 ...
 - echarts制作html和JavaScript的时钟和代码分析与注释
			
1.效果图 2.说明: 2.1 代码是大神制作的,我进行修改,感谢大神,原创属于他. 2.2 我对代码进行分析.注释.整理,增加代码的可读性. 2.3 通过上述自己的工作,自己也能熟悉相关的JavaS ...
 - js获取用户当前地理位置(省、市、经纬度)
			
在很多情况下,我们需要用到定位功能,来获取用户当前位置.当前比较流行的定位API有腾讯地图.百度地图.高德地图.搜狗地图等等,在这里我使用的是腾讯地图定位API,根据用户IP获取用户当前位置,API返 ...
 - C#中发ref和out
			
ref--Reference 引用 out--Output 输出 相同点: 代入参数时,前面必须加上ref out 关键字 都能在方法内对外部的变量的值进行更改 不同点: ref代入的参数必须 ...
 - 自定义控件之绘图篇(四):canvas变换与操作
			
具体操作见下面链接: http://blog.csdn.net/harvic880925/article/details/39080931/
 - jmeter巧用自增长型变量
			
实现目的 在进行性能测试时,某些请求中的参数值并不允许被重复使用,比如账号的创建.开通授权等服务,这时就需要在jmeter中构造一些自增长型的变量,供后续请求使用,以解决参数值重复的问题. 脚本实现 ...
 - Python连载59-HTTP首部字段和消息头,Thinker简介
			
一.首部字段或者消息头 1.下面几个类型都是请求的: User-Agent:关于浏览器和它平台的消息,如Mozilla5.0 Accept:客户端能处理的页面的类型,如text/html Accept ...
 - Tomcat笔试题!
			
1.企业常见的中间件产品有哪些? 商业:nginx企业版,jobss开源:nginx社区版,tomcat,apache 2.Tomcat软件早期名字及其主要作用? Tomcat的前身为Catalina ...
 - django的静态文件配置和路由控制
			
上一篇写到刚建完django项目,此时我登录页面中调用了js文件,执行后发现报错了找不到js这个文件 目录结构如图所示: <!DOCTYPE html> <html lang=&qu ...
 - placeholder样式
			
.mdwh_txtmod_tp_inpshad input::-webkit-input-placeholder { /* WebKit browsers */ color: #cccccc; } . ...
 
			
		