Machine Learning 学习笔记 (3) —— 泊松回归与Softmax回归
本系列文章允许转载,转载请保留全文!
【请先阅读】【说明&总目录】http://www.cnblogs.com/tbcaaa8/p/4415055.html
1. 泊松回归 (Poisson Regression)
在生活中,经常会遇到一类问题需要对一段时间内某一小概率事件的发生次数建模,例如癌症、火灾等。
假设向量x表示引起这一事件发生的因素,向量θ表示因素的权重,则使用hθ(x)=exp(θTx)表示事件发生次数的期望。θTx位于指数位置,意味着其每增加1个单位,将导至事件发生次数的期望值翻倍。
此时,因变量与自变量近似满足泊松分布,即:y(i)~π(hθ(x(i)))。
下面求参数θ的极大似然估计。似然函数:
对数似然函数:
定义损失函数:
要使似然函数最大,只需使损失函数最小。使用损失函数的极小值代替最小值:
化简,有:
最后,使用梯度下降法迭代求解:
其中,为学习率。
2. Softmax回归 (Softmax Regression)
利用之前介绍的逻辑回归模型,我们已经可以解决二分类问题。下面,我们将二分类问题推广为k分类问题。
在逻辑回归中,因变量y∈{0,1},分别对应两个分类;而在Softmax回归模型中,因变量y∈{1,2,...,k},分别对应k个分类。Softmax回归假定因变量服从参数为Φ1,...,Φk的多项分布,即y(i)~Mult(Φ1,...,Φk)。其中:
参数Φk是冗余的,利用概率之和等于1的条件,可以得到:
同时定义:
容易证明,Φ具有如下性质:
尤其需要注意的是,上述性质对i=k的情况仍然成立,尽管推导过程并不相同。后续证明中将直接使用这些性质。
下面求参数θ的极大似然估计,似然函数:
其中,函数1{expression}定义如下:当expression为真时,函数值为1;否则为0。Φ的性质可以利用1{·}进一步化简。
对数似然函数:
定义损失函数:
要使似然函数最大,只需使损失函数最小。使用损失函数的极小值代替最小值:
可以将上式进一步整理为向量形式:
最后,使用梯度下降法迭代求解:
至此,本系列已经探讨了四个常用的回归模型,其中的泊松回归和Softmax回归初看并不容易理解。关于hθ(x)的来历,以及不同模型中J(θ)相似的原因,将在后续文章中作出说明。
Machine Learning 学习笔记 (3) —— 泊松回归与Softmax回归的更多相关文章
- [Machine Learning]学习笔记-Logistic Regression
[Machine Learning]学习笔记-Logistic Regression 模型-二分类任务 Logistic regression,亦称logtic regression,翻译为" ...
- Machine Learning 学习笔记
点击标题可转到相关博客. 博客专栏:机器学习 PDF 文档下载地址:Machine Learning 学习笔记 机器学习 scikit-learn 图谱 人脸表情识别常用的几个数据库 机器学习 F1- ...
- Machine Learning 学习笔记 (4) —— 广义线性模型
本系列文章允许转载,转载请保留全文! [请先阅读][说明&总目录]http://www.cnblogs.com/tbcaaa8/p/4415055.html 1. 指数分布族简介 之前的文章分 ...
- [Python & Machine Learning] 学习笔记之scikit-learn机器学习库
1. scikit-learn介绍 scikit-learn是Python的一个开源机器学习模块,它建立在NumPy,SciPy和matplotlib模块之上.值得一提的是,scikit-learn最 ...
- Machine Learning 学习笔记1 - 基本概念以及各分类
What is machine learning? 并没有广泛认可的定义来准确定义机器学习.以下定义均为译文,若以后有时间,将补充原英文...... 定义1.来自Arthur Samuel(上世纪50 ...
- Coursera 机器学习 第6章(上) Advice for Applying Machine Learning 学习笔记
这章的内容对于设计分析假设性能有很大的帮助,如果运用的好,将会节省实验者大量时间. Machine Learning System Design6.1 Evaluating a Learning Al ...
- Machine Learning 学习笔记 (1) —— 线性回归与逻辑回归
本系列文章允许转载,转载请保留全文! [请先阅读][说明&总目录]http://www.cnblogs.com/tbcaaa8/p/4415055.html 1. 梯度下降法 (Gradien ...
- 吴恩达Machine Learning学习笔记(三)--逻辑回归+正则化
分类任务 原始方法:通过将线性回归的输出映射到0-1,设定阈值来实现分类任务 改进方法:原始方法的效果在实际应用中表现不好,因为分类任务通常不是线性函数,因此提出了逻辑回归 逻辑回归 假设表示--引入 ...
- machine learning学习笔记
看到Max Welling教授主页上有不少学习notes,收藏一下吧,其最近出版了一本书呢还,还没看过. http://www.ics.uci.edu/~welling/classnotes/clas ...
随机推荐
- Boost C++: 数据结构---tuple
#include <boost/tuple/tuple.hpp> #include <boost/tuple/tuple_io.hpp> #include <boost/ ...
- svn不能提交 svn: is out of date; try updating
今天做项目合并的时候突然不能提交了,开始以为是和服务器的有修改冲突,然后更新一下发现还是不能提交,每次都报is out of date;还原文件 -> 修改 -> 提交 -> 仍然报 ...
- Unieap3.5-JS常用方法
引用js文件 获得当前主体 getDimensionId(); 当前单位类型(网点,分部,总部) getUnitType(); 数据库日期 newOracleDate(); unieap.byId(& ...
- Android WebRTC 音视频开发总结(四)-- webrtc传输模块
在介绍WebRTC通讯之前我们先来看一个P2P视频聊天包括的主要过程,转载请说明出处(博客园RTC.Blacker): 音视频数据采集->编码->发送->接收->解码-> ...
- 运行ipython后显示WARNING: IPython History requires SQLite, your history will not be saved
在CentOS6.5下将自带的python2.6升级到python2.7,并安装了ipython,启动ipython后显示如下信息: WARNING: IPython History requires ...
- 音乐社交APP源码 V1.1
1.关于音乐曲库,对接的是百度音乐,会自动随搜索链接百度曲库2.便捷聊天,采用xmpp基本架构.3.加入和整理了群聊天.4.分布式聊天,喜欢该专辑直接进入聊天,喜欢该音乐的进入聊天.5.采用兴趣社交和 ...
- url中文参数解决方案
首先,弄清楚为什么url传递中文会转码或者乱码,以及http头 contentType="text/html; charset=GBK" 的作用. html代码会经过web服务器, ...
- 微信Api
//定义变量 HttpRequest Request; HttpResponse Response; HttpServerUtility Server; HttpContext Context; pr ...
- 关于MongoDb Replica Set的故障转移集群——理论篇
自从10 gen用Replica Set取代Master/Slave方案后生活其实已经容易多了,但是真正实施起来还是会发现各种各样的小问题,如果不小心一样会栽跟头. 在跟Replica Set血拼几天 ...
- MySQL远程访问授权
开启 MySQL 的远程登陆帐号有两大步: 1.确定服务器上的防火墙没有阻止 3306 端口. MySQL 默认的端口是 3306 ,需要确定防火墙没有阻止 3306 端口,否则远程是无法通过 330 ...