[机器学习]Generalized Linear Model

　　最近一直在回顾linear regression model和logistic regression model，但对其中的一些问题都很疑惑不解，知道我看到广义线性模型即Generalized Linear Model后才恍然大悟原来这些模型是这样推导的，在这里与诸位分享一下，具体更多细节可以参考Andrew Ng的课程。

　　一、指数分布

　　广义线性模型都是由指数分布出发来推导的，所以在介绍GLM之前先讲讲什么是指数分布。指数分布的形式如下：

　　η是参数，T(y)是y的充分统计量，即T(y)可以完全表达y，通常T(y)=y。当参数T，b，a都固定的时候，就定义了一个以η为参数的参数簇。实际上，很多的概率分布都是属于指数分布，比如：

　　（1）伯努利分布

　　（2）正态分布

　　（3）泊松分布

　　（4）伽马分布

　　等等等。。。。

　　或许从原本的形式上看不出来他们是指数分布，但是经过一系列的变换之后，就会发现他们都是指数分布。举两个例子，顺便我自己也推导一下。

　　伯努利分布：

　　那么b(y)=1,T(y)=y,η=log(φ/(1-φ)),a(η)=log((1-φ))，则φ=1/(1+e^-y)，这个就是sigmoid函数的由来。

　　同样我们对正态分布做变换，不过在这里我们要假设方差为1，以为方差并不影响我们的回归。

　　我们可以看到η=µ。

　　二、广义线性模型

　　介绍完指数分布后我们可以来看看广义线性模型是怎样的。

　　首先广义线性模型有三个假设，这三个假设即是前提条件也是帮助我们构造模型的关键。

　　（1）P(y|x;θ)~ExpFamliy(η);

　　（2）对于一个给定x，我们的目标函数为h(x)=E[T(y)|x];

　　（3）η=Θ^Tx

　　根据以上三个假设我们就能推导出logistic model 和最小二乘模型。Logistic model 推导如下：

　　　　　　h(x)=E[T(y)|x]=E[y|x]=φ=1/(1+e^-η)=1/(1+e^{-Θ^Tx})

　　对于最小二乘模型推导如下：

　　　　　　h(x)=E[T(y)|x]=E[y|x]=η=µ=Θ^Tx

　　从中我们将把η和原模型参数联系起来的函数称之为正则响应函数。所以对于广义线性模型，我们需要y是怎样的分布，就能推导出相应的模型。有兴趣的可以从多项式分布试试推导出SoftMax回归。

[机器学习]Generalized Linear Model的更多相关文章

Bayesian generalized linear model (GLM) | 贝叶斯广义线性回归实例
一些问题: 1. 什么时候我的问题可以用GLM,什么时候我的问题不能用GLM? 2. GLM到底能给我们带来什么好处? 3. 如何评价GLM模型的好坏? 广义线性回归啊,虐了我快几个月了,还是没有彻底 ...
广义线性模型（Generalized Linear Model）
广义线性模型(Generalized Linear Model) http://www.cnblogs.com/sumai 1.指数分布族我们在建模的时候,关心的目标变量Y可能服从很多种分布.像线性 ...
广义线性模型(GLM, Generalized Linear Model)
引言:通过高斯模型得到最小二乘法(线性回归),即: 通过伯努利模型得到逻辑回归,即: 这些模型都可以通过广义线性模型得到.广义线性模型是把自变量的线性预测函数当作因变量的估计值.在 ...
从线性模型（linear model）衍生出的机器学习分类器（classifier）
1. 线性模型简介 0x1:线性模型的现实意义在一个理想的连续世界中,任何非线性的东西都可以被线性的东西来拟合(参考Taylor Expansion公式),所以理论上线性模型可以模拟物理世界中的绝大 ...
Andrew Ng机器学习公开课笔记 -- Generalized Linear Models
网易公开课,第4课 notes,http://cs229.stanford.edu/notes/cs229-notes1.pdf 前面介绍一个线性回归问题,符合高斯分布一个分类问题,logstic回 ...
[Scikit-learn] 1.5 Generalized Linear Models - SGD for Classification
NB: 因为softmax,NN看上去是分类,其实是拟合(回归),拟合最大似然. 多分类参见:[Scikit-learn] 1.1 Generalized Linear Models - Logist ...
[Scikit-learn] 1.1 Generalized Linear Models - Logistic regression & Softmax
二分类:Logistic regression 多分类:Softmax分类函数对于损失函数,我们求其最小值, 对于似然函数,我们求其最大值. Logistic是loss function,即: 在逻 ...
Regression：Generalized Linear Models
作者:桂. 时间:2017-05-22 15:28:43 链接:http://www.cnblogs.com/xingshansi/p/6890048.html 前言本文主要是线性回归模型,包括: ...
Generalized Linear Models
作者:桂. 时间:2017-05-22 15:28:43 链接:http://www.cnblogs.com/xingshansi/p/6890048.html 前言主要记录python工具包:s ...

随机推荐

scala 加载与保存xml文档
package scala_enhance.xml import scala.xml.XML import scala.io.Source import jdk.internal.org.xml.sa ...
通过getElementById来取得Form里的表单元素
<1> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>湖南易通 ...
Android菜鸟的成长笔记（24）——Android中的振动器
在某些时候,程序需要启动系统振动器,比如手机静音时使用振动提示用户:再比如玩游戏时,当系统碰撞.爆炸时使用振动带给用户更逼真的体验等.总之,振动是除视频.声音之外的另一种"多媒体" ...
【BZOJ 1037】[ZJOI2008]生日聚会Party
[题目链接]:http://www.lydsy.com/JudgeOnline/problem.php?id=1037 [题意] [题解] /* 设f[i][j][k][l] 表示前i个人中,有j个男 ...
推荐：一个写的相当好的介绍C++单元测试框架Google Test (gtest) 教程
原文来自:http://www.cnblogs.com/coderzh/archive/2009/04/06/1426755.html 虽然有点晚了,还是一口气读完了全部文章.作者言简意赅和明快的风格 ...
一种基于uCos-II操作系统和lwIP协议栈的IEEE-1588主站以及基于该主站的报文处理方法
主站以及应用于电力系统的支持IEEE‐1588协议的主时钟(IEEE‐1588主站)的实现方法.该方法是在一个低成本的硬件平台上,借助uCos‐II操作系统和TCP/IP的协议栈,对以太网数据进行了分 ...
WSL探索及WSLAPI调用记录
以前都是在虚拟机上安装linux,居然刚知道win10有WSL(Windows Subsystem for Linux)可以直接在win10上安装linux,消耗低,效率高,很赞,趁着干兴趣把WSL探 ...
vs中添加MySql实体集流程
默认情况下只有下图: 首先需要下载mysql为vs和ef提供的驱动(可以去官网下载对应的版本) 然后打开vs开始添加实体类首先在NuGet中安装MySql.Data和MySql.Data.Entit ...
jQuery分离构造器
http://www.imooc.com/code/3401 通过new操作符构建一个对象,一般经过四步: A.创建一个新对象 B.将构造函数的作用域赋给新对象(所以this就指向了这个新对象) ...
Java--面试通关要点
这里,笔者结合自己过往的面试经验,整理了一些核心的知识清单,帮助读者更好地回顾与复习 Java 服务端核心技术.本文会以引出问题为主,后面有时间的话,笔者陆续会抽些重要的知识点进行详细的剖析与解答. ...

[机器学习]Generalized Linear Model

[机器学习]Generalized Linear Model的更多相关文章

随机推荐

热门专题