在分类问题中我们如果：

他们都是广义线性模型中的一个样例，在理解广义线性模型之前须要先理解指数分布族。

指数分布族（The Exponential Family）

假设一个分布能够用例如以下公式表达，那么这个分布就属于指数分布族：

公式中y是随机变量；h(x)称为基础度量值（base measure）；

η称为分布的自然參数（natural parameter），也称为标准參数（canonical parameter）；

T(y)称为充分统计量，通常T(y)=y；

a(η)称为对数切割函数（log partition function）；

本质上是一个归一化常数。确保概率和为1。

当T(y)被固定时，a(η)、b(y)就定义了一个以η为參数的一个指数分布。我们变化η就得到这个分布的不同分布。

伯努利分布属于指数分布族。伯努利分布均值为φ，写为Bernoulli(φ)。是一个二值分布，y ∈ {0, 1}。所以p(y = 1; φ) = φ; p(y = 0; φ) = 1 − φ。当我们变化φ就得到了不同均值的伯努利分布。伯努利分布表达式转化为指数分布族表达式步骤例如以下：

当中，

再举一个高斯分布的样例。高斯分布也属于指数分布族。由高斯分布能够推导出线性模型（推导过程将在EM算法中解说）。由星型模型的如果函数能够得知，高斯分布的方差与如果函数无关，因而为了计算简便，我们设方差=1。

高斯分布转化为指数分布族形式的推导步骤例如以下：

当中

更多分部也属于指数分布族。比如：伯努利分布（Bernoulli）、高斯分布（Gaussian）、多项式分布（Multinomial）、泊松分布（Poisson）、伽马分布（Gamma）、指数分布（Exponential）、β分布、Dirichlet分布、Wishart分布。

构建广义线性模型（Constructing GLMs）

在分类和回归问题中，我们通过构建一个关于x的模型来预測y。这样的问题能够利用广义线性模型（Generalized linear models，GMLs）来解决。构建广义线性模型我们基于三个如果。也能够理解为我们基于三个设计决策。这三个决策帮助我们构建广义线性模型：

,如果满足一个以为參数的指数分布。比如，给定了输入x和參数θ。那么能够构建y关于的表达式。
给定x。我们的目标是要确定T(y)。即。

大多数情况下T(y)=y，那么我们实际上要确定的是。即给定x，如果我们的目标函数是。（在逻辑回归中期望值是。因此目标函数h是φ。在线性回归中期望值是μ，而高斯分布中，因此线性回归中目标函数）。
如果自然參数η和x是线性相关，即如果：

如果有一个预測问题：基于特征商店促销活动、近期的广告、天气、星期几等特征x。来预測商店在任一小时内的顾客数目y。

依据概率知识可知，x、y符合泊松分布。泊松分布属于指数分布族。我们能够利用上面的3个如果。构建一个广义线性模型来进行构建预測模型。

GLMs构建最小二模型

线性回归中的优化目标y（损失函数）是由最小二乘法得到的。能够使用广义线性模型构建最小二乘模型。三个如果：

最小二乘法得到的目标变量y是一个连续值，我们如果给定x下y的分布符合高斯分布。

如果1中的ExponentialFamily(η)就是高斯分布。
在高斯分布中。目标函数
如果：

推导步骤例如以下：

第一步变换依据如果2：

第二步变换依据y|x; θ ∼ N(μ, σ2)，高斯分布的期望值是μ

第三步依据如果1：高斯分布中

第四步依据如果3：

如今已经使用广义线性模型构建出了最小二乘模型。接下来的工作就是利用梯度下降、牛顿方法来求解θ。梯度下降、牛顿方法的内容请參考之前的讲义。

GLMs构建逻辑回归

逻辑回归能够用于解决二分类问题，而分类问题目标函数y是二值的离散值，。依据统计知识。二分类问题能够选择伯努利分布来构建模型。

在伯努利分布的指数分布族表达式中我们已知：，从而得到。

构建广义线性模型的三个如果：

如果符合伯努利分布，
。伯努利分布中

推导步骤例如以下：

同最小二乘模型一样。接下来的工作就由梯度下降或牛顿方法来完毕。

注意一下上面的推到结果，回顾一下，在逻辑回归中。我们选用Sigmoid函数。

之所以在逻辑回归中选用这个g(z)作为Sigmoid函数是由一套理论作支持的。这个理论便是广义线性模型。

广义线性模型 - Andrew Ng机器学习公开课笔记1.6的更多相关文章

Andrew Ng机器学习公开课笔记 -- 支持向量机
网易公开课,第6,7,8课 notes,http://cs229.stanford.edu/notes/cs229-notes3.pdf SVM-支持向量机算法概述, 这篇讲的挺好,可以参考先继 ...
Andrew Ng机器学习公开课笔记–Principal Components Analysis (PCA)
网易公开课,第14, 15课 notes,10 之前谈到的factor analysis,用EM算法找到潜在的因子变量,以达到降维的目的这里介绍的是另外一种降维的方法,Principal Compo ...
Andrew Ng机器学习公开课笔记 -- Generative Learning algorithms
网易公开课,第5课 notes,http://cs229.stanford.edu/notes/cs229-notes2.pdf 学习算法有两种,一种是前面一直看到的,直接对p(y|x; θ)进行建模 ...
Andrew Ng机器学习公开课笔记 -- Generalized Linear Models
网易公开课,第4课 notes,http://cs229.stanford.edu/notes/cs229-notes1.pdf 前面介绍一个线性回归问题,符合高斯分布一个分类问题,logstic回 ...
Andrew Ng机器学习公开课笔记 -- 学习理论
网易公开课,第9,10课 notes,http://cs229.stanford.edu/notes/cs229-notes4.pdf 这章要讨论的问题是,如何去评价和选择学习算法 Bias/va ...
Andrew Ng机器学习公开课笔记 -- Regularization and Model Selection
网易公开课,第10,11课 notes,http://cs229.stanford.edu/notes/cs229-notes5.pdf Model Selection 首先需要解决的问题是,模型 ...
Andrew Ng机器学习公开课笔记–Reinforcement Learning and Control
网易公开课,第16课 notes,12 前面的supervised learning,对于一个指定的x可以明确告诉你,正确的y是什么但某些sequential decision making问题,比 ...
Andrew Ng机器学习公开课笔记 – Factor Analysis
网易公开课,第13,14课 notes,9 本质上因子分析是一种降维算法参考,http://www.douban.com/note/225942377/,浅谈主成分分析和因子分析把大量的原始变量, ...
Andrew Ng机器学习公开课笔记 -- 线性回归和梯度下降
网易公开课,监督学习应用.梯度下降 notes,http://cs229.stanford.edu/notes/cs229-notes1.pdf 线性回归(Linear Regression) 先看个 ...

随机推荐

JS性能优化之创建文档碎片(document.createDocumentFragment）
讲这个方法之前,我们应该先了解下插入节点时浏览器会做什么. 在浏览器中,我们一旦把节点添加到document.body(或者其他节点)中,页面就会更新并反映出这个变化,对于少量的更新, ...
浅析GitLab Flow的十一个规则
使用 Git 版本控制,是对使用它之前的所有版本控制方式的一种改进.然而,很多组织最终以太过混乱或过于复杂的流程来结束.这个问题对于刚从其他版本控制系统转过来的组织来说特别突出. 在本文中我们会列出 ...
Visual Studio 2013 Update2
下载: http://download.microsoft.com/download/6/7/8/6783FB22-F77D-45C5-B989-090ED3E49C7C/vs2013.2.iso
win7无法启动telnet服务
右键我的电脑 —> 管理 —>服务,找到服务telnet, 右键—>属性—>依赖关系就可以看到其他服务的依赖关系,打开相关依赖的服务即可解决服务不能启动的情况
UNIX网络编程读书笔记：基本UDP套接口编程
概述使用UDP编写的一些流行的应用程序有:DNS(域名系统).NFS(网络文件系统)和SNMP(简单网络管理协议). 如下图所示,给出了典型的UDP客户/服务器程序的函数调用: 客户不与服务器建立连 ...
配置静态监听解决ORA-12514错误的案例
今天做Linux下DG配置的时候,遇到一个现象.tnsname.ora文件配置都正常,tnsping也正常,监听也正常.可是仍然报ORA-12514错误: SQL> set lin 130 pa ...
android.app.FragmentManager 与 android.support.v4.app.FragmentManager带来的若干Error
Fragment是activity的界面中的一部分或一种行为.你能够把多个Fragment们组合到一个activity中来创建一个多面界面而且你能够在多个activity中重用一个Fragment.你 ...
ant design pro （十四）advanced 使用 CLI 工具
一.概述原文地址:https://pro.ant.design/docs/cli-cn 为了更好以及高效的开发效率,我们提供了配套的 ant-design-pro-cli 工具. pro cli 提 ...
mindmanager2018官方下载地址
mindmanager2018官方下载地址 CreationTime--2018年6月6日09:09:56 Author:Marydon 找了很多都是假的链接地址,流氓软件,根本不能输入许可密钥, ...
C语言中递归什么时候能够省略return引发的思考：通过内联汇编解读C语言函数return的本质
事情的经过是这种,博主在用C写一个简单的业务时使用递归,因为粗心而忘了写return.结果发现返回的结果依旧是正确的.经过半小时的反汇编调试.证明了我的猜想,如今在博客里分享.也是对C语言编译原理的一 ...