广义线性模型|logistics|Odds ratio|最大似然函数|LR|AIC|

广义线性模型

y是分类变量

Link function:将分类变量和数值变量放在一起

使用得到结果0 or 1的概率值来评估选0 or1

函数关系：

正比例函数：

logistics函数S型曲线：

Odds ratio反应事件发生的倾向性

logistics函数与probit regression function很像，但是logistics函数基于二项分布，probit regression function基于正态分布。

probit regression function：正态分布的累计概率曲线

logistics函数不需要独立+方差齐性+正态性。

p是怎么根据x变化的，求其偏导：

其中，α和β由之前的数据给定，由最大似然估计确定。

正态分布用样本估计总体，取两个点测试不同的假设均值，找到使得似然函数最大，具体就是列出似然函数对μ求导，令导数为零，即找到最大值。以此类推，可以取n个点。求方差也是同理，对SD求导。

最终结果是，

按照以上思路，而不是反求思路得到的图像是：

必须是总体正态分布，使用MLE估计参数，此时与最小二乘法等同。如果不是正态分布，则不同。

ANOVA, Pearson’s r, t-test, regression

使用广义线性模型得到的概率，将该概率放回原始数据中，计算其差值，该差值符合卡方分布。LR

评价拟合优度的指标：

AIC在相同数目的变量解释同一变量时才会有可比性。越小越好。

K的选择：如果增大K值是使得likehood变化很大，就要可取，但是如果增大K值是使得likehood变化很小，就不可取。

对于小数据，少于40，扁平化数据，没有充分的重复来解释规律，所以引入了一个修正。修改原始数据量的方法是扩大n减小k。

广义线性模型|logistics|Odds ratio|最大似然函数|LR|AIC|的更多相关文章

Stanford大学机器学习公开课（四）：牛顿法、指数分布族、广义线性模型
(一)牛顿法解最大似然估计牛顿方法(Newton's Method)与梯度下降(Gradient Descent)方法的功能一样,都是对解空间进行搜索的方法.其基本思想如下: 对于一个函数f(x), ...
Machine Learning 学习笔记 (4) —— 广义线性模型
本系列文章允许转载,转载请保留全文! [请先阅读][说明&总目录]http://www.cnblogs.com/tbcaaa8/p/4415055.html 1. 指数分布族简介之前的文章分 ...
广义线性模型 GLM
Logistic Regression 同 Liner Regression 均属于广义线性模型,Liner Regression 假设 $y|x ; \theta$ 服从 Gaussian 分布,而 ...
机器学习 —— 基础整理（五）线性回归；二项Logistic回归；Softmax回归及其梯度推导；广义线性模型
本文简单整理了以下内容: (一)线性回归 (二)二分类:二项Logistic回归 (三)多分类:Softmax回归 (四)广义线性模型闲话:二项Logistic回归是我去年入门机器学习时学的第一个模 ...
R语言-广义线性模型
使用场景:结果变量是类别型,二值变量和多分类变量,不满足正态分布结果变量是计数型,并且他们的均值和方差都是相关的解决方法:使用广义线性模型,它包含费正太因变量的分析 1.Logistics回归( ...
广义线性模型(Generalized Linear Models)
在线性回归问题中,我们假设,而在分类问题中,我们假设,它们都是广义线性模型的例子,而广义线性模型就是把自变量的线性预测函数当作因变量的估计值.很多模型都是基于广义线性模型的,例如,传统的线性回归模型, ...
广义线性模型（GLM）
一.广义线性模型概念在讨论广义线性模型之前,先回顾一下基本线性模型,也就是线性回归. 在线性回归模型中的假设中,有两点需要提出: (1)假设因变量服从高斯分布:$Y={{\theta }^{T}}x ...
斯坦福CS229机器学习课程笔记 part3：广义线性模型 Greneralized Linear Models (GLMs)
指数分布族 The exponential family 因为广义线性模型是围绕指数分布族的.大多数常用分布都属于指数分布族,服从指数分布族的条件是概率分布可以写成如下形式:η 被称作自然参数(nat ...
广义线性模型（Generalized Linear Models）
前面的文章已经介绍了一个回归和一个分类的例子.在逻辑回归模型中我们假设: 在分类问题中我们假设: 他们都是广义线性模型中的一个例子,在理解广义线性模型之前需要先理解指数分布族. 指数分布族(The E ...

随机推荐

SAP_BASIS常用事务代码
1.SM66:监控当前系统的所有进程: 2.SM50/SM51:监视当前客户端的所有进程: 3.AL08:查看系统当前用户登录情况: 4.ST22:查看系统发生的DUMP: 5.ST03:查看系统当前 ...
1.1 js中函数定义解析(学习笔记)
1.1.1函数的分类函数声明式 :使用function声明函数,并指定函数名. 函数表达式:使用function声明函数,但未指定函数名. 函数表达式2.匿名函数,匿名函数有很多作用,赋予一个变量则 ...
KVM以及其虚拟机安装
一.KVM安装安装:yum -y install kvm python-virtinst libvirt tunctl bridge-utils virt-manager qemu-kvm-tool ...
一本通1402 Vigenère密码
[题目描述]6世纪法国外交家Blaise de Vigenère设计了一种多表密码加密算法——Vigenère密码.Vigenère密码的加密解密算法简单易用,且破译难度比较高,曾在美国南北战争中为南 ...
hook键盘钩子带dll
library Key; uses SysUtils, Classes, HookKey_Unit in 'HookKey_Unit.pas'; {$R *.res} exports HookOn,H ...
UVALive 6491 You win! 状态DP
这个题目上周的对抗赛的,美国2013区域赛的题目,上次比赛真惨,就做出一道题,最多的也只做出两道,当时想把这题做出来,一直TLE. 这个题目用挂在Hunnu OJ的数据可以过,但UVALive上死活过 ...
TX2Ubuntu16.04远程登录
1.在PC机与TX2都要同步时钟: sudo apt-get install chrony sudo ntpdate ntp.ubuntu.com 如果ntpdate有错误检查是否安装ntpdate ...
h5-FileReader对象的使用
 <!--需要及时预览及时:当用户选择完图片之后就立即进行预览处理--onchange事件预览:通过文件读取对象的readAsData ...
计算机网络(3): ICMP报文
二、提高期(Upping the Ante)
二.提高期(Upping the Ante) Upping the Ante?这可是第四阶段的词.没办法,Greg Thomson用这个词代表第二阶段,看着喜欢,继续沿用. 经过两三个月的“图象+声音 ...

广义线性模型|logistics|Odds ratio|最大似然函数|LR|AIC|

广义线性模型|logistics|Odds ratio|最大似然函数|LR|AIC|的更多相关文章

随机推荐

热门专题