Poisson回归模型也是用来分析列联表和分类数据的一种方法,它实际上也是对数线性模型的一种,不同点是对数线性模型假定频数分布为多项式分布,而泊松回归模型假定频数分布为泊松分布。

首先我们来认识一下泊松分布:

一、泊松分布的概念和实际意义:

我们知道二项分布是离散型概率分布中最重要的一种,而二项分布的极限形式就是泊松分布(P很小,n很大),也是非常重要的一种离 散型概率分布,现实世界中许多偶然现象都可以用泊松分布来描述。

泊松分布认为:如果某些现象的发生概率p很小,而样本例数n又很大,则二项分布逼近泊松分布。因此泊松分布是由二项分布推导
出的,具体推导过程如下:

因此泊松分布的概率函数就为

如果一个随机变量x取值为k的概率符合上述公式,则称x服从参数为λ的泊松分布

我们结合二项分布来解释一下推导过程:

如果做一件事情成功的概率是p的话,那么独立尝试做这件事情n次,成功次数的分布就符合二项分布。在做的n次试验中,成功次数 有可能是0次,1次,2次...n次,每一次试验成功的概率是p,不成功的概率是1-p,成功k次的试验可以任意分布在总共的n次试验中,把它们相乘就是恰好成功k次的概率,也就是上面的

那么我们接着考虑:在一个特定时间内,某件事会在任意时刻随机发生。当我们把 这个时间段分割成非常小的n个时间片(n—+∞)并做如下假定:

1.每个时间片内事件发生是独立的,和前后是否发生无关,也就相当于是独立试验。

2.由于n—+∞,那么在1/n这么小的一个时间片内,某个事件发生两次或更多是不可能的。

3.每个时间片内该事件发生的概率p与时间片个数n的乘积n*p=λ,为一常数,这个常数表示了该事件在这个时间段内发生的频度,或称为总体均值、总体发生数等,也就是上面的令p=λ/n

结合以上解释,我们可以了解由二项分布推导出泊松分布的思想,如果用概率论的语言来解释泊松分布,可以描述为:如果某事件
的总体发生次数为λ,那么在n个独立试验中,该事件发生k次的概率分布。

泊松分布可以看做是二项分布的一种特例,对于n很大而p很小的试验,使用二项分布计算十分麻烦,此时可简化为泊松分布进行计算,并且泊松分布非常适合于描述单位时间内随机事件发生次数的概率分布,它将发生次数这种原本离散的数据,和时间结合起来,从而形成了一种类似连续性的概率分布,而二项分布主要是研究n个离散事件的概率分布。

二、泊松分布的条件

1.n很大而p很小
2.事件的发生是相互独立的,每个事件发生的概率相等
3.事件是二分类数据

实际上上述2,3点也是二项分布的条件

三、泊松分布的性质

1.泊松分布的总体均值λ和方差相等
2.当λ较小时,泊松分布呈偏态分布,随着λ增大,泊松分布渐近正态分布,可做正态分布处理,注意这种渐近速度是很快的。
3.泊松分布具有可加性

========================================

介绍完泊松分布,我们来讲泊松回归模型

设有一个解释变量x,可以写出如下回归模型
g(μ)=α+β01x
这个g就是连接函数,如果取其对数,则为
ln(μ)=α+β01x
这个模型的结构和回归模型非常相似,如果因变量y服从泊松分布,那么这个模型就称为泊松回归模型。
泊松回归模型就是描述服从泊松分布的因变量y的均值μ与各协变量x1...xm关系的回归模型。
如果各单元格内发生事件的观察基数不同,需要转化为相同基数再进行分析
ln(μ/n)=α+β01x
n表示相应单元格的观测单位数
将上式变形后得
ln(μ)=ln(n)+α+β01x
这个ln(n)称为偏移量,用于去除观察单位不相等的影响。

泊松回归模型的参数估计也使用迭代重复加权最小二乘法IRLS或极大似然估计。

Poisson回归模型的更多相关文章

  1. SPSS数据分析—Poisson回归模型

    在对数线性模型中,我们假设单元格频数分布为多项式分布,但是还有一类分类变量分布也是经常用到的,就是Poisson分布. Poisson分布是某件事发生次数的概率分布,用于描述单位时间.单位面积.单位空 ...

  2. 如何在R语言中使用Logistic回归模型

    在日常学习或工作中经常会使用线性回归模型对某一事物进行预测,例如预测房价.身高.GDP.学生成绩等,发现这些被预测的变量都属于连续型变量.然而有些情况下,被预测变量可能是二元变量,即成功或失败.流失或 ...

  3. SPSS数据分析—配对Logistic回归模型

    Lofistic回归模型也可以用于配对资料,但是其分析方法和操作方法均与之前介绍的不同,具体表现 在以下几个方面1.每个配对组共有同一个回归参数,也就是说协变量在不同配对组中的作用相同2.常数项随着配 ...

  4. SPSS数据分析—多分类Logistic回归模型

    前面我们说过二分类Logistic回归模型,但分类变量并不只是二分类一种,还有多分类,本次我们介绍当因变量为多分类时的Logistic回归模型. 多分类Logistic回归模型又分为有序多分类Logi ...

  5. SPSS数据分析—二分类Logistic回归模型

    对于分类变量,我们知道通常使用卡方检验,但卡方检验仅能分析因素的作用,无法继续分析其作用大小和方向,并且当因素水平过多时,单元格被划分的越来越细,频数有可能为0,导致结果不准确,最重要的是卡方检验不能 ...

  6. Probit回归模型

    Probit模型也是一种广义的线性模型,当因变量为分类变量时,有四种常用的分析模型: 1.线性概率模型(LPM)2.Logistic模型3.Probit模型4.对数线性模型 和Logistic回归一样 ...

  7. logistic回归模型

    一.模型简介 线性回归默认因变量为连续变量,而实际分析中,有时候会遇到因变量为分类变量的情况,例如阴性阳性.性别.血型等.此时如果还使用前面介绍的线性回归模型进行拟合的话,会出现问题,以二分类变量为例 ...

  8. MATLAB随机森林回归模型

    MATLAB随机森林回归模型: 调用matlab自带的TreeBagger.m T=textread('E:\datasets-orreview\discretized-regression\10bi ...

  9. 逻辑回归模型(Logistic Regression, LR)基础

    逻辑回归模型(Logistic Regression, LR)基础   逻辑回归(Logistic Regression, LR)模型其实仅在线性回归的基础上,套用了一个逻辑函数,但也就由于这个逻辑函 ...

随机推荐

  1. Lock较synchronized多出的特性

    1.尝试非阻塞形式获取锁 tryLock() :当前线程尝试获取锁,如果锁被占用返回false;如果成功则占有锁 //类似用法if(lock.tryLock()) { try { System.out ...

  2. Android应用程序窗口(Activity)的视图对象(View)的创建过程分析

    从前文可知道,每一个Activity组件都有一个关联的Window对象,用来描述一个应用程序窗口.每一个应用程序窗口内部又包含有一个View对象,用来描述应用程序窗口的视图.应用程序窗口视图是真正用来 ...

  3. [Android Tips] 14. Using Proguard with Android without obfuscation

    Option -dontobfuscate REF Using Proguard with Android without obfuscation

  4. Oracle常用操作-----(二)

    Oracle主要类型函数: 单行函数:只能输入一行结果,返回一个结果.常见的单行函数有: 字符函数 数字函数 转换函数 日期函数 2.聚合函数:同时可以对多行数据进行操作,并返回一个结果.(AVG.S ...

  5. Mysql 语句中对关键字进行转义的方式

    在SQLserver中, 对列名表名库名Owner进行转义使用的是[ ] 这个我在其他文章中讲过 ,而且这是一个很好的习惯! 同理  在MySql中 也建议对表名等进行转移  使用的方式是 ``  就 ...

  6. Excel应该这么玩——2、命名列:消除地址引用

    命名列:通过名称引用列,让公式更容易理解. 下面继续举上次的栗子. 1.历史遗留问题 之前虽然把数字编成了命名单元格,但其中还是有单元格地址B2.C2之类,要理解公式需要找到对应的列标题. 特别是像下 ...

  7. 【C解毒】滥用变量

    见:[C解毒]滥用变量

  8. 多浏览器兼容用javascript获取url参数的方法比较推荐的一种

    多浏览器兼容用javascript获取url参数的方法比较推荐的一种 <script language = javascript> function request(paras){ var ...

  9. spring事物配置,声明式事务管理和基于@Transactional注解的使用

    http://blog.csdn.net/bao19901210/article/details/41724355 http://www.cnblogs.com/leiOOlei/p/3725911. ...

  10. 关于在官网上查看和下载特定版本的webrtc代码

    注:这个方法已经不适用了,帖子没删只是留个纪念而已 gclient:如果不知道gclient是什么东西 ... 就别再往下看了. 下载特定版本的代码: #gclient sync --revision ...