Popular generalized linear models|GLMM| Zero-truncated Models|Zero-Inflated Models|matched case–control studies|多重logistics回归|ordered logistics regression
==============================================================
Popular generalized linear models
将不同类型的数据做数值转换,转换为线性模型。
连续型变量且正态分布选择
离散型变量且二项分布选择logistics
计数变量且负二项分布选择自然对数
負二項分布是統計學上一種描述在一系列独立同分布的伯努利试验中,失败次数到达指定次数(记为r)时成功次数的離散概率分布。 比如,如果我们定义掷骰子随机变量x值为x=1时为失败,所有x≠1为成功,这时我们反复掷骰子直到1出现3次(失败次数r=3),此时非1数字出现次数的概率分布即为负二项分布。
计数变量且负泊松分布选择自然对数
如果y值非常稀疏,则使用泊松回归。
过度离散,用负二项分布矫正。
得到原始数据先用K-S检验,考查是否符合泊松分布。
第二类错误计算方法是先计算power值,后根据1-power=第二类错误,得到第二类错误。
========================================================================
Generalized linear mixed models混合效应模型GLMM
空间自相关是指sample距离过近影响独立性。使用半方差图判断空间自相关:eg:
如果不使用半方差图,则需要去掉距离过近的sample。
Zero-truncated Models指没有数值为0 的变量值,比如医院人数,但是泊松分布还是会考虑变量为零时的概率值,这不符合客观规律,所以扩大已知项的概率,即Zero-truncated GLM。Eg:理论上值为零占总数据的20%,有数值的概率是80%,将所以实际数值对应概率除以80%,放大即可。
Zero-Inflated Models指变量数值为零的个数超过预期,比较贴近实际情况。我们将数据分成两个虚拟组;第一组仅包含零(假零)。该组也称为零质量的观测值。第二组是计数数据,可以生成零(真零)以及大于零的值。
有假零的概率如下:
====================================================================
matched case–control studies
Eg :应该按照同一年来计算,即相同stratum取值内部,解释attempt取1或0.
=============================================================
多重logistics回归
多重logistics回归是分析样本的某些因素对另一个因素造成影响,与多元判别相同功能,即最终结果是分超过两类。
Rationale就是计算得到某y值的概率,比如汽车数据中得到gear=3时的概率。
Eg:汽车数据中用wt和cyl来解释gear,即计算gear=3、4、5的可能性
============================================================
ordered logistics regression
如果有顺序用ordered logistics regression
Complete separation如果数据过于理想在,而找不到合适β值
eg:x小相对应y小项,x大项对应y大项。,此情况找不对应β值。
Popular generalized linear models|GLMM| Zero-truncated Models|Zero-Inflated Models|matched case–control studies|多重logistics回归|ordered logistics regression的更多相关文章
- [Scikit-learn] 1.1 Generalized Linear Models - from Linear Regression to L1&L2
Introduction 一.Scikit-learning 广义线性模型 From: http://sklearn.lzjqsdd.com/modules/linear_model.html#ord ...
- 广义线性模型(Generalized Linear Models)
前面的文章已经介绍了一个回归和一个分类的例子.在逻辑回归模型中我们假设: 在分类问题中我们假设: 他们都是广义线性模型中的一个例子,在理解广义线性模型之前需要先理解指数分布族. 指数分布族(The E ...
- Regression:Generalized Linear Models
作者:桂. 时间:2017-05-22 15:28:43 链接:http://www.cnblogs.com/xingshansi/p/6890048.html 前言 本文主要是线性回归模型,包括: ...
- Generalized Linear Models
作者:桂. 时间:2017-05-22 15:28:43 链接:http://www.cnblogs.com/xingshansi/p/6890048.html 前言 主要记录python工具包:s ...
- Andrew Ng机器学习公开课笔记 -- Generalized Linear Models
网易公开课,第4课 notes,http://cs229.stanford.edu/notes/cs229-notes1.pdf 前面介绍一个线性回归问题,符合高斯分布 一个分类问题,logstic回 ...
- [Scikit-learn] 1.5 Generalized Linear Models - SGD for Regression
梯度下降 一.亲手实现“梯度下降” 以下内容其实就是<手动实现简单的梯度下降>. 神经网络的实践笔记,主要包括: Logistic分类函数 反向传播相关内容 Link: http://pe ...
- [Scikit-learn] 1.5 Generalized Linear Models - SGD for Classification
NB: 因为softmax,NN看上去是分类,其实是拟合(回归),拟合最大似然. 多分类参见:[Scikit-learn] 1.1 Generalized Linear Models - Logist ...
- [Scikit-learn] 1.1 Generalized Linear Models - Logistic regression & Softmax
二分类:Logistic regression 多分类:Softmax分类函数 对于损失函数,我们求其最小值, 对于似然函数,我们求其最大值. Logistic是loss function,即: 在逻 ...
- [Scikit-learn] 1.1 Generalized Linear Models - Lasso Regression
Ref: http://blog.csdn.net/daunxx/article/details/51596877 Ref: https://www.youtube.com/watch?v=ipb2M ...
随机推荐
- Storm 流式计算框架
1. 简介 是一个分布式, 高容错的 实时计算框架 Storm进程常驻内存, 永久运行 Storm数据不经过磁盘, 在内存中流转, 通过网络直接发送给下游 流式处理(streaming) 与 批处理( ...
- 在Mac上如何运行jar文件
操作一:编译,打包. 操作二: 运行jar文件,提示:jar中没有主清单属性. 解决办法: 使用解压工具解压HelloWorld.jar文件,往MANIFEST.MF中添加Main-Class. 1. ...
- 安装VMtools vim编辑器的使用 压缩包命令 Linux下的用户管理 (第三天)
VM tools:方便我们虚拟机和宿主机之间复制数据或移动文件等 安装VMtools 1.菜单栏-虚拟机-安装VM tools 将其选中 2.进入系统,在桌面位置里面有VM tools的光盘,双击进入 ...
- 澳洲Essay写作常见误区汇总
近年来,想要不断提升自己开拓视野选择留学的学生越来越多,留学生们对于澳洲essay的写作并不生疏,可是许多人并不能很好地完成澳洲essay的写作,因为留学生们对于澳洲essay写作并不怎么了解.其实, ...
- arm 裸机学习笔记
位置无关码 bl 是位置无关码,指令中带的数值是,编译的时候,编译器计算好的,需要跳转的位置减去 bl 指令所在位置的结果.这样当程序最开始在 4k sram 中运行的时候,跳转的位置是在 0 + o ...
- 浅谈__slots__
__slots__在python中是扮演属性声明(Attribute Declaration)的角色,当然属性本身不用声明,只需要在使用前赋值即可,但是实际上,属性的应用远非在使用前赋值就行,所以有a ...
- 干货|微软远程桌面服务蠕虫漏洞(CVE-2019-1182)分析
2019年8月,微软发布了一套针对远程桌面服务的修复程序,其中包括两个关键的远程执行代码(RCE)漏洞,CVE-2019-1181和CVE-2019-1182.与之前修复的"BlueKeep ...
- git push 现有代码到一个新的分支
git push origin HEAD:task/xxx-test-local git push的一般形式为 git push <远程主机名> <本地分支名> <远程 ...
- css3 实现渐变边框
(1)一个渐变的底边线border:1px solid transparent;border-image: -webkit-linear-gradient(right, #FF9848,#FF2A2B ...
- MySQL 插入 中文数据乱码解决
问题描述: 1.在命令行中进行插入,没有问题.但是显示存在部分乱码 2.在JDBC中插入成功.中文是直接以“??”形式显示. 通过Navicat客户端查看 与在网页中看到的一一致,说明读取没有问题,问 ...