Python使用逻辑回归估算OR值

第一种是统计学方法，需要用到 statsmodels包

　　statsmodels是统计和计量经济学的package，包含了用于参数评估和统计测试的实用工具

第二种是机器学习，需要使用sklearn中的LogisticRegression

下面以计算dis1-->dis2的OR值为例，也就是说dis1为自变量，dis2为因变量

首先我们先造一组数据： x为自变量，y为因变量

df = pd.DataFrame({'x': ['dis1', 'dis1', 'dis1', 'dis1', 'dis3', 'dis3', 'dis3', 'dis3'], 'y': ["dis2", "dis2",

"dis2", "dis4", "dis4", "dis4", "dis4", "dis2"]})

因为我要使用逻辑回归估计OR值，所以首先会计算出实际的OR值

	患dis2	不患dis2
患dis1	A	B
不患dis1	C	D

OR值的计算:OR_dis1_dis2 = AD/BC,其中A = 3, B = 1, C = 1, D = 3

ct = pd.crosstab(df.x, df.y)

oddsratio, pvalue = stats.fisher_exact(ct)

使用stamodel包中的逻辑回归进行OR值的估计：

df["intercept"] = 1.0  # 截距项，初始化截距项，不可省

# 拟合模型

logit = sm.Logit(df['y'], df[df.columns[1:]])

result = logit.fit()

print(result.summary())

# 计算得到OR值

OR1 = np.exp(result.params)

使用机器学习方法计算OR

df = pd.get_dummies(df)

clf = LogisticRegression(penalty='none')

clf.fit(df[['x_dis1']], df[['y_dis2']].values)

print(clf)

odds_ratio = np.exp(clf.coef_)

print(odds_ratio)

完整代码：

import pandas as pd

import statsmodels.api as sm

from sklearn.linear_model import LogisticRegression

import numpy as np

# 构造数据

df = pd.DataFrame({'x': ['dis1', 'dis1', 'dis1', 'dis1', 'dis3', 'dis3', 'dis3', 'dis3'], 'y': ["dis2", "dis2",

"dis2", "dis4", "dis4", "dis4", "dis4", "dis2"]})

# 计算实际OR

ct = pd.crosstab(df.x, df.y)

oddsratio, pvalue = stats.fisher_exact(ct)

# 使用统计学方法计算

df["intercept"] = 1.0  # 截距项，初始化截距项，不可省

# 拟合模型

logit = sm.Logit(df['y'], df[df.columns[1:]])

result = logit.fit()

print(result.summary())

# 计算得到OR值

OR1 = np.exp(result.params)

# 使用机器学习方法计算

df = pd.get_dummies(df)

clf = LogisticRegression(penalty='none')

clf.fit(df[['x_dis1']], df[['y_dis2']].values)

print(clf)

odds_ratio = np.exp(clf.coef_)

print(odds_ratio)

Python使用逻辑回归估算OR值的更多相关文章

机器学习_线性回归和逻辑回归_案例实战：Python实现逻辑回归与梯度下降策略_项目实战：使用逻辑回归判断信用卡欺诈检测
线性回归: 注:为偏置项,这一项的x的值假设为[1,1,1,1,1....] 注:为使似然函数越大,则需要最小二乘法函数越小越好线性回归中为什么选用平方和作为误差函数?假设模型结果与测量值误差满足 ...
机器学习之使用Python完成逻辑回归
一.任务基础我们将建立一个逻辑回归模型来预测一个学生是否被大学录取.假设你是一个大学系的管理员,你想根据两次考试的结果来决定每个申请人的录取机会.你有以前的申请人的历史数据,你可以用它作为逻辑回归的 ...
Python之逻辑回归模型来预测
建立一个逻辑回归模型来预测一个学生是否被录取. import numpy as np import pandas as pd import matplotlib.pyplot as plt impor ...
python机器学习-逻辑回归
1.逻辑函数假设数据集有n个独立的特征,x1到xn为样本的n个特征.常规的回归算法的目标是拟合出一个多项式函数,使得预测值与真实值的误差最小: 而我们希望这样的f(x)能够具有很好的逻辑判断性质,最 ...
python机器学习——逻辑回归
我们知道感知器算法对于不能完全线性分割的数据是无能为力的,在这一篇将会介绍另一种非常有效的二分类模型--逻辑回归.在分类任务中,它被广泛使用逻辑回归是一个分类模型,在实现之前我们先介绍几个概念: 几 ...
python实现逻辑回归
首先得明确逻辑回归与线性回归不同,它是一种分类模型.而且是一种二分类模型. 首先我们需要知道sigmoid函数,其公式表达如下: 其函数曲线如下: sigmoid函数有什么性质呢? 1.关于(0,0. ...
吴裕雄 python 机器学习——逻辑回归
import numpy as np import matplotlib.pyplot as plt from matplotlib import cm from mpl_toolkits.mplot ...
用python实现逻辑回归
机器学习课程的一个实验,整理出来共享. 原理很简单,优化方法是用的梯度下降.后面有测试结果. # coding=utf-8 from math import exp import matplotlib ...
Python之逻辑回归
代码: import numpy as np from sklearn import datasets from sklearn.linear_model import LogisticRegress ...

随机推荐

@Async的用法和示例
@Async 注解的用法和示例目录 @Async 注解的用法和示例背景异步调用 @Async介绍在Spring中启用@Async 示例一:基本使用方式示例二:在同一个类中调用异步方法示例三 ...
LeetCode-049-字母异位词分组
字母异位词分组题目描述:给定一个字符串数组,将字母异位词组合在一起.字母异位词指字母相同,但排列不同的字符串. 示例说明请见LeetCode官网. 来源:力扣(LeetCode) 链接:https: ...
2W字长文吐血整理 Docker&云原生
Docker 和云原生一.概念介绍 1.1 Docker Docker 是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的镜像中,然后发布到任何流行的 Linux或Win ...
微信小程序结合laravel完成签到功能
前端样式未做处理,可将后端数据传至前端进行处理 1.wxml页面  <view class='signIn'> & ...
微信小程序防抖
https://www.cnblogs.com/daviddd/p/12470480.html 1:wxml:设置一个按钮 <button type="primary" bi ...
nginx 配置 https,及加载配置文件夹
首先需要去申请一个域名签名证书,在腾讯云,阿里云都有免费版,然后下载下来按如下配置,请根据自己路径更改 server { listen 80; server_name xxx.xxx.cn; root ...
WindowsServer域用户批量创建方法
@font-face { font-family: "Times New Roman" } @font-face { font-family: "宋体" } @ ...
SolidWorks在一个零件中设置不同的尺寸版本
问题比如想设置一系列螺丝的长度,一个一个建零件非常麻烦,希望在一个零件中设置不同的长度尺寸版本解决比如想设置不同的拉伸长度,右键拉伸>配置特征可以生成新配置,设置不同的D1参数,即可生成 ...
AFO以后的机房游记
2019.8.6~8.8 周老师让我讲插头DP,理所当然地到机房备课(tuifei) dl24来了足足19个人.只可惜lsy没来,我们的phy,ljx去了首师附.看不到神仙打架了[哭] 插头DP这玩意 ...
为什么枚举单例在 Java 中更好?
枚举单例是使用一个实例在 Java 中实现单例模式的新方法.虽然Java中的单例模式存在很长时间,但枚举单例是相对较新的概念,在引入Enum作为关键字和功能之后,从Java5开始在实践中.本文与之前关 ...

Python使用逻辑回归估算OR值

Python使用逻辑回归估算OR值的更多相关文章

随机推荐

热门专题