Logistic 回归模型的参数估计为什么不能采用最小二乘法?
logistic回归模型的参数估计问题,是可以用最小二乘方法的思想进行求解的,但和经典的(或者说用在经典线性回归的参数估计问题)最小二乘法不同,是用的是“迭代重加权最小二乘法”(IRLS, Iteratively Reweighted Least Squares)。本质上不能使用经典的最小二乘法的原因在于,logistic回归模型的参数估计问题不能“方便地”定义“误差”或者“残差”。
下面是对经典线性回归问题和logistic回归问题的一些讨论。
(1)最小二乘/最小二乘法、最小二乘估计和极大似然估计的区别
最小二乘/最小二乘法可以看成是一种朴素的思想,即如果某种差异可以量化为实数,那么我们就可以(自然地)把这些差异的平方相加,将这个和作为一种目标函数。我记得我们高代有节课专门讲过“二乘”的矩阵形式,以及相关的“最小”这一优化目标的矩阵运算等等。
最二乘估计是指用最小二乘法对统计模型中的参数进行估计的估计方法。除了最小二乘估计,还有常用的极大似然估计、矩估计等参数估计的方法。
对经典线性回归模型的参数估计来说,最小二乘估计和极大似然估计的结果是等价的,换句话说,对于其他模型,这种等价性就可能不成立。
对于logistic回归模型来说,极大似然估计是没有解析解(closed form solution)的。 最小二乘估计和极大似然估计的不同在于优化的目标函数不同。最小二乘估计因为是用的最小二乘法,目标函数就是前面提到的那种“自然地”对“误差”或者“残差”的处理方式(这里“误差”和“残差”之所以加引号,是因为我们为了理解方便赋予了操作对象“某种差异”实际的意义);
极大似然估计的目标函数是似然函数。可见,前者的目标函数依赖于我们对“误差”的选取,而后者依赖于数据的具体概率分布。最小二乘估计有很多良好的性质,这些性质是不依赖于具体概率分布的,仅需要满足Gauss-Markov假设即可。
(2)经典线性回归模型和logistic回归模型的区别
经典线性回归模型常用的形式是
(*),
其中服从0均值
的正态分布(或者更一般的,服从Gauss-Markov假设:0均值、等方差、不相关,即不一定是正态的);
logistic回归模型常用的形式是
,
(**)
如果只看这两种表示方式,可能会觉得这两个模型差别很大,比如说,logistic模型(**)怎么没有误差项呢?在(*)里面是服从有2个参数的正态分布
,在(**)里面是服从1个参数的伯努利分布
,为什么
在(**)中模拟了全部的未知参数,而在(*)中只模拟了一个参数
。
实际上,logistic模型可以看成是加上一个logistic 误差项,即
其中服从标准的logistic分布。这样,logistic模型就有一个潜变量的表达形式:
,
这里的潜变量连接函数具体说就是大于零取1,其他情况取0。这样来说,(*)和(**)都可以写成有误差项的表示。
另一方面,从条件期望的表示来看,
模型(*)可以写成:,
模型(**)可以写成:,
可见两个模型分别靠一个函数将
和参数相连接,只是
具体来说是identity函数,
是logit函数。这类模型都可以统一到广义线性回归模型GLM里面。
最后再点一下题,经典的最小二乘法可以处理比较方便写出“残差”的模型的参数估计,比如(*)中的“残差”是连续的实数,因为是模拟的“均值”;而在(**)中的“残差”是离散的0和1,因为
模拟的是产生这些0和1的“概率”。但是如果换成极大似然估计,这些差异都可以统一起来,用极大化似然函数的方法进行求解。
转自:链接:https://www.zhihu.com/question/23817253/answer/85998617
Logistic 回归模型的参数估计为什么不能采用最小二乘法?的更多相关文章
- 如何在R语言中使用Logistic回归模型
在日常学习或工作中经常会使用线性回归模型对某一事物进行预测,例如预测房价.身高.GDP.学生成绩等,发现这些被预测的变量都属于连续型变量.然而有些情况下,被预测变量可能是二元变量,即成功或失败.流失或 ...
- SPSS数据分析—二分类Logistic回归模型
对于分类变量,我们知道通常使用卡方检验,但卡方检验仅能分析因素的作用,无法继续分析其作用大小和方向,并且当因素水平过多时,单元格被划分的越来越细,频数有可能为0,导致结果不准确,最重要的是卡方检验不能 ...
- logistic回归模型
一.模型简介 线性回归默认因变量为连续变量,而实际分析中,有时候会遇到因变量为分类变量的情况,例如阴性阳性.性别.血型等.此时如果还使用前面介绍的线性回归模型进行拟合的话,会出现问题,以二分类变量为例 ...
- 二分类Logistic回归模型
Logistic回归属于概率型的非线性回归,分为二分类和多分类的回归模型.这里只讲二分类. 对于二分类的Logistic回归,因变量y只有“是.否”两个取值,记为1和0.这种值为0/1的二值品质型变量 ...
- SPSS数据分析—配对Logistic回归模型
Lofistic回归模型也可以用于配对资料,但是其分析方法和操作方法均与之前介绍的不同,具体表现 在以下几个方面1.每个配对组共有同一个回归参数,也就是说协变量在不同配对组中的作用相同2.常数项随着配 ...
- Softmax回归——logistic回归模型在多分类问题上的推广
Softmax回归 Contents [hide] 1 简介 2 代价函数 3 Softmax回归模型参数化的特点 4 权重衰减 5 Softmax回归与Logistic 回归的关系 6 Softma ...
- SPSS分析技术:无序多元Logistic回归模型;美国总统大选的预测历史及预测模型
SPSS分析技术:无序多元Logistic回归模型:美国总统大选的预测历史及预测模型 在介绍有序多元Logistic回归分析的理论基础时,介绍过该模型公式有一个非常重要的假设,就是自变量对因变量多个类 ...
- SPSS数据分析—多分类Logistic回归模型
前面我们说过二分类Logistic回归模型,但分类变量并不只是二分类一种,还有多分类,本次我们介绍当因变量为多分类时的Logistic回归模型. 多分类Logistic回归模型又分为有序多分类Logi ...
- 机器学习笔记(四)Logistic回归模型实现
一.Logistic回归实现 (一)特征值较少的情况 1. 实验数据 吴恩达<机器学习>第二课时作业提供数据1.判断一个学生能否被一个大学录取,给出的数据集为学生两门课的成绩和是否被录取 ...
随机推荐
- 鼠标点击的时候出现 "双心心" 的效果
设置步骤 点击博客园的 [管理] → [设置] → 一直往下拉, 找到 [页首Html代码],添加如下代码内容, 保存即可: <script type="text/javascrip ...
- Dubbo服务框架和spring-cloud架构的优缺点
Dubbo一.dubbo简介 Dubbo是阿里巴巴公司开源的一个高性能优秀的服务框架,使得应用可通过高性能的RPC实现服务的输出和输入功能,可以和Spring框架无缝集成. Dubbo是一款高性能.轻 ...
- C# ProgressBar的简单使用
ProgressBar控件(进度条)用于在win窗体中显示进度,由于它的值会不断更新,为了不让界面假死,一般都是采用多线程的方式对进度条进行管理.有关ProgressBar的理论基础跟详细知识我在这里 ...
- 【架构】从instagram学习最小化IT是怎么做的
Keep it very simple (极简主义) Don't re-invent the wheel (不重复发明轮子) Go with proven and solid technologies ...
- tp 七牛云文件上传
1.先创建好七牛云账号和存储空间 申请七牛云账号: 创建七牛云存储空间: 在账号的秘钥管理里面创建秘钥 获取AccessKey / SecretKey: 2.集成PHP-SDK 七牛云开发文档:htt ...
- NTFS权限详解
NTFS权限是作为一个Windows管理员必备的知识,许多经验丰富的管理员都能够很熟悉地对文件.文件夹.注册表项等进行安全性的权限设置,包括完全控制.修改.只读等.而谈论NTFS权限这个话题也算是老生 ...
- w10环境vs2017,vs2019配置Opengl快捷方法
最近,计算机图形学老师向我们布置了任务,配置自己的opengl.百度之后我发现很多教程和方法尝试之后,我发现一种简单的方法来分享给大家. 首先我的软件配置是w10专业版系统+Visual Stdio ...
- 201922904李龙威 2019-2020-2 《Python程序设计》实验二报告
20192204 2019-2020-2 <Python程序设计>实验二报告 课程:<Python程序设计> 班级: 1922 姓名: 李龙威 学号:20192204 实验教师 ...
- Golang 基础之基础语法梳理 (二)
大家好,今天将梳理出的 Go语言基础语法内容,分享给大家. 请多多指教,谢谢. 本次<Go语言基础语法内容>共分为三个章节,本文为第二章节 Golang 基础之基础语法梳理 (一) Gol ...
- 《手把手教你》系列基础篇(八十)-java+ selenium自动化测试-框架设计基础-TestNG依赖测试-番外篇(详解教程)
1.简介 经过前边几篇知识点的介绍,今天宏哥就在实际测试中应用一下前边所学的依赖测试.这一篇主要介绍在TestNG中一个类中有多个测试方法的时候,多个测试方法的执行顺序或者依赖关系的问题.如果不用de ...