逻辑回归(分类问题)(Logistic Regression、罗杰斯特回归)

逻辑回归：问题只有两项，即{0, 1}。一般而言，回归问题是连续模型，不用在分类问题上，且噪声较大，但如果非要引入，那么采用逻辑回归模型。

对于一般训练集：

参数系统为：

逻辑回归模型为：

(sigmoid函数)

参数求解

对于逻辑回归用来分类{0, 1}问题，假设满足伯努利模型：

可以将上式写为一般形式为：

为了得到参数θ，求最大似然估计[2]，可以得到:

为了简化问题，采用ln函数，即对数似然，可以得到：

这里为了最大似然估计使参数最大化，有两种方法求解：

采用梯度上升的方法(与梯度下降类似，不过减号变为加号)，即：

(批量梯度上升)

对于每一个θj，可以得到：

(随机梯度上升)

根据l(θ)，有：

所以：

采用牛顿的方法

上图目标是找到f(θ)=0，所以用一个迭代的方法，从上图可以看出：

最终找到θ使得f(θ)=0。采用最大似然估计使参数最大，实际上就是找到θ使得l'(θ)=0。那么可以将上式改写为：

扩展到θ，有：

其中，H是Hession矩阵，

牛顿法是二次收敛，假设第一次迭代精度为0.01error，那么第二次0.001，第三次为0.00001。收敛速度明显高于梯度下降。可是每次需要求一次H矩阵的逆，代价很高。

求最大值时，用，求最小值时实际上也是，原因个人认为无论时求最大或者最小值都是使得l'(θ)=0，并没有本质变化。

说明：

一件事情的几率可以定义为：

其中，p为改事件发生的概率。那么对数几率logit可以定义为：

所以，对于logistic回归是对数线性回归。

sigmoid函数推导

如果满足对数线性，则有

也就是说，sigmoid函数输出的值可以认为是为1类别的概率。

logistic回归的损失函数

由于对数似然(logarithm likelihood, LL)是要取最大值，损失函数要求最小，所以对对数似然函数求相反数，即：

上式是建立在，情况下的。

如果，，那么似然函数可以定义为：

其中指数部分还要满足[0,1]的范围内。那么损失函数(负对数似然函数) 可以写为：

[1]网易公开课——斯坦福大学机器学习

[2] http://blog.csdn.net/yanqingan/article/details/6125812

**转载请注明出处！

逻辑回归(分类问题)(Logistic Regression、罗杰斯特回归)的更多相关文章

逻辑回归模型（Logistic Regression）及Python实现
逻辑回归模型(Logistic Regression)及Python实现 http://www.cnblogs.com/sumai 1.模型在分类问题中,比如判断邮件是否为垃圾邮件,判断肿瘤是否为阳 ...
斯坦福CS229机器学习课程笔记 part2：分类和逻辑回归 Classificatiion and logistic regression
Logistic Regression 逻辑回归 1.模型逻辑回归解决的是分类问题,并且是二元分类问题(binary classification),y只有0,1两个取值.对于分类问题使用线性回归不 ...
斯坦福机器学习视频笔记 Week3 逻辑回归与正则化 Logistic Regression and Regularization
我们将讨论逻辑回归. 逻辑回归是一种将数据分类为离散结果的方法. 例如,我们可以使用逻辑回归将电子邮件分类为垃圾邮件或非垃圾邮件. 在本模块中,我们介绍分类的概念,逻辑回归的损失函数(cost fun ...
matlab-逻辑回归二分类（Logistic Regression）
逻辑回归二分类今天尝试写了一下逻辑回归分类,把代码分享给大家,至于原理的的话请戳这里 https://blog.csdn.net/laobai1015/article/details/7811321 ...
机器学习理论基础学习3.3--- Linear classification 线性分类之logistic regression（基于经验风险最小化）
一.逻辑回归是什么? 1.逻辑回归逻辑回归假设数据服从伯努利分布,通过极大化似然函数的方法,运用梯度下降来求解参数,来达到将数据二分类的目的. logistic回归也称为逻辑回归,与线性回归这样输出 ...
美团店铺评价语言处理以及文本分类（logistic regression）
美团店铺评价语言处理以及分类(LogisticRegression) 第一篇数据清洗与分析部分第二篇可视化部分, 第三篇朴素贝叶斯文本分类本文是该系列的第四篇主要讨论逻辑回归分类算法的参数 ...
分类和逻辑回归(Classification and logistic regression)
分类问题和线性回归问题问题很像,只是在分类问题中,我们预测的y值包含在一个小的离散数据集里.首先,认识一下二元分类(binary classification),在二元分类中,y的取值只能是0和1.例 ...
机器学习算法笔记1_2:分类和逻辑回归(Classification and Logistic regression)
形式: 採用sigmoid函数: g(z)=11+e−z 其导数为g′(z)=(1−g(z))g(z) 如果: 即: 若有m个样本,则似然函数形式是: 对数形式: 採用梯度上升法求其最大值求导: 更 ...
逻辑回归原理面试 Logistic Regression
逻辑回归是假设数据服从独立且服从伯努利分布,多用于二分类场景,应用极大似然估计构造损失函数,并使用梯度下降法对参数进行估计.

随机推荐

Java基础19-封装、方法重载、构造方法（构造函数）
1.封装封装就是把不想或者不该告诉别人的东西隐藏起来,把可以告诉别人的公开做法:修改属性的访问权限来限制对属性的访问.并为每一个属性创建一对取值方法和赋值方法,用于对这些属性的访问 class D ...
安装cloudermanager时出现org.spingframework.web.bind.***** host[] is not present at AnnotationMethodHandlerAdapter.java line 738 ****错误（图文详解）（博主推荐）
不多说,直接上干货! 首先,这个问题,写给需要帮助的朋友们,本人在此,搜索资料近半天,才得以解决.看过国内和国外,资料甚少.特此,写此博客,为了弥补此错误解决的资料少的缘故! 问题详解解决办法 ...
Steamworks and Unity – P2P多人游戏
之前我们讨论过“如何把Steamworks.Net和Unity整合起来”,这是一个很好的开始,现在我们研究深一点,谈一谈Steam中的多人游戏.这不是教程,但是可以指导你在你的游戏中如何使用Steam ...
Root用户让其他用户运行某程序
这里以启动tomcat为例 1.安装tomcat不介绍了,自己百度 2.测试能否使用,略 3.创建tomcat用户 useradd tomcat -s /sbin/nologin 创建tomcat,禁 ...
机器学习——GBDT
基础概念 GBDT(Gradient Boosting Decision Tree) 全称梯度提升决策树,是一种迭代的决策树算法.GBDT是集成学习Boosting的家族成员,GBDT中的树是回归树, ...
React.js 小书 Lesson11 - 配置组件的 props
作者:胡子大哈原文链接:http://huziketang.com/books/react/lesson11 转载请注明出处,保留原文链接和作者信息. 组件是相互独立.可复用的单元,一个组件可能在不 ...
IE678不兼容CSS3 user-select:none（不可复制功能），需要JS解决
[方法一:CSS3实现文本不可复制] .content {-moz-user-select:none;-webkit-user-select:none;-ms-user-select:none;-o- ...
BNU29140——Taiko taiko——————【概率题、规律题】
Taiko taiko Time Limit: 1000ms Memory Limit: 65536KB 64-bit integer IO format: %lld Java class ...
ASP.NET 使用 AjaxPro 实现前端跟后台交互
使用 AjaxPro 进行交互,很多人都写过文章了,为什么还要继续老生常谈呢.因为有一些细节上的东西我们需要注意,因为这些细节如果不注意的话,那么程序会报错,而且维护性较差. 引言一.首先,还是那句 ...
IMG标签与before,after伪类
在CSS中总有一些你不用不知道,用到才知道的“坑”.比如今天要谈的,把 before, after 伪类用在 <img> 标签上.嗯,实际上你用你会发现,在大多数浏览器这是无效的,dom中 ...

逻辑回归(分类问题)(Logistic Regression、罗杰斯特回归)

逻辑回归(分类问题)(Logistic Regression、罗杰斯特回归)的更多相关文章

随机推荐

热门专题