Logistic Regression(逻辑回归)(二)—深入理解
(整理自AndrewNG的课件,转载请注明。整理者:华科小涛@http://www.cnblogs.com/hust-ghtao/)
上一篇讲解了Logistic Regression的基础知识,感觉有很多知识没说清楚,自己理解的也不透彻,好在coursera上NG又从另外的角度讲了一下。这里我权当个搬运工,把他讲的搬过来,加上自己的理解整理一下。主要分成三个部分:对的再理解、Decision Boundary(决策边界)、多类问题。
1 对
的再理解
这部分采用启发式的方式来讲解,循序渐进的在跟大家讲一下选择的合理性。我们知道Linear Regression不适合用来解决分类问题,从下面角度来理解:
对于Logistic Regression,

,由图显然,若x从负无穷到正无穷变化时,
的变化范围也是从负无穷到正无穷,而y的取值只能是0或1 。这岂不是很奇怪,直观想象:即使不能映射到0或1,也至少将
映射到
,数学里还真有一个函数,那就是我们上次提到的:

那直接将特征x从映射到
可以吗?显然不合理,若是那样:当x大于0时,就判断为1类,否则为0类,显然不符合实际情况,应该具体问题具体分析。所以就将
进行映射,对于分类问题,通过恰当的选择特征构造
,通过梯度下降法,是可以训练出分类器的。
从概率上这也是合理的,计算出的是,对于输入x,输出y=1的概率。假如对于输入x,计算出
=0.7,则表示y=1的概率为70%,则判断为y=1 。
2 Decision Boundary(决策边界)
上面介绍了分类,却没对的含义,给出形象的解释:

图示如下:

假如已经训练好分类器为,我们对新输入x,判断其类别的依据是:
 ,由于,所以等价于判断:

所以就是我们的分类面,即Decision Boundary 。举例说明:
 ,对于这个分类问题有两个特征和
。我们假设
,经过训练求解:
 ,则分界面为
 ,即
 。
再来看一个非线性决策边界的例子:
 ,对于这个分类问题有4个特征,分别是,
,
和
。我们假设
,经过训练求解:
 ,则分界面的方程为:
 ,为一个圆,图如下:
 。
也就是说,虽然罗辑回归的假设函数为,但分类结果的直观表示却是
,即Decision Boundary(决策边界)。
3 多类问题
以上我们主要介绍了用逻辑回归解决二值分类的问题,下面我们简要介绍一下多类问题。现实生活中有很多的多类问题,例如要根据掌握的信息进行天气的预测,就有阴、晴、雨、雪等情况;对邮件进行分类管理,也可分为家人、朋友、同事等管理类别。
用Logistic Regression解决多类问题的思路很简单:就是把就绝K类的问题,转化为求解K的二值分类问题。下面以一个例子来说明:
 ,这是一个简单的3类问题,我们把它分解成下面3个二值问题来解决:
 ,经过这样的处理就把问题转换成已知的二值分类问题了,用逻辑回归分别进行求解:
就可以得到,
表示对于输入变量x,它属于i类的概率。如果要对新来的输入进行类别的预测,分别计算
,那类对应的
最大,说明输入属于这个类别的概率最大,就判断为这个类别。
这里有一点需要注意:对于K类的多类问题,是要分解成K个二值问题的,而不是(K-1)个或更少。因为各个之间没有什么直接的关系(之和不为1):
 ,可以看到它们之间有交叉,也有都不包含的区域。
Logistic Regression(逻辑回归)(二)—深入理解的更多相关文章
- Coursera DeepLearning.ai Logistic Regression逻辑回归总结
		
既<Machine Learning>课程后,Andrew Ng又推出了新一系列的课程<DeepLearning.ai>,注册了一下可以试听7天.之后每个月要$49,想想还是有 ...
 - Logistic Regression逻辑回归
		
参考自: http://blog.sina.com.cn/s/blog_74cf26810100ypzf.html http://blog.sina.com.cn/s/blog_64ecfc2f010 ...
 - Logistic Regression(逻辑回归)
		
分类是机器学习的一个基本问题, 基本原则就是将某个待分类的事情根据其不同特征划分为两类. Email: 垃圾邮件/正常邮件 肿瘤: 良性/恶性 蔬菜: 有机/普通 对于分类问题, 其结果 y∈{0,1 ...
 - 机器学习简要笔记(五)——Logistic Regression(逻辑回归)
		
1.Logistic回归的本质 逻辑回归是假设数据服从伯努利分布,通过极大似然函数的方法,运用梯度上升/下降法来求解参数,从而实现数据的二分类. 1.1.逻辑回归的基本假设 ①伯努利分布:以抛硬币为例 ...
 - Deep Learning 学习笔记(4):Logistic Regression 逻辑回归
		
逻辑回归主要用于解决分类问题,在现实中有更多的运用, 正常邮件or垃圾邮件 车or行人 涨价or不涨价 用我们EE的例子就是: 高电平or低电平 同时逻辑回归也是后面神经网络到深度学习的基础. (原来 ...
 - 【原】Coursera—Andrew Ng机器学习—Week 3 习题—Logistic Regression 逻辑回归
		
课上习题 [1]线性回归 Answer: D A 特征缩放不起作用,B for all 不对,C zero error不对 [2]概率 Answer:A [3]预测图形 Answer:A 5 - x1 ...
 - 【原】Coursera—Andrew Ng机器学习—课程笔记 Lecture 6_Logistic Regression 逻辑回归
		
Lecture6 Logistic Regression 逻辑回归 6.1 分类问题 Classification6.2 假设表示 Hypothesis Representation6.3 决策边界 ...
 - 机器学习之LinearRegression与Logistic Regression逻辑斯蒂回归(三)
		
一 评价尺度 sklearn包含四种评价尺度 1 均方差(mean-squared-error) 2 平均绝对值误差(mean_absolute_error) 3 可释方差得分(explained_v ...
 - 吴恩达深度学习:2.1Logistic Regression逻辑回归及其损失函数
		
1.Logistic Regression是一个二元分类问题 (1)已知输入的特征向量x可能是一张图,你希望把它识别出来,这是不是猫图,你需要一个算法,可以给出预测值,更正式的y是一个概率,当输入特征 ...
 
随机推荐
- 键盘过滤第一个例子ctrl2cap(4.1~4.4)汇总,测试
			
键盘过滤第一个例子ctrl2cap(4.1~4.4)汇总,测试 完整源代码 /// /// @file ctrl2cap.c /// @author wowocock /// @date 2009-1 ...
 - android 4.2 root
			
前一段因工作需要,对android4.2 进行root.但是在下载了 点击打开链接,下载了Superuser.apk,把对应的apk拷贝到system/app,su拷贝到/system/bin 与/s ...
 - Android 开发 AirPlay Server
			
安卓上开发 AirPlay Server 主要是参考了和修改了 DroidAirPlay项目 , 和Airplay 协议 1, 将DroidAirPlay 下载下来 2, Eclipse 新建一个 ...
 - 设计模式(七)组合模式Composite(结构型)
			
设计模式(七)组合模式Composite(结构型) 1. 概述 在数据结构里面,树结构是很重要,我们可以把树的结构应用到设计模式里面. 例子1:就是多级树形菜单. 例子2:文件和文件夹目录 2.问题 ...
 - VTK中国文字显示和简单的医疗图像浏览软件
			
使用VTK做一个简单的医学图像浏览软件(在http://blog.csdn.net/www_doling_net/article/details/8668870这篇博文的基础上改的),支持标准的医学图 ...
 - java--join方法
			
package MyTest; class TestDemo implements Runnable { public void run() { int i = 0; for (int j = 0; ...
 - HTML5给我们带来了什么
			
websocket 根据维基定义 WebSocket 使得客户端和服务器之间的数据交换变得更加简单,允许服务端直接向客户端推送数据而不需要客户端进行请求,在 WebSocket API 中,浏览器和服 ...
 - 修改 Mac 默认 PHP 运行环境,给 MAMP 配置全局 Composer
			
在没有配置全局性的 Composer 的时候,如果你在没有安装 Composer 的目录下运行 Composer 命令,比如:create-project 系统会返回: Could not open ...
 - traceroute工作原理
			
traceroute, 也就是 trace route,跟踪路由.这个程序最早是Van Jacobson实现的.源代码在网上能够找到,只是我还没有去找.基本的原理是IP路由过程中对数据包TTL(T ...
 - DNS:因特网的目录服务
			
作者:华科小涛,http://www.cnblogs.com/hust-ghtao/ 有两种方式来识别主机:通过主机名或IP地址.人们当然喜欢便于记忆的主机名,而路由器则喜欢定长的.有层次结构的IP地 ...