#Week4 Logistic Regression

2024-09-26 21:04:13 原文

一、Classification

主要讨论二元分类。

线性回归处理分类问题显然不靠谱，所以采用逻辑回归。

二、Hypothesis Representation

假设函数变为\(h_\theta(x)=g(\theta^TX)\)，使得分类器的输出在[0,1]之间。

\(g(z)=\frac{1}{1+e^{-z}}\)，叫做sigmoid函数:

这个算出的值代表\(y\)是正向类的概率。

三、Decision Boundary

将阈值设为0.5，那么可以得知：当\(\theta^TX>=0\)时，预测\(y\)为1，否则为0。

Decision Boundary就是分隔\(y=1\)与\(y=0\)的边界，这个边界可以是任何形状，取决于假设函数。

上图：

效果非常好，那么如果训练集的数据不是这么规则呢？

四、Cost Function

将逻辑回归的代价函数定义为：

如果沿用线性回归的cost function，那么得到的\(J(\theta)\)是非凸的，这样不利于寻找全局最优解。

如果预测值\(h_\theta(x)=1\)，实际的标签\(y\)也是1，那么\(cost=0\)；

如果预测值\(h_\theta(x)=0\)，而实际的标签\(y\)是1，那么\(cost=+\infin\)，可以看作是对算法预测错误的惩罚。。。

同样的，\(y=0\)也具有相似的特征。

简化上述代价函数：

所以cost function的向量化表示：

\[h = g(X\theta)
\]

\[J(\theta) = \frac{1}{m} \cdot \left(-y^{T}\log(h)-(1-y)^{T}\log(1-h)\right)
\]

可以通过求出\(J(\theta)\)的最小值，得出参数\(\theta\)，接着用\(h_\theta(x)=\frac{1}{1+e^{-\theta^Tx}}\)得到我们的预测值。

怎么求出\(J(\theta)\)的最小值呢？对了，就是Gradient Descent.

向量化表示：

这个和之前线性回归更新参数的公式是一样的，但是由于\(h_\theta(x)\)不同，所以这两个梯度下降是完全不同的。

五、Multiclass classification

将其中的一个类作为正向类(y=1)，其余作为负向类，分别训练出很多分类器，最后选择令输出值\(h_\theta^{i}(x)\)最大的一个\(i\)作为预测值。

相当于每一个分类器都可以识别一种类别：

#Week4 Logistic Regression的更多相关文章

逻辑回归 Logistic Regression
逻辑回归(Logistic Regression)是广义线性回归的一种.逻辑回归是用来做分类任务的常用算法.分类任务的目标是找一个函数,把观测值匹配到相关的类和标签上.比如一个人有没有病,又因为噪声的 ...
logistic regression与SVM
Logistic模型和SVM都是用于二分类,现在大概说一下两者的区别 ① 寻找最优超平面的方法不同形象点说,Logistic模型找的那个超平面,是尽量让所有点都远离它,而SVM寻找的那个超平面,是只 ...
Logistic Regression - Formula Deduction
Sigmoid Function \[ \sigma(z)=\frac{1}{1+e^{(-z)}} \] feature: axial symmetry: \[ \sigma(z)+ \sigma( ...
SparkMLlib之 logistic regression源码分析
最近在研究机器学习,使用的工具是spark,本文是针对spar最新的源码Spark1.6.0的MLlib中的logistic regression, linear regression进行源码分析,其 ...
[OpenCV] Samples 06: [ML] logistic regression
logistic regression,这个算法只能解决简单的线性二分类,在众多的机器学习分类算法中并不出众,但它能被改进为多分类,并换了另外一个名字softmax, 这可是深度学习中响当当的分类算法 ...
Stanford机器学习笔记-2.Logistic Regression
Content: 2 Logistic Regression. 2.1 Classification. 2.2 Hypothesis representation. 2.2.1 Interpretin ...
Logistic Regression vs Decision Trees vs SVM: Part II
This is the 2nd part of the series. Read the first part here: Logistic Regression Vs Decision Trees ...
Logistic Regression Vs Decision Trees Vs SVM: Part I
Classification is one of the major problems that we solve while working on standard business problem ...
Logistic Regression逻辑回归
参考自: http://blog.sina.com.cn/s/blog_74cf26810100ypzf.html http://blog.sina.com.cn/s/blog_64ecfc2f010 ...

随机推荐

New！一只菜鸟的学习之路....
今天拥有了自己的博客,希望在这里记录下自己成长的点点滴滴! 本博客主要记录: 1.在学习过程中遇到的问题及后续的解决办法: 2.技术上的困难,希望路过的大佬指点一二: 3.分享一些实用的技术材料: 4 ...
给定一个整数数组 nums 和一个目标值 target，求nums和为target的两个数的下表
这个是来自力扣上的一道c++算法题目: 给定一个整数数组 nums 和一个目标值 target,请你在该数组中找出和为目标值的那两个整数,并返回他们的数组下标. 你可以假设每种输入只会对应一个答案 ...
家庭记账本app进度之android中AlertDialog的相关应用以及对日期时间的相关操作（应用alertdialog使用的谈话框）
对于AlertDialog的相关知识: 1.创建构造器AlertDialog.Builder的对象: 2.通过构造器对象调用setTitle.setMessage.setIcon等方法构造对话框 ...
Flutter 实现网易云音乐字幕
老孟导读:没有接触过音乐字幕方面知识的话,会对字幕的实现比较迷茫,什么时候转到下一句?看了这篇文章,你就会明白字幕so easy. 先来一张效果图: 字幕格式目前市面上有很多种字幕格式,比如srt, ...
Pandownload作者被抓之后
近日,pandownload作者被抓,可以说是圈内的大事件,被抓之后, Pandownload 已经是打不开,用不了了就在我为此感到惋惜的时候,竟然有出来个shengdownload 先来一块看看这 ...
PHP 5.6连接MySQL 8.0版本遇到的坑
一.数据库失败Warning: mysqli_connect(): The server requested authentication method unknown to t... <?ph ...
\r\n的意思
\n是换行,英文是New line.\r是回车,英文是Carriage return. 1.换行符(line break),是一种计算机语言表达方式,它的作用是跳到下一个新行.在不同的语言中,代码也有 ...
python爬取《龙岭迷窟》的数据，看看质量剧情还原度到底怎么样
前言文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者:简单 PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行 ...
数据结构之循环队列Demo
循环队列比较简单,循环队列主要是判断队满.队空.有效元素个数画图说明: 假设:队的长度为5(0-4) 但是实际maxsize为6,需要一个预留空间(不存储元素)做计算继续添加3个元素后: 出队一 ...
Vmware下安装Linux
Linux系统开源的操作系统.主要是应用在软件的服务器,性能比windows要好. Linux系统(ubuntu,centos,redhat,aix....) Linux主要是通过命令去操作计算机, ...