Coursera-AndrewNg(吴恩达)机器学习笔记—

一.逻辑回归问题（分类问题）

生活中存在着许多分类问题，如判断邮件是否为垃圾邮件；判断肿瘤是恶性还是良性等。机器学习中逻辑回归便是解决分类问题的一种方法。
二分类：通常表示为yϵ{0,1}，0：“Negative Class”，1：“Possitive Class”。
逻辑回归的预测函数表达式h_θ(x)（h_θ(x)>=0 && h_θ(x)<=1）：

其中g(z)被称为逻辑函数或者Sigmiod函数，其函数图形如下：

理解预测函数h_θ(x)的意义：其实函数h_θ(x)的值是系统认为样本值Y为1的概率大小，可表示为h_θ(x)=P(y=1|x;θ)=1-P(y=0|x;θ).
决策边界（Decision boundary）：y=0和y=1的分界线，由逻辑函数图形可知，当y=1时，g(z)>=0.5，z>=0，也就是说θ^TX>=0，这样我们就可以通过以x_i为坐标轴，作出θ^TX=0这条直线，这条直线便是决策边界。如下图所示：
代价函数（Cost Function）J(θ)：一定要是一个凸函数（Convex Function），这样经过梯度下降方便找到全局最优。

根据以上两幅图我们可以看出，当预测值h_θ(x)和实际值结果y相同时，代价值为0；当预测值h_θ(x)和实际结果y不同时，代价值无穷大。组合在一起可以写为：

向量化后可写为：
梯度下降算法：和线性回归中使用的一样

向量化：
高级优化方法（用来代替梯度下降选择参数θ）：Conjugate gradient（共轭梯度法）、BFGS、L-BFGS，只需要掌握用法即可，不需了解原理。
优点：不需要手动选择学习速率α，收敛速度比梯度下降快，更复杂。
```
%首先写一个函数用来计算代价函数和代价函数的梯度
function [jVal, gradient] = costFunction(theta)

  jVal = [...code to compute J(theta)...];

  gradient = [...code to compute derivative of J(theta)...];

end

%然后在命令行中通过调用fminunc()函数来计算参数θ
```
options = optimset('GradObj', 'on', 'MaxIter', 100);
initialTheta = zeros(2,1);
[optTheta, functionVal, exitFlag] = fminunc(@costFunction, initialTheta, options);
多分类问题：可以转化为n+1个二分类问题看待，如下：

通过这种形式，我们可以预测出结果最接近哪个y值。

二.过拟合问题和解决方法

Underfit：欠拟合问题具有高偏差；Overfit：过拟合问题具有高方差。
过拟合的定义：如果训练集中有过多的特征项，训练函数过于复杂，而训练数据又非常少。我们学到的算法可能会完美的适应训练集，也就是说代价会接近与0。但是却没有对新样本的泛化能力。
解决方法：手动的选择合适的特征；或者使用模型选择算法（用来选取特征变量）。
正规化（Regularization）：正则化中我们将保留所有的特征变量，但是会减小特征变量的数量级（参数数值的大小θ(j)），相当于减少参数θ(j)所对应的多项式对整个预测函数的影响。以下内容以线性回归为例。
正规化代价函数：其中λ过大会导致欠拟合。

正规化梯度下降：θ₀不需要

其中当参数Θ不为θ₀时，梯度下降形式又可以改写为：

正规化正规方程：其中L为(n+1)*(n+1)维矩阵。
正规化逻辑回归：

代价函数：

梯度下降形式和线性回归相同。
正规化逻辑回归中高级的求解参数θ方法：

无~~~~

Coursera-AndrewNg(吴恩达)机器学习笔记——第三周的更多相关文章

Coursera-AndrewNg(吴恩达)机器学习笔记——第三周编程作业
一. 逻辑回归 1.背景:使用逻辑回归预测学生是否会被大学录取. 2.首先对数据进行可视化,代码如下: pos = find(y==); %找到通过学生的序号向量 neg = find(y==); % ...
Coursera-AndrewNg(吴恩达)机器学习笔记——第三周编程作业（逻辑回归）
一. 逻辑回归 1.背景:使用逻辑回归预测学生是否会被大学录取. 2.首先对数据进行可视化,代码如下: pos = find(y==); %找到通过学生的序号向量 neg = find(y==); % ...
吴恩达机器学习笔记（三） —— Regularization正则化
主要内容: 一.欠拟合和过拟合(over-fitting) 二.解决过拟合的两种方法三.正则化线性回归四.正则化logistic回归五.正则化的原理一.欠拟合和过拟合(over-fitting ...
吴恩达机器学习笔记（六） —— 支持向量机SVM
主要内容: 一.损失函数二.决策边界三.Kernel 四.使用SVM (有关SVM数学解释:机器学习笔记(八)震惊!支持向量机(SVM)居然是这种机) 一.损失函数二.决策边界对于: 当C非常 ...
Machine Learning|Andrew Ng|Coursera 吴恩达机器学习笔记
Week1: Machine Learning: A computer program is said to learn from experience E with respect to some ...
Machine Learning|Andrew Ng|Coursera 吴恩达机器学习笔记(完结)
Week 1: Machine Learning: A computer program is said to learn from experience E with respect to some ...
[吴恩达机器学习笔记]12支持向量机5SVM参数细节
12.支持向量机觉得有用的话,欢迎一起讨论相互学习~Follow Me 参考资料斯坦福大学 2014 机器学习教程中文笔记 by 黄海广 12.5 SVM参数细节标记点选取标记点(landma ...
[吴恩达机器学习笔记]12支持向量机3SVM大间距分类的数学解释
12.支持向量机觉得有用的话,欢迎一起讨论相互学习~Follow Me 参考资料斯坦福大学 2014 机器学习教程中文笔记 by 黄海广 12.3 大间距分类背后的数学原理- Mathematic ...
[吴恩达机器学习笔记]12支持向量机2 SVM的正则化参数和决策间距
12.支持向量机觉得有用的话,欢迎一起讨论相互学习~Follow Me 参考资料斯坦福大学 2014 机器学习教程中文笔记 by 黄海广 12.2 大间距的直观理解- Large Margin I ...

随机推荐

moonmq: 用go实现的高性能message queue
介绍 moonmq是一个用go实现的高性能消息队列系统,后续准备用于我们消息推送服务以及各个后台的异步任务. 在设计上面,moonmq主要借鉴了rabbitmq以及rocketmq相关的思想,但是做了 ...
Linux IPC实践(7) --Posix消息队列
1. 创建/获取一个消息队列 #include <fcntl.h> /* For O_* constants */ #include <sys/stat.h> /* For m ...
C语言通讯录管理系统
本文转载自:http://blog.csdn.net/hackbuteer1/article/details/6573488 实现了通讯录的录入信息.保存信息.插入.删除.排序.查找.单个显示等功能. ...
Touch Handling in Cocos2D 3.x(五)
实现新英雄的放置功能首先我们需要一个变量来保持我们当前移动英雄的引用,因此我们将添加一个私有实例变量.修改MainScene.m中的代码. 用: @implementation MainScene ...
怎样将Android手机弄死机？
将Android手机弄死机目前知道有两种方式: 第一种: 以root权限在shell中执行 stop 通过 start 但是这种串口还是可以用第二种: suecho "c" &g ...
Mahout文本向量化
在文本聚类之前,首先要做的是文本的向量化.该过程涉及到分词,特征抽取,权重计算等等.Mahout 提供了文本向量化工具.由于Mahout 向量化算法要处理的文件是Hadoop SequenceFile ...
11_Eclipse中演示Git版本的创建，历史版本的修改，创建分支，合并历史版本和当前版本
1 执行以下案例: 某研发团队2011年初开发了一款名为Apollo的信息系统,目前已发布v1.0版本.此项目初期已有部分基础代码, 研发团队再此基础代码上经过3个月的努力发布了一个功能相对完备 ...
SpartanBrowser产品和安全特性简介
v:* { } o:* { } w:* { } .shape { }p.MsoNormal,li.MsoNormal,div.MsoNormal { margin: 0cm; margin-botto ...
ubuntu 的挂起与休眠
待机计算机将目前的运行状态等数据存放在内存,关闭硬盘.外设等设备,进入等待状态.此时内存仍然需要电力维持其数据,但整机耗电很少.恢复时计算机从内存读出数据,回到挂起前的状态,恢复速度较快.一般笔记 ...
LeetCode之“字符串”：Restore IP Addresses
题目链接题目要求: Given a string containing only digits, restore it by returning all possible valid IP addr ...

Coursera-AndrewNg(吴恩达)机器学习笔记——第三周

一.逻辑回归问题（分类问题）

二.过拟合问题和解决方法

Coursera-AndrewNg(吴恩达)机器学习笔记——第三周的更多相关文章

随机推荐

热门专题