1. 内容概要

Multivariate Linear Regression(多元线性回归)
- 多元特征
- 多元变量的梯度下降
- 特征缩放
Computing Parameters Analytically
- 正规公式（Normal Equation )
- 正规公式非可逆性（Normal Equation Noninvertibility）

2. 重点&难点

1）多元变量的梯度下降

2）特征缩放

为什么要特征缩放

首先要清楚为什么使用特征缩放。见下面的例子

特征缩放前

由图可以知道特征缩放前，表示面积的x1变量的值远大于x2，因此J(θ)图像表示就是椭圆的，导致在梯度下降的过程中，收敛速度非常慢。

特征缩放后

对各变量特征缩放后绘制出来的损失函数J(θ)明显收敛更快，这也是为什么需要特征缩放的原因了。

实现方法

feature scaling

\[
\begin{equation}
x_i := \frac{x_i}{x_\max - x_\min}
\end{equation}
\]

每个输入值除以(max - min)

mean normalization

\[
\begin{equation}
x_i := \frac{x_i - μ_i}{s_i}
\end{equation}
\]

μ_i: 均值

s_i: max - min

3) Normal Equation 正规方程式

Normal Equation

\[
\begin{equation}
θ = （X^T·X）^{﹣1}·X·Y
\end{equation}
\]

具体推理过程详见掰开揉碎推导Normal Equation

与梯度下降方法进行比较

梯度下降	正规方程式
需要选择步长α	不需要选择步长α
需要迭代训练很多次	一次都不需要迭代训练
O(kn²)	O(n³,计算(X^T·X)^-1需要花费较长时间
即使数据特征n很大，也可以正常工作	n如果过大，计算会消耗大量时间

4）正规方程不可逆

当X^T·X不可逆时，很显然此时正规方程将不能正常计算，常见原因如下：

冗余特征，在两个特点紧密相关(即它们呈线性关系，例如面积和（长，宽)这两个特征线性相关）
太多的特征(例如：m≤n)。在这种情况下，可以删除一些特征或使用"regularization"。

补充：

A是可逆矩阵的充分必要条件是 |A|≠0

Andrew Ng机器学习课程笔记--week2（多元线性回归&正规公式）的更多相关文章

Andrew Ng机器学习课程笔记--汇总
笔记总结,各章节主要内容已总结在标题之中 Andrew Ng机器学习课程笔记–week1(机器学习简介&线性回归模型) Andrew Ng机器学习课程笔记--week2(多元线性回归& ...
Andrew Ng机器学习课程笔记--week1（机器学习介绍及线性回归）
title: Andrew Ng机器学习课程笔记--week1(机器学习介绍及线性回归) tags: 机器学习, 学习笔记 grammar_cjkRuby: true --- 之前看过一遍,但是总是模 ...
Andrew Ng机器学习课程笔记（一）之线性回归
Andrew Ng机器学习课程笔记(一)之线性回归版权声明:本文为博主原创文章,转载请指明转载地址 http://www.cnblogs.com/fydeblog/p/7364598.html 前言 ...
Andrew Ng机器学习课程笔记（五）之应用机器学习的建议
Andrew Ng机器学习课程笔记(五)之应用机器学习的建议版权声明:本文为博主原创文章,转载请指明转载地址 http://www.cnblogs.com/fydeblog/p/7368472.h ...
Andrew Ng机器学习课程笔记（四）之神经网络
Andrew Ng机器学习课程笔记(四)之神经网络版权声明:本文为博主原创文章,转载请指明转载地址 http://www.cnblogs.com/fydeblog/p/7365730.html 前言 ...
Andrew Ng机器学习课程笔记（三）之正则化
Andrew Ng机器学习课程笔记(三)之正则化版权声明:本文为博主原创文章,转载请指明转载地址 http://www.cnblogs.com/fydeblog/p/7365475.html 前言 ...
Andrew Ng机器学习课程笔记（二）之逻辑回归
Andrew Ng机器学习课程笔记(二)之逻辑回归版权声明:本文为博主原创文章,转载请指明转载地址 http://www.cnblogs.com/fydeblog/p/7364636.html 前言 ...
Andrew Ng机器学习课程笔记（六）之机器学习系统的设计
Andrew Ng机器学习课程笔记(六)之机器学习系统的设计版权声明:本文为博主原创文章,转载请指明转载地址 http://www.cnblogs.com/fydeblog/p/7392408.h ...
斯坦福机器学习视频笔记 Week2 多元线性回归 Linear Regression with Multiple Variables
相比于week1中讨论的单变量的线性回归,多元线性回归更具有一般性,应用范围也更大,更贴近实际. Multiple Features 上面就是接上次的例子,将房价预测问题进行扩充,添加多个特征(fea ...

随机推荐

iOS 图文并茂的带你了解深拷贝与浅拷贝
一.概念与总结 1.浅拷贝浅拷贝就是对内存地址的复制,让目标对象指针和源对象指向同一片内存空间,当内存销毁的时候,指向这片内存的几个指针需要重新定义才可以使用,要不然会成为野指针. 浅拷贝就是拷贝指 ...
css3 变换 transform(2D)
一.transform变换可做拉伸.压缩.旋转.偏移的效果.需加各个浏览器前缀. 二.transform-origin 为transform属性值的基点,默认值为元素的中心位置,即以元素左上角为坐标 ...
使用WordPress快速建站
安装前的准备1.下载最新版的 WordPress (这里演示为WordPress 3.5 官方中文版),解压后,将WordPress文件夹里面的所有文件,上传到你的主机空间域名所绑定的根目录.2.新建 ...
maven - 引用本地jar，进行jar包移动
背景: 项目为maven工程,部分jar需要需用项目单独修改的本地jar包. 配置好scope后发现构建后引用的jar没有移动到对应的目录,百度后发现需要配置以下依赖 <plugin> & ...
JavaScript Base64加解密
Base64加密算法是网络上最常见的用于传输8Bit字节代码的编码方式之一,大家可以查看RFC2045-RFC2049,上面有MIME的详细规范.Base64编码可用于在HTTP环境下传递较长的标识信 ...
Python正则表达式指南（转）
原文地址:http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html 1. 正则表达式基础 1.1. 简单介绍正则表达式并不是Python ...
Oracle和MySQL分组查询GROUP BY
Oracle和MySQL分组查询GROUP BY 真题1.Oracle和MySQL中的分组(GROUP BY)有什么区别? 答案:Oracle对于GROUP BY是严格的,所有要SELECT出来的字段 ...
css 为元素选择器，css目标状态伪类，结构化选择器，多媒体选择器，清除表默认样式、属性选择器
伪元素选择器 :before 和 :after 添加的位置 :before --- 第一个子节点 :after --- 最后一个子节点特点 1.默认是 inline 元素 2.必须包含 conten ...
Web聊天应用中的表情插件
聊天应用中的表情插件用于即时聊天应用的图片表情插件,具有展示表情.插入表情和表情编解码的功能项目地址看代码看demo 原理介绍 web端的即时聊天中看到的表情,其实就是一张张表情图片,通过im ...
Python爬虫初学（一）—— 爬取段子
最近开始学Python的爬虫,是在这个博客跟着学习的,该博主用的是Python 2.7版本,而我使用的是3.5版本,很多不兼容的地方,不过没关系,自己改改就好了. 我们想针对网站的内容进行筛选,只获取 ...

Andrew Ng机器学习课程笔记--week2（多元线性回归&正规公式）