machine learning (2)-linear regression with one variable

machine learning- linear regression with one variable(2)

Linear regression with one variable = univariate linear regression: 由一个输入变量预测出一个output (regression problem预测连续的值). single input<--->single output

training set：机器进行学习的元素集

univariate linear regression = Linear regression with one variable
The Hypothesis Function(for linear regression):,这是一个关于x的函数(θ₀与θ₁是固定的).这是一个假设的函数（求出假设的 θ0 和 θ1，这个是我们的目标,愈近的接近真实的y值）,这样可以根据input value(x)来计算output value(y)
Cost Function(for linear regression): (y为真实的值),这是一个关于θ₁与θ₂(parameters)的函数_,用来衡量假设函数（hypothesis function）的准确性,目的是选择使cost function最小的θ₁与θ₂的值，这样就能确定假设函数(Hypothesis Function)了.
- 图片
Squared error function = cost function
Mean squared error = cost function
Gradient Descent: 一种用来自动提高hypothesis function准确性的方法,使cost function取最小值(不仅适用于linear regression，可用于整个机器学习).
图片 (非cost function for linear regression,一般情况下的J(θ₀,θ₁))
由上图可知，不同的初始值，利用gradient descent可能得出不同的局部最优解（有不同的极小值）

大概方法步骤:

function: J(θ₀,θ₁)

目标: 求出J(θ₀,θ₁)的最小值

先预设 θ₀,θ₁的值
利用gradient descent反复求θ₀,θ₁的值
直至θ₀,θ₁的值收敛于一个确定的值(J(θ₀,θ₁)的极小值),(收敛是因为当到达极值时，cost function的偏导为0，这时会收敛)

learning rate: ∂(大于0),朝着cost function的梯度方向以a(learning rate)系数倍数逼近cost function(θ₀,θ₁为参数)的最小值。
- learning rate太小:使求出收敛的值时迭代的次数变多，使收敛过程变慢(下图是假设θ₀已知，θ₁未知时的cost function图形，若都未知则图应是立体的，如上图)
- learning rate太大：可能会导致无法收敛，得不到正确的值(下图是假设θ₀已知，θ₁未知时的cost function图形,若都未知则图应是立体的，如上图)
The gradient descent equation: (j=0,1)

- - :=为赋值操作，=为truth assertion操作
  - 要同时更新θ₀,θ₁的值(update simultaneously),即算出θ₀的新值后,不能利用这个新值的J(θ₀,θ₁)去算θ₁,而是同时更新θ0,θ1
  - 求的是局部最优解（即cost function的极小值，但是不是最小值）
  - 但是由cost function for linear regression的图(像一个碗状)可知，它只有一个极小值（也是它的最小值），所以对于linear regression问题，gradient descent求的是cost function的最小值

- Gradient Descent for Linear Regression:(是将h(x)=θ₀+θ₁x和J(θ_0,θ₁)代入求导求得)
  - cost function for linear regression由它的图（上图）可知，它没有局部极小值，只有一个全局最小值。所以用gradient descent求出的是使cost function取最小值的θ₀,θ₁
- "batch" gradient descent = gradient descent algorithm,因为在计算θ₀,θ₁时是利用了所有的trainning set,帮称为batch

machine learning (2)-linear regression with one variable的更多相关文章

Machine Learning #Lab1# Linear Regression
Machine Learning Lab1 打算把Andrew Ng教授的#Machine Learning#相关的6个实验一一实现了贴出来- 预计时间长度战线会拉的比較长(毕竟JOS的7级浮屠还没搞 ...
CheeseZH: Stanford University: Machine Learning Ex1:Linear Regression
(1) How to comput the Cost function in Univirate/Multivariate Linear Regression; (2) How to comput t ...
【Coursera - machine learning】 Linear regression with one variable-quiz
Question 1 Consider the problem of predicting how well a student does in her second year of college/ ...
Machine learning（2-Linear regression with one variable ）
1.Model representation Our Training Set [训练集]: We will start with this ''Housing price prediction'' ...
Machine Learning 学习笔记2 - linear regression with one variable(单变量线性回归)
一.Model representation(模型表示) 1.1 训练集由训练样例(training example)组成的集合就是训练集(training set), 如下图所示, 其中(x,y) ...
[Machine Learning] 单变量线性回归(Linear Regression with One Variable) - 线性回归-代价函数-梯度下降法-学习率
单变量线性回归(Linear Regression with One Variable) 什么是线性回归?线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方 ...
Stanford机器学习---第二讲. 多变量线性回归 Linear Regression with multiple variable
原文:http://blog.csdn.net/abcjennifer/article/details/7700772 本栏目(Machine learning)包括单参数的线性回归.多参数的线性回归 ...
Stanford机器学习---第一讲. Linear Regression with one variable
原文:http://blog.csdn.net/abcjennifer/article/details/7691571 本栏目(Machine learning)包括单参数的线性回归.多参数的线性回归 ...
机器学习 (一) 单变量线性回归 Linear Regression with One Variable
文章内容均来自斯坦福大学的Andrew Ng教授讲解的Machine Learning课程,本文是针对该课程的个人学习笔记,如有疏漏,请以原课程所讲述内容为准.感谢博主Rachel Zhang的个人笔 ...

随机推荐

javaScript的高级函数
1.map() map()方法返回一个新数组,新数组是原始数组调用函数之后处理后的值. map()方法按照原始数组元素顺序依次处理元素. map不会对空数组进行检测. map不会改变原始数组 . 参数 ...
vue中$router以及$route的使用
路由基本概念 route,它是一条路由. { path: '/home', component: Home } routes,是一组路由. const routes = [ { path: '/hom ...
Java spi 和Spring spi
service provider framework是一个系统, 实现了SPI, 在系统里多个服务提供者模块可以提供一个服务的实现, 系统让客户端可以使用这些实现, 从而实现解耦. 一个service ...
python学习-64 面向对象三大特性----继承1
面向对象三大特性 1.三大特性? 继承,多态,封装 2.什么是继承? 类的继承和现实生活中的父与子,继承关系是一样的,父类为基类. python中的类继承分为:单继承和多继承 3.举例说明 class ...
pandas.DataFrame对象解析
pandas.DataFrame对象类型解析 df = pd.DataFrame([[1,"2",3,4],[5,"6",7,8]],columns=[&quo ...
MyBatis框架的详解
一.MyBatis的介绍在使用的时候,需要配置文件的方式告知框架需要的信息,多数会使用XML文件作为框架的配置文件. 框架都是由第三方提供的,提供的都是jar包.因此,使用框架前,必须将框架涉及的j ...
Java多线程编程之读写锁【ReentrantReadWriteLock】
有时候我们需要有这样的需求: 对于同一个文件进行读和写操作,普通的锁是互斥的,这样读的时候会加锁,只能单线程的读,我们希望多线程的进行读操作,并且读的时候不能进行写操作,写的时候不能进行 ...
Luogu4705 玩游戏分治FFT
传送门 \(\begin{align*} Ans_k &= \sum\limits_{i=1}^n\sum\limits_{j=1}^m (a_i + b_j)^k \\ &= \su ...
SpringBoot 常用配置静态资源访问配置/内置tomcat虚拟文件映射路径
Springboot 再模板引擎中引入Js等文件,出现服务器拒绝访问的错误,需要配置过滤器静态资源访问配置 @Configuration @EnableWebMvc public class Sta ...
oracle数据库 TIMESTAMP(6)时间戳类型
时间戳类型,参数6指的是表示秒的数字的小数点右边可以存储6位数字,最多9位.由于时间戳的精确度很高,我们也常常用来作为版本控制. 插入时,如下方式:insert into test4 values(t ...

machine learning (2)-linear regression with one variable

machine learning (2)-linear regression with one variable的更多相关文章

随机推荐

热门专题