线性回归,多项式回归(P2)
回归问题
回归问题包含有线性回归和多项式回归
简单来说,线性回归就是用多元一次方程拟合数据,多项式回归是用多元多次来拟合方程
在几何意义上看,线性回归拟合出的是直线,平面。多项式拟合出来的是曲线,曲面。
二,线性回归问题
2.1 线性回归
线性回归问题,是监督学习,输出是连续值。(批梯度下降训练参数+平方误差函数做代价函数)
线性问题的求解另一种方法:正规方程。正规方程把参数看成一个整体进行求导。用矩阵一些性质进行简化结果

正规方程:
思路:用矩阵来表示代价函数,求导数为0的时候参数的值,(最后利用矩阵求导结论,求出参数矩阵。)

- 用矩阵表示代价函数: , ,
- 对代价函数求导化简得到正规方程
- 求出Θ。

推到过程:
https://blog.csdn.net/melon__/article/details/80589759
https://blog.csdn.net/jshazhang/article/details/78373218
注意:表达式写成矩阵的形式要注意把符号都表示成列向量,还要区分哪些是向量哪些是矩阵,向量和向量的乘积可以互换位置,但是向量和矩阵不行。
注意矩阵相乘写成表达式的样子是 ,但是这是一个样本的矩阵表达,m个样本矩阵的表达形式要写成ΘTX,就要用列向量表示样本向量。即:
,但是这是一个样本的矩阵表达,m个样本矩阵的表达形式要写成ΘTX,就要用列向量表示样本向量。即:
 ,其中,写成ΘTX-Y 的形式,或者写成XΘ-Y的形式,这两个表达式里面的X都是样本矩阵,但是是样本矩阵的两种形式,也就是两个X矩阵不一样,前者的X矩阵列向量是一个样本,后者的行向量是一个样本。
,其中,写成ΘTX-Y 的形式,或者写成XΘ-Y的形式,这两个表达式里面的X都是样本矩阵,但是是样本矩阵的两种形式,也就是两个X矩阵不一样,前者的X矩阵列向量是一个样本,后者的行向量是一个样本。
2.2 算法需要注意的地方
数据的归一化(特征缩放):为了保证算法下降得更快。
不管是上神经网络课还是数据挖掘课,老师反复强调了特征的缩放(归一化问题),如果不进行特征的缩放,算法可能就会表现很差,甚至不收敛。特征的缩放方法:Min-Max Scaling和Z-score normalization,
学习率的选取:
通常可以考虑尝试些学习率:0.01,0.03,0.1,0.3,1,3,10
三,多项式回归
对于多项式问题:(多元多次模型)
例如:

线性回归,多项式回归(P2)的更多相关文章
- 【udacity】机器学习-回归
		Evernote Export 1.什么是回归? regression 在监督学习中,包括了输入和输出的样本,在此基础上,我们能够通过新的输入来表示结果,映射到输出 输出包含了离散输出和连续输出 2. ... 
- Machine Learning--week2 多元线性回归、梯度下降改进、特征缩放、均值归一化、多项式回归、正规方程与设计矩阵
		对于multiple features 的问题(设有n个feature),hypothesis 应该改写成 \[ \mathit{h} _{\theta}(x) = \theta_{0} + \the ... 
- 线性回归 Linear Regression
		成本函数(cost function)也叫损失函数(loss function),用来定义模型与观测值的误差.模型预测的价格与训练集数据的差异称为残差(residuals)或训练误差(test err ... 
- R语言多项式回归
		含有x和y这两个变量的线性回归是所有回归分析中最常见的一种:而且,在描述它们关系的时候,也是最有效.最容易假设的一种模型.然而,有些时候,它的实际情况下某些潜在的关系是非常复杂的,不是二元分析所能解决 ... 
- stanford coursera 机器学习编程作业 exercise 5(正则化线性回归及偏差和方差)
		本文根据水库中蓄水标线(water level) 使用正则化的线性回归模型预 水流量(water flowing out of dam),然后 debug 学习算法 以及 讨论偏差和方差对 该线性回归 ... 
- 斯坦福第四课:多变量线性回归(Linear Regression with Multiple Variables)
		4.1 多维特征 4.2 多变量梯度下降 4.3 梯度下降法实践 1-特征缩放 4.4 梯度下降法实践 2-学习率 4.5 特征和多项式回归 4.6 正规方程 4.7 正规方程及不可逆性 ... 
- Stanford机器学习笔记-1.线性回归
		Content: 1. Linear Regression 1.1 Linear Regression with one variable 1.1.1 Gradient descent algorit ... 
- 机器学习之多变量线性回归(Linear Regression with multiple variables)
		1. Multiple features(多维特征) 在机器学习之单变量线性回归(Linear Regression with One Variable)我们提到过的线性回归中,我们只有一个单一特征量 ... 
- (一)线性回归与特征归一化(feature scaling)
		线性回归是一种回归分析技术,回归分析本质上就是一个函数估计的问题(函数估计包括参数估计和非参数估计),就是找出因变量和自变量之间的因果关系.回归分析的因变量是应该是连续变量,若因变量为离散变量,则问题 ... 
随机推荐
- sql查询 !='' 和 is not null的区别
			select * from table where a is not null 会把有内容的和内容为空的都查出来而select * from table where a != '' 只会把有内容的查出 ... 
- 30-算法训练 最短路 spfa
			http://lx.lanqiao.cn/problem.page?gpid=T15 算法训练 最短路 时间限制:1.0s 内存限制:256.0MB 问题描述 给定一个n个顶点, ... 
- dev-server.js浅析
			// 检查NodeJS和npm的版本 require('./check-versions')() // 获取配置 var config = require('../config') // 如果Node ... 
- C# Convert.ToInt32和int.Parse转换null和空字符串时的不同表现
			Convert.ToInt32最终调用的函数见下图: int.Parse调用的函数见下图: 具体的见https://www.cnblogs.com/leolis/p/3968943.html的博客,说 ... 
- 字典的增删改查    daty 5
			字典:python中非常重要的数据类型,在python中唯一一个映射的数据类型数据类型分类 按照数据可变与不可变: # 不可变数据类型: int str bool tuple # 可变数据类型: li ... 
- 78k的text 文件,输出到textbox 竟然用了20几秒的原因
			开始查资料以为是io读取的,磁盘速度慢的之类的,后来一想,text 又不是几十万条数据,才那么两千行,咋回事. 原来是循环中不停的修改textbox值导致的. 总结: 比较大的运算,特别是大的循环, ... 
- javascript  DOM基础操作
			DOM(Document Object Model)即文档对象模型,针对HTML和XML文档的API(应用程序接口).DOM描绘了一个层次化的节点树,运行开发人员添加.移除和修改页面的某一部分.DOM ... 
- istio-jaeger-spring boot调用链配置
			istio-jaeger-spring boot调用链配置 虽然,istio ingress controller已经生成了jaeger 记录所需要的信息,但是多个分布式之间没法清晰记录相互之间的依赖 ... 
- IIS7.0上传在大小限制
			修改 IIS7的上传文件大小限制的方法: 1.打开IIS管理器,并定位于想要修改限制的网站 2.双击右侧窗口中的asp图标 3.展开最下面那个“限制属性”,将最下面的“最大请求实体主体限制”右边属性框 ... 
- 添加exe为windows service服务
			[方法一] 一.介绍 srvany.exe是Microsoft Windows Resource Kits工具集的一个实用小工具,用于将EXE程序作为Windows服务运行.srvany是其注册程序的 ... 
