《图解机器学习-杉山将著》读书笔记---CH3

CH3 最小二乘学习法

重点提炼

提出最小二乘学习法的缘故：

最小二乘学习法公式

对不同模型进行最小二乘法学习，得到最小二乘公式中的参数theta：

1.线性模型

代入3.1公式，对参数求偏导，偏导=0时误差J有极值，此时

①　延伸1：线性模型中的基函数可以是三角多项式

②　延伸2：加权最小二乘学习法

2.核模型

计算参数的方法与线性模型一样，只是把线性模型中的基函数置换成：

如果基函数是n*b的矩阵，且这两个值非常大时的处理方式----随机梯度法

1.n或b很大导致的问题：内存不足

2.使用随机梯度法的前提：最小二乘学习公式中的J是凸函数，否则不能得到全局最优的最小二乘法参数解

3.随机梯度法的流程

这里的J还是最小二乘学习公式中的J，只是这里我们不再直接套用公式：得到最小二乘的参数解，而是采用随机梯度法的方法得到最小二乘法中的参数。

4.随机梯度法提出的缘由：

不断迭代，使得现在参数与目标参数的差值无线接近一个很小的值，即3.3公式中的diata要趋向于0.

5.随机梯度法的收敛速度：由步幅以及diata值决定，要合理调整这些参数值。

P24

通过运行代码学习

“对线性模型进行最小二乘法学习，其中线性模型基函数是三角多项式”

在服务器这个地址下运行matlab：

输入书上代码..........

变量解释：

1）

x: 50*1的列向量，值域[-3,3]，从小到大排列

X:1000*1的列向量，值域[-3,3]，从小到大排列

x与X是自己设置的，x是训练数据的输入，X是测试数据的输入，50与1000可以看成是样本数目

2）

r是50*1列向量，值域是随机的，y是训练数据的目标输出值

x与y都是用来训练得到参数的

3）

p: 50*1的列向量，初始化1

P:1000*1的列向量，初始化1

赋值三角函数值后：

p: 50*31的矩阵 P:1000*31的矩阵

p与P是x与X对应的基函数

这里的基函数可以看成是n（样本数）*b（参数个数）的矩阵

4）

由理论知识得：通过x的目标函数以及x的基函数p，可以得到p\y结果就是要求的最小二乘法中的参数t，当参数t得到之后，就能满足最小二乘法的式子最小，即能够保证最接近目标函数输出值，噪声最小

5）

得到参数后，又有了测试数据的X，知道基于X值的基函数P，通过P与参数t，得到测试数据的输出值F=P*t

6）

绘图

绿色线表示的是测试集；蓝色圆圈表示的是训练集；用训练集对线性模型进行最小二乘法学习，得到最小二乘法参数，其中线性模型基函数是三角多项式。用同样的参数，同样的基函数对应的线性模型，得到测试输出结果。所以y与F的包络是一样的。

P30

通过运行代码学习

部分与p24代码类似；用训练数据x与y得到最小二乘的参数t，其中c用随机的xi；得到t之后，要用测试数据的X与参数得到测试集的预测值F，其中k中的c用训练数据x

迭代次数o不同，收敛结果也不同：

for o=1:1 for o=1:50for o=1:50000

P24

补充知识来理解书上内容

1）绘图基本matlab语言

2）Matlab 输入help plot可以查到这些画图参数的意义

3）Matlab中的/与\区别

对于标量的运算来说
a/b 相当于a除以b
b\a 相当于b除a
对于矩阵运算来说，一个矩阵的逆矩阵，相当于普通运算的倒数，所以
a/b 相当于a乘以b的逆
b\a 相当于b的逆乘以a

P25

补充知识来理解书上内容

矩阵正交性指的是矩阵与矩阵的转置相乘=单位矩阵

P30

补充知识来理解书上内容

1）

所以这里的代码中c用随机的xi来表示

2）Matlab 中 rand*n表示取n数之内的随机数；Matlab中ceil表示取整

《图解机器学习-杉山将著》读书笔记---CH3的更多相关文章

《图解机器学习-杉山将著》读书笔记---CH4
CH4 带有约束条件的最小二乘法重点提炼提出带有约束条件的最小二乘学习法的缘故: 左图中可见:一般的最小二乘学习法有个缺点----对于包含噪声的学习过程经常会过拟合右图:有了空间约束之后,学 ...
《图解机器学习-杉山将著》读书笔记---CH1
CH1 什么是机器学习重点提炼机器学习的种类: 常分为:监督学习.无监督学习.强化学习等监督学习是学生从老师那获得知识,老师提供对错指示无监督学习是在没有老师的情况下,学生自习强化学习是在没 ...
《图解机器学习-杉山将著》读书笔记---CH5
CH5 稀疏学习重点提炼提出稀疏学习的缘故: 虽然带有约束条件的最小二乘学习法结合交叉验证法,在实际应用中是非常有效的回归方法,但是,当参数特别多时,计算参数以及预测值需要大量时间.此时,我们要解 ...
《图解机器学习-杉山将著》读书笔记---CH2
CH2 学习模型重点提炼学习模型作用: 使特定函数与数据集相近似学习模型类型: 1.线性模型 (1)最简单的线性模型,缺点:只能表现线性的输入输出函数,不能很好地解决实际问题 (2)基于参数的线 ...
机器学习介绍（introduction）-读书笔记-
一,什么是机器学习第一个机器学习的定义来自于 Arthur Samuel.他定义机器学习为,在进行特定编程的情况下,给予计算机学习能力的领域.Samuel 的定义可以回溯到 50 年代,他编写了一个 ...
LogisticRegression Algorithm——机器学习（西瓜书）读书笔记
import numpy as np from sklearn.datasets import load_breast_cancer import sklearn.linear_model from ...
《大数据日知录》读书笔记-ch3大数据常用的算法与数据结构
布隆过滤器(bloom filter,BF): 二进制向量数据结构,时空效率很好,尤其是空间效率极高.作用:检测某个元素在某个巨量集合中存在. 构造: 查询: 不会发生漏判(false negativ ...
C#温故知新：《C#图解教程》读书笔记系列
一.此书到底何方神圣? 本书是广受赞誉C#图解教程的最新版本.作者在本书中创造了一种全新的可视化叙述方式,以图文并茂的形式.朴实简洁的文字,并辅之以大量表格和代码示例,全面.直观地阐述了C#语言的各种 ...
《C#图解教程》读书笔记之一：C#和.NET框架
本篇已收录至<C#图解教程>读书笔记目录贴,点击访问该目录可获取更多内容. 一.在.NET之前的编程世界 C#语言是在微软公司的.NET框架上开发程序而设计的,首先作者给大家纠正了一下C# ...

随机推荐

H3C TCP连接的建立
Unity5.6.4f1 配置WebGL教程
Unity 5.6.4f1 发布WebGL的配置教程步骤一:先查看自带的Unity是否yi配置好WebGL的项,若无,则可遵循以下教程来设置步骤二:下图是我已经设置好的,未设置好的状态是,有个Op ...
H3C PPP MP简介
如何查看linux中的ssh端口开启状态
netstat -anp |grep 22 netstat -anp |grep sshlsof -i :22
怎么实现Web聊天
如果你对web聊天这个事情没什么概念,那么最佳做法可能是:openfire+jsjac openfire是java做的开源xmpp服务器,jsjac是javascript做的开源的网页版xmpp客户端 ...
Python--day66--内容回顾
3,python中的大小比较和js中的大小比较规则: python中a>b>c,就是先比较a>b,然后再比较b>c,都为true的话就返回true: js中的a>b> ...
前端开发之HTML
前端编程主要就是三部分:使用数据,存储数据和处理数据. 什么是前端: 前端就是使用数据的过程,通过规定的格式将服务端的数据在浏览器上更好的展示给用户. 前端的工具: HTML CSS 和 JavaS ...
备战省赛组队训练赛第十六场(UPC)
传送门题解: by 烟台大学 (提取码:8972)
MVC，MVP，MVVM基本原理
MVC,MVP,MVVM基本原理模式与框架,其诞生就是为了解决日益复杂的事务处理当同一问题不断出现,人们就会总结细分出相应的问题解决办法当需求变得庞大的时候,就会出现细分,在细分的过程中就会出现 ...
2018百度之星初赛B - A,D,F
总结:这一次的百度之星之行到这里也就结束了,充分的认识到了自己的不足啊...果然还是做的题太少,,见识的题型也还太少,对于STL的掌握还是不够到位啊!!(STL大法是真的好,建议大家认认真真的好好学学 ...

《图解机器学习-杉山将著》读书笔记---CH3

《图解机器学习-杉山将著》读书笔记---CH3的更多相关文章

随机推荐

热门专题