Bias vs. Variance(3)---用learning curves来判断bias/variance problem

画learning curves可以用来检查我们的学习算法运行是否正常或者用来改进我们的算法，我们经常使用learning cruves来判断我们的算法是否存在bias problem/variance problem或者两者皆有。

learning curves--m(trainning size与error的函数)

上图是J_train(θ)与J_cv(θ)与training set size m的关系图，假设我们使用二次项来拟合我们的trainning data。

当trainning data只有一个时，我们能很好的拟合，即J_train(θ)=0;当trainning data有二个时，我们也能很好的拟合，即J_train(θ)=0；随着training data set数量的增加，J_train(θ)也递增；

当trainning data很小时，预测函数的泛化(generalization)就很弱,所以J_cv(θ)就很大，随着raining data set数量的增加，泛化能力增强(对新样本的适应能力增强)，J_cv(θ)递减。

learning curves with high bias--增加training data是没有用的

当我们要用一条直线来模拟上图中的数据时，hypothesis处于high bias的情况，如上图所示，我们有5个样本点是，直线是那样的，我们将样本点增加到10个，直线还是那样的，不会因为我们增加了样本的个数会对数据模拟得更好，所以对于处于high bias的算法，我们增加training data是没有用的。

在high bias的情况下，刚开始样本点少时，J_train(θ)很小，随着样本点越来越多，hypothesis不能拟合太多的样本(underfit状态)，J_train(θ)越来越大

在high bias的情况下，刚开始样本点少时，J_cv(θ)很大(因为少的样本点缺乏泛化能力)，随着样本点的增多，J_cv(θ)变小，小到一个值就会趋于平缓(相对还是很大的值),即不会对我们hypothesis发生什么改变。

在high bias的情况下，J_train(θ)和J_cv(θ)随着样本的增大趋于相近的值(high error)

learning curves with high variance--增加training data是有帮助的

当我们的算法处于high variance情况下，如上图所示x有100次方(假设的情况)并且λ 值很小，这时我们的hypothesis处于high variance.

对于只有5个trainning data的情况，我们的hypothesis能拟合得很好，即当training set size小时，J_train(θ)也很小，随着training set size的增加，hypothesis不会每个点都拟合了，这时J_train(θ)会有所上升，但还是比较小的；

对于只有5个trainning data的情况，我们出现了overfitting的现象，这时J_cv(θ)很大，随着样本的增多，我们的泛化能力增强，J_cv(θ)下降，但是与J_train(θ)有一段gap(表明J_cv(θ)>>J_train(θ),overfitting的表现)，这时如果我们延伸m，即扩大training set size,J_train(θ)上升，J_cv(θ)下降，如上图所示。所以增加training data是有帮助的。

上述两种情况下的learning curve都是理想情况下的，实际情况会有些不同(可能会有些噪声和干扰的曲线)，但是会出现基本类似的结果，可以帮助我们看清我们的学习算法是否处于high bias/high variance/or both。所以当我们想要改进一个学习算法的性能时，我们通常都会画出learning curve,可以让我们更加看清bias or variance problem

Bias vs. Variance(3)---用learning curves来判断bias/variance problem的更多相关文章

(论文笔记Arxiv2021)Walk in the Cloud: Learning Curves for Point Clouds Shape Analysis
目录摘要 1.引言 2.相关工作 3.方法 3.1局部特征聚合的再思考 3.2 曲线分组 3.3 曲线聚合和CurveNet 4.实验 4.1 应用细节 4.2 基准 4.3 消融研究 5.总结 W ...
论文笔记系列-Speeding Up Automatic Hyperparameter Optimization of Deep Neural Networks by Extrapolation of Learning Curves
I. 背景介绍 1. 学习曲线(Learning Curve) 我们都知道在手工调试模型的参数的时候,我们并不会每次都等到模型迭代完后再修改超参数,而是待模型训练了一定的epoch次数后,通过观察学习 ...
模型融合---为什么说bagging是减少variance，而boosting是减少bias?
1.bagging减少variance Bagging对样本重采样,对每一重采样得到的子样本集训练一个模型,最后取平均.由于子样本集的相似性以及使用的是同种模型,因此各模型有近似相等的bias和var ...
吴恩达机器学习笔记37-学习曲线（Learning Curves）
学习曲线就是一种很好的工具,我经常使用学习曲线来判断某一个学习算法是否处于偏差.方差问题.学习曲线是学习算法的一个很好的合理检验(sanity check).学习曲线是将训练集误差和交叉验证集误差作为 ...
斯坦福大学公开课机器学习：advice for applying machine learning | learning curves （改进学习算法：高偏差和高方差与学习曲线的关系）
绘制学习曲线非常有用,比如你想检查你的学习算法,运行是否正常.或者你希望改进算法的表现或效果.那么学习曲线就是一种很好的工具.学习曲线可以判断某一个学习算法,是偏差.方差问题,或是二者皆有. 为了绘制 ...
斯坦福大学公开课机器学习： advice for applying machine learning | regularization and bais/variance（机器学习中方差和偏差如何相互影响、以及和算法的正则化之间的相互关系）
算法正则化可以有效地防止过拟合, 但正则化跟算法的偏差和方差又有什么关系呢?下面主要讨论一下方差和偏差两者之间是如何相互影响的.以及和算法的正则化之间的相互关系假如我们要对高阶的多项式进行拟合,为了 ...
学习曲线（learning curves）
假定假设函数为一个二次函数,只是参数未定: 每给定一个样本大小,就能训练出对应的假设函数,从而利用这个假设函数可以计算出Jtrain(仍然在之前拿来训练的那些样本里面),然后将训练好的假设函数用在全部 ...
Coursera, Machine Learning, notes
Basic theory (i) Supervised learning (parametric/non-parametric algorithms, support vector machine ...
CheeseZH: Stanford University: Machine Learning Ex5:Regularized Linear Regression and Bias v.s. Variance
源码:https://github.com/cheesezhe/Coursera-Machine-Learning-Exercise/tree/master/ex5 Introduction: In ...

随机推荐

python 包多熟悉一个干活就轻松点
包管理管理包和依赖的工具. pip – Python 包和依赖关系管理工具. pip-tools – 保证 Python 包依赖关系更新的一组工具. conda – 跨平台,Python 二进制包管 ...
Python 获取文件类型后缀
import os path='file.txt' file=os.path.splitext(path) filename,type=file print(filename) print(type)
Javaweb的概念与C/S、B/S体系结构
大家好,乐字节的小乐又来了,今天的文章是接上次<客户端请求服务器端通信, Web 编程发展基础|乐字节>,这次是讲述Javaweb的介绍和C/S.B/S体系结构. 一.Javaweb的概念 ...
vue总结的知识点
1.Vue生命周期钩子,都是干嘛用的? Vue实例从创建到销毁的过程,就是生命周期.Vue的生命周期包括:开始创建.初始化数据.编译模板.挂载Dom.渲染→更新→渲染.卸载等一系列过程.在Vue的整个 ...
顺序表习题（1）-打印非递减数组a与b的升序并集（去除重复元素）
void Print_Union(SqList a,SqList b) { , q = ; //初始化指针 ; //记录上一次打印的元素 while (p!=a.length&&q!= ...
Xshell连接虚拟机文档教程
1打开VirtualBox 2 找到导入的虚拟机 3右键虚拟机启动 4 等待加载 5 加载的时候,打开xshell 6 7 填写框住的内容名称: 自己取主机: 127.0.0.1 固定内容端 ...
(二) Windows 进行 Docker CE 安装(Docker Desktop)
参考并感谢官方文档: https://docs.docker.com/docker-for-windows/install/ 下载地址 https://download.docker.com/win ...
关闭禁止 window10 UpdateOrchestrator UsoSvc服务
背景故事:w10流氓更新关了! 然后重启还更新? 读者肯定关过win10自动跟新服务如图: 然后还有这个流氓设置然而微软还有一招啊! 前有win10 update 后有计划任务 powershe ...
MySQL连接使用
在mysql查询中,我们会通过排序,分组等在一张表中读取数据,这是比较简单的,但是在真正的应用中经常需要从多个数据表中读取数据.下面就为大家介绍这种方式,链接查询join. INNER JOIN(内连 ...
DDL 操作表结构
DDL 操作表结构:CRUD 一.C(create)创建 1.创建表 create table 表名( 列名1 数据类型1, 列名2 数据类型2, 列名3 数据类型3, ... 列名n 数据类型n ) ...

Bias vs. Variance(3)---用learning curves来判断bias/variance problem

Bias vs. Variance(3)---用learning curves来判断bias/variance problem的更多相关文章

随机推荐

热门专题