李宏毅机器学习课程---3、Where does the error come from

一、总结

一句话总结：机器学习的模型中error的来源是什么

bias：比如打靶，你的瞄准点离准心的偏移

variance：比如打靶，你的实际打靶的位置偏离你的瞄准点的距离：相当于方差

1、机器学习中为什么需要判断error的来源？

有的放矢，改进模型：因为你的模型出错，你肯定需要改进模型，知道错误来源后才方便改进模型

2、做多次实验，一次函数和多次函数的函数在图上如何分布？

多次函数在多次实验中分布的线比较开

3、简单model和复杂model，bias和variance的大小情况如何？

简单模型：Large Bias，Small Variance

复杂模型：Small Bias，Large Variance

4、bias和variance分别很大的时候叫什么？

Underfitting：Large Bias：under说明小了，还要继续提升模型复杂度

Overfitting：Large Variance：over说明模型过渡复杂了

5、我怎么知道我模型是bias很大（Underfitting）？

不能满足training data：If your model cannot even fit the training examples, then you have large bias

6、我怎么知道我模型是variance很大（Overfitting）？

不能满足testing data：If you can fit the training data, but large error on testing data, then you probably have large variance

7、如果我模型的bias很大（Underfitting），我应该怎么做？

重新设计模型：比如考虑更多参数

更多数据没用：因为你的模型本身就不好，所以更多数据其实是没用的

For bias, redesign your model:
• Add more features as input
• A more complex model

8、如果我模型的variance很大（Overfitting），我应该怎么做？

More data：增加数据：Very effective, but not always practical

Regularization：平滑化：没用更多数据的情况：可能伤害bias

9、我们怎样选择模型？

相互转换：There is usually a trade-off between bias and variance.

相当于和更小：Select a model that balances two kinds of error to minimize total error

10、我们选择好了模型之后，用自己的测试数据测试之后，外部的测试数据测试的结果一般会比我们的测试结果大么？

一般都会比我们的测试结果大

11、我们应该如何验证我们的模型？

数据分多份：测试数据1，模型完了之后再用；测试数据2，选模型的时候再用；数据3，构建模型的时候用

一定留一份data做 private data，模拟实际用户使用的时候的情况

二、内容在总结中

李宏毅机器学习课程---3、Where does the error come from的更多相关文章

李宏毅机器学习课程---2、Regression - Case Study
李宏毅机器学习课程---2.Regression - Case Study 一.总结一句话总结: 分类讨论可能是比较好的找最佳函数的方法:如果有这样的因素存在的话模型不够好,可能是因素没有找全 ...
李宏毅机器学习课程---4、Gradient Descent （如何优化）
李宏毅机器学习课程---4.Gradient Descent (如何优化) 一.总结一句话总结: 调整learning rates:Tuning your learning rates 随机Grad ...
李宏毅机器学习课程笔记-2.5线性回归Python实战
本文为作者学习李宏毅机器学习课程时参照样例完成homework1的记录. 任务描述(Task Description) 现在有某地空气质量的观测数据,请使用线性回归拟合数据,预测PM2.5. 数据集描 ...
李宏毅机器学习笔记1：Regression、Error
李宏毅老师的机器学习课程和吴恩达老师的机器学习课程都是都是ML和DL非常好的入门资料,在YouTube.网易云课堂.B站都能观看到相应的课程视频,接下来这一系列的博客我都将记录老师上课的笔记以及自己对 ...
Coursera台大机器学习课程笔记7 -- Noise and Error
本章重点: 简单的论证了即使有Noise,机器依然可以学习,VC Dimension对泛化依然起作用:介绍了一些评价Model效果的Error Measurement方法. 一论证即使有Noisy, ...
李宏毅老师机器学习课程笔记_ML Lecture 2: Where does the error come from?
引言: 最近开始学习"机器学习",早就听说祖国宝岛的李宏毅老师的大名,一直没有时间看他的系列课程.今天听了一课,感觉非常棒,通俗易懂,而又能够抓住重点,中间还能加上一些很有趣的例子 ...
李宏毅老师机器学习课程笔记_ML Lecture 1: ML Lecture 1: Regression - Demo
引言: 最近开始学习"机器学习",早就听说祖国宝岛的李宏毅老师的大名,一直没有时间看他的系列课程.今天听了一课,感觉非常棒,通俗易懂,而又能够抓住重点,中间还能加上一些很有趣的例子 ...
李宏毅老师机器学习课程笔记_ML Lecture 1: 回归案例研究
引言: 最近开始学习"机器学习",早就听说祖国宝岛的李宏毅老师的大名,一直没有时间看他的系列课程.今天听了一课,感觉非常棒,通俗易懂,而又能够抓住重点,中间还能加上一些很有趣的例子 ...
李宏毅老师机器学习课程笔记_ML Lecture 0-2: Why we need to learn machine learning?
引言: 最近开始学习"机器学习",早就听说祖国宝岛的李宏毅老师的大名,一直没有时间看他的系列课程.今天听了一课,感觉非常棒,通俗易懂,而又能够抓住重点,中间还能加上一些很有趣的例子 ...

随机推荐

python3 投票
import urllib.request # cd C:\Python36-32\Scripts # pip install BeautifulSoup from bs4 import Beauti ...
编码格式分类: 前后端传递数据的编码格式contentType
urlencoded:form表单和ajax提交数据的默认编码格式 form-data:传文件 application/json:json格式数据 >>> 前后端分离 urlenco ...
拆边+BFS队列骚操作——cf1209F
这个拆边+队列操作实在是太秒了队列头结点存的是一个存点集的vector,1到这个点集经过的路径权值是一样的,所以向下一层拓展时,先依次走一遍每个点的0边,再走1边...以此类推,能保证最后走出来的路 ...
js 将字符串当作js表达式执行方法
听同事说了一个需求.他有一个数据对象obj,接口会给他返回一个索引key,这个key长度不固定,根据这个key去修改obj对应的值. 举个例子: let obj={"level1" ...
python之-sqlite3
在这些 URL 中,hostname 表示 MySQL 服务所在的主机,可以是本地主机(localhost),也可以是远程服务器.数据库服务器上可以托管多个数据库,因此 database 表示要使用的 ...
【UR #2】跳蚤公路
[UR #2]跳蚤公路参照yjc方法.也就是地铁环线那个题. 求每个点不在负环内的x的取值范围.然后所有1到j能到i的j的范围取交.得到答案. 每个边形如kx+b的直线,每个环也是每个点不在负环内 ...
Java异常关闭资源的两种方式
try-catch-finally 常用,在异常关闭时应判断流是否为空 public class CloseableUtils { public static void closeable(Close ...
ocaml学习
ocaml与haskell一样,是functional programming的代表. 对于有一定编程经验的人来说,入手一种新语言,最有效的方式就是开发一些实用的utility,因此top-level ...
flink收藏博客
1.https://blog.csdn.net/liguohuabigdata/article/category/7279020 2.http://wuchong.me 3.https://www.j ...
前端（二十二）—— vue组件：局部组件、全局组件、父组件数据传到子组件、子组件数据传到父组件、父子组件实现todoList
Vue组件一.组件介绍每一个组件都是一个vue实例每个组件均具有自身的模板template,根组件的模板就是挂载点,根组件也可以显式书写模板,会替换掉挂载点每个组件模板只能拥有一个根标签子组 ...

李宏毅机器学习课程---3、Where does the error come from

李宏毅机器学习课程---3、Where does the error come from

一、总结

一句话总结：机器学习的模型中error的来源是什么

bias：比如打靶，你的瞄准点离准心的偏移

variance：比如打靶，你的实际打靶的位置 偏离你的瞄准点的距离：相当于方差

1、机器学习中为什么需要判断error的来源？

有的放矢，改进模型：因为你的模型出错，你肯定需要改进模型，知道错误来源后才方便改进模型

2、做多次实验，一次函数和多次函数的函数在图上如何分布？

多次函数在多次实验中分布的线比较开

3、简单model和复杂model，bias和variance的大小情况如何？

简单模型：Large Bias，Small Variance

复杂模型：Small Bias，Large Variance

4、bias和variance分别很大的时候叫什么？

Underfitting：Large Bias：under说明小了，还要继续提升模型复杂度

Overfitting：Large Variance：over说明模型过渡复杂了

5、我怎么知道我模型是bias很大（Underfitting）？

不能满足training data：If your model cannot even fit the training examples, then you have large bias

6、我怎么知道我模型是variance很大（Overfitting）？

不能满足testing data：If you can fit the training data, but large error on testing data, then you probably have large variance

7、如果我模型的bias很大（Underfitting），我应该怎么做？

重新设计模型：比如考虑更多参数

更多数据没用：因为你的模型本身就不好，所以更多数据其实是没用的

8、如果我模型的variance很大（Overfitting），我应该怎么做？

More data：增加数据：Very effective, but not always practical

Regularization：平滑化：没用更多数据的情况：可能伤害bias

9、我们怎样选择模型？

相互转换：There is usually a trade-off between bias and variance.

相当于和更小：Select a model that balances two kinds of error to minimize total error

10、我们选择好了模型之后，用自己的测试数据测试之后，外部的测试数据测试的结果一般会比我们的测试结果大么？

一般都会比我们的测试结果大

11、我们应该如何验证我们的模型？

数据分多份：测试数据1，模型完了之后再用； 测试数据2，选模型的时候再用； 数据3，构建模型的时候用

一定留一份data做 private data，模拟实际用户使用的时候的情况

二、内容在总结中

李宏毅机器学习课程---3、Where does the error come from的更多相关文章

随机推荐

热门专题

variance：比如打靶，你的实际打靶的位置偏离你的瞄准点的距离：相当于方差

数据分多份：测试数据1，模型完了之后再用；测试数据2，选模型的时候再用；数据3，构建模型的时候用