李宏毅机器学习课程---3、Where does the error come from

一、总结

一句话总结:机器学习的模型中error的来源是什么

bias:比如打靶,你的瞄准点离准心的偏移
variance:比如打靶,你的实际打靶的位置 偏离你的瞄准点的距离:相当于方差

1、机器学习中为什么需要判断error的来源?

有的放矢,改进模型:因为你的模型出错,你肯定需要改进模型,知道错误来源后才方便改进模型

2、做多次实验,一次函数和多次函数的函数在图上如何分布?

多次函数在多次实验中分布的线比较开

3、简单model和复杂model,bias和variance的大小情况如何?

简单模型:Large Bias,Small Variance
复杂模型:Small Bias,Large Variance

4、bias和variance分别很大的时候叫什么?

Underfitting:Large Bias:under说明小了,还要继续提升模型复杂度
Overfitting:Large Variance:over说明模型过渡复杂了

5、我怎么知道我模型是bias很大(Underfitting)?

不能满足training data:If your model cannot even fit the training examples, then you have large bias

6、我怎么知道我模型是variance很大(Overfitting)?

不能满足testing data:If you can fit the training data, but large error on testing data, then you probably have large variance

7、如果我模型的bias很大(Underfitting),我应该怎么做?

重新设计模型:比如考虑更多参数
更多数据没用:因为你的模型本身就不好,所以更多数据其实是没用的

For bias, redesign your model:
• Add more features as input
• A more complex model

8、如果我模型的variance很大(Overfitting),我应该怎么做?

More data:增加数据:Very effective, but not always practical
Regularization:平滑化:没用更多数据的情况:可能伤害bias

9、我们怎样选择模型?

相互转换:There is usually a trade-off between bias and variance.
相当于和更小:Select a model that balances two kinds of error to minimize total error

10、我们选择好了模型之后,用自己的测试数据测试之后,外部的测试数据测试的结果一般会比我们的测试结果大么?

一般都会比我们的测试结果大

11、我们应该如何验证我们的模型?

数据分多份:测试数据1,模型完了之后再用; 测试数据2,选模型的时候再用; 数据3,构建模型的时候用
一定留一份data做 private data,模拟实际用户使用的时候的情况

二、内容在总结中

 

李宏毅机器学习课程---3、Where does the error come from的更多相关文章

  1. 李宏毅机器学习课程---2、Regression - Case Study

    李宏毅机器学习课程---2.Regression - Case Study 一.总结 一句话总结: 分类讨论可能是比较好的找最佳函数的方法:如果 有这样的因素存在的话 模型不够好,可能是因素没有找全 ...

  2. 李宏毅机器学习课程---4、Gradient Descent (如何优化 )

    李宏毅机器学习课程---4.Gradient Descent (如何优化) 一.总结 一句话总结: 调整learning rates:Tuning your learning rates 随机Grad ...

  3. 李宏毅机器学习课程笔记-2.5线性回归Python实战

    本文为作者学习李宏毅机器学习课程时参照样例完成homework1的记录. 任务描述(Task Description) 现在有某地空气质量的观测数据,请使用线性回归拟合数据,预测PM2.5. 数据集描 ...

  4. 李宏毅机器学习笔记1:Regression、Error

    李宏毅老师的机器学习课程和吴恩达老师的机器学习课程都是都是ML和DL非常好的入门资料,在YouTube.网易云课堂.B站都能观看到相应的课程视频,接下来这一系列的博客我都将记录老师上课的笔记以及自己对 ...

  5. Coursera台大机器学习课程笔记7 -- Noise and Error

    本章重点:  简单的论证了即使有Noise,机器依然可以学习,VC Dimension对泛化依然起作用:介绍了一些评价Model效果的Error Measurement方法. 一论证即使有Noisy, ...

  6. 李宏毅老师机器学习课程笔记_ML Lecture 2: Where does the error come from?

    引言: 最近开始学习"机器学习",早就听说祖国宝岛的李宏毅老师的大名,一直没有时间看他的系列课程.今天听了一课,感觉非常棒,通俗易懂,而又能够抓住重点,中间还能加上一些很有趣的例子 ...

  7. 李宏毅老师机器学习课程笔记_ML Lecture 1: ML Lecture 1: Regression - Demo

    引言: 最近开始学习"机器学习",早就听说祖国宝岛的李宏毅老师的大名,一直没有时间看他的系列课程.今天听了一课,感觉非常棒,通俗易懂,而又能够抓住重点,中间还能加上一些很有趣的例子 ...

  8. 李宏毅老师机器学习课程笔记_ML Lecture 1: 回归案例研究

    引言: 最近开始学习"机器学习",早就听说祖国宝岛的李宏毅老师的大名,一直没有时间看他的系列课程.今天听了一课,感觉非常棒,通俗易懂,而又能够抓住重点,中间还能加上一些很有趣的例子 ...

  9. 李宏毅老师机器学习课程笔记_ML Lecture 0-2: Why we need to learn machine learning?

    引言: 最近开始学习"机器学习",早就听说祖国宝岛的李宏毅老师的大名,一直没有时间看他的系列课程.今天听了一课,感觉非常棒,通俗易懂,而又能够抓住重点,中间还能加上一些很有趣的例子 ...

随机推荐

  1. hbase-2.0.4集群部署

    hbase-2.0.4集群部署 1. 集群节点规划: rzx1 HMaster,HRegionServer rzx2 HRegionServer rzx3 HRegionServer 前提:搭建好ha ...

  2. docker核心组件(6)

    Docker 的核心组件包括: Docker 客户端 - Client Docker 服务器 - Docker daemon Docker 镜像 - Image Registry Docker 容器 ...

  3. cgroup & oom-killer 简介

    cgroup内存限制 memory.failcnt memory.limit_in_bytes memory.usage_in_bytes memory.max_usage_in_bytes memo ...

  4. mongo分组查询(转)

    1. 多字段分组 {"$group":{"_id": {"state": "$state", "city&qu ...

  5. BZOJ 2460 & 洛谷 P4570 [BJWC2011]元素 (线性基 贪心)

    题目链接: 洛谷 BZOJ 题意 给定 \(n\) 个矿石,每个矿石有编号和魔力值两种属性,选择一些矿石,使得魔力值最大且编号的异或和不为 0. 思路 线性基 贪心 根据矿石的魔力值从大到小排序. 线 ...

  6. leetcode-1053. 交换一次的先前排列

      题目描述: 给你一个正整数的数组 A(其中的元素不一定完全不同),请你返回可在 一次交换(交换两数字 A[i]和 A[j] 的位置)后得到的.按字典序排列小于 A 的最大可能排列. 如果无法这么操 ...

  7. Python 操作excel常见异常

    一.使用xlrd模块读取excel: 1.报错:IndexError: list index out of range,如下图 解决方法:reading_sheet.cell(1,0).value中c ...

  8. HTML5篇

    [HTML5十大新特性] (1) 语义化标签 (2) 增强型表单 (3) 视频和音频 (4) canvas绘图 (5) SVG绘图 (6) 地理定位 (7) 拖放API (8) Web Worker ...

  9. XVIII Open Cup named after E.V. Pankratiev Stage 5: Eastern Grand Prix

    contest link easy: EI medium-easy: BCDGK medium: L medium-hard: AFH A. Artifacts B. Brackets and Dot ...

  10. Windows平台将远程服务器的目录挂载为本地磁盘

    我们在设置数据库自动备份时,为了数据的安全往往需要直接将数据备份到远程服务器上.在Linux可以通过NFS挂载来实现,在Windows平台可以直接通过net use+subst来实现将远程服务器的目录 ...