<Machine Learning - 李宏毅> 学习笔记

b站视频地址：李宏毅2019国语

第一章机器学习介绍

Hand crafted rules
Machine learning ≈ looking for a function from data
- Speech recognition
- Image recognition
- Playing go
- Dialogue system
Framework
1. define a set of function
2. goodness of function
3. pick the best function
Supervised Learning 监督学习
- Regression
  - Linear model
  - Non-Linear model
- Classification
  - Binary Classification
  - Multi-class Classification
Semi-supervised Learning 半监督学习
- Unlabel
Transfer Learning 迁移学习
- Data not related to the task considered
Unsupervised Learning 无监督学习
Structured Learning 监督学习中的结构化学习
- 输出有结构性
Reinforcement Learning 强化学习
- 没有答案，只有一个分数来判断行为好坏
- 当没有data的时候才会选择去做reinforcement learning.

第二章为什么要学习机器学习

不同model，loss function损失函数解决不同问题
不一定能找出best function
需要有经验
（loss function：通过最小化损失函数求解和评估模型 -参数估计/风险管理/最优控制理论）

第三章回归 Regression

定义
- find a function
- Input：feature X
- Output：Scalar y
步骤
- step1：模型假设，选择模型框架（Linear/Non-Linear）
- step2：模型评估，如何判断众多模型的好坏（损失函数）
- step3：模型优化，如何筛选最优的模型（梯度下降Gradient Descent）
learning rate 学习率
- 权重参数移动步长
- 设置不同的learning rate加强拟合速度 - 动态赋值
梯度Gradient：loss function对每个参数偏导排成的向量
梯度下降Gradient Descent：即更新参数的方式
- 新参数=原参数-学习率×原参数梯度
- 向量广播
梯度下降实现的挑战
- 问题1：当前最优（Stuck at local minima） - 局部最优点
- 问题2：等于0（Stuck at saddle point） - 一阶导为零的非极值点
- 问题3：趋近于0（Very slow at the plateau） - 导数极小
- 如果Loss Function是Convex（凸函数）- Gradient Descent找到的就是全局最优点
Overfitting过拟合
- 当特征越多，输入越多，数据量没有增加，可能就会导致Overfitting
- 过拟合：偏差小方差大 - 欠拟合：偏差大
- bias（偏差）影响loss function的上下 - variance（方差）影响loss function的曲平
步骤优化
- step1：种类特征那个输入优化
  - 类别特征通过δ函数合并优化输入 - 通常是做独热码one-hot
- step2：更多参数，更多输入
  - 特征与数据量的均衡，特征过多导致Overfitting过拟合
- step3：Regularization正则化
  - 更多特征，会造成某些特征权重w过大，导致过拟合，于此引入正则化 - 正则化影响loss function平滑度，所以与方差/过拟合相关
  - Regularization的一种简单方式就是在Loss Function中加入正则项λΣ(wi)₂ - 使w更小，因为越小的w曲线越平滑,即对变化越不敏感
  - 不敏感让loss function受高权重和噪音的影响小，降低过拟合风险
  - 超参数正则系数λ也不能过大 - 导致bias变大，欠拟合，过于平滑

小结

Gradient Descent梯度下降的做法
Overfitting和Regularization的表象

第五章误差从哪里来

Error = Variance + Bias
Bias偏差
- Bias = 真实值与输出期望之间误差 - 模型越简单，bias越高
- Bias大，即模型欠拟合Underfitting，解决办法一般是优化模型，增加更多特征
- 当Bias=0，即期望=真实值时，就是unbias无偏估计
Variance方差
- Variance = 模型输出值与输出期望之间的误差 - 模型越复杂，variance越高
- Variance大，即模型过拟合Overfitting，解决办法一般是增加训练数据量或者Regularization
- 方差 - 数据分布离散程度

<Machine Learning - 李宏毅> 学习笔记的更多相关文章

js学习笔记：webpack基础入门（一）
之前听说过webpack,今天想正式的接触一下,先跟着webpack的官方用户指南走: 在这里有: 如何安装webpack 如何使用webpack 如何使用loader 如何使用webpack的开发者 ...
PHP-自定义模板-学习笔记
1. 开始这几天,看了李炎恢老师的<PHP第二季度视频>中的“章节7:创建TPL自定义模板”,做一个学习笔记,通过绘制架构图.UML类图和思维导图,来对加深理解. 2. 整体架构图 ...
PHP-会员登录与注册例子解析-学习笔记
1.开始最近开始学习李炎恢老师的<PHP第二季度视频>中的“章节5:使用OOP注册会员”,做一个学习笔记,通过绘制基本页面流程和UML类图,来对加深理解. 2.基本页面流程 3.通过UM ...
2014年暑假c#学习笔记目录
2014年暑假c#学习笔记一.C#编程基础 1. c#编程基础之枚举 2. c#编程基础之函数可变参数 3. c#编程基础之字符串基础 4. c#编程基础之字符串函数 5.c#编程基础之ref.ou ...
JAVA GUI编程学习笔记目录
2014年暑假JAVA GUI编程学习笔记目录 1.JAVA之GUI编程概述 2.JAVA之GUI编程布局 3.JAVA之GUI编程Frame窗口 4.JAVA之GUI编程事件监听机制 5.JAVA之 ...
seaJs学习笔记2 – seaJs组建库的使用
原文地址:seaJs学习笔记2 – seaJs组建库的使用我觉得学习新东西并不是会使用它就够了的,会使用仅仅代表你看懂了,理解了,二不代表你深入了,彻悟了它的精髓. 所以不断的学习将是源源不断. 最 ...
CSS学习笔记
CSS学习笔记 2016年12月15日整理 CSS基础 Chapter1 在console输入escape("宋体") ENTER 就会出现unicode编码显示"%u ...
HTML学习笔记
HTML学习笔记 2016年12月15日整理 Chapter1 URL(scheme://host.domain:port/path/filename) scheme: 定义因特网服务的类型,常见的为 ...
DirectX Graphics Infrastructure(DXGI):最佳范例学习笔记
今天要学习的这篇文章写的算是比较早的了,大概在DX11时代就写好了,当时龙书11版看得很潦草,并没有注意这篇文章,现在看12,觉得是跳不过去的一篇文章,地址如下: https://msdn.micro ...
ucos实时操作系统学习笔记——任务间通信（消息）
ucos另一种任务间通信的机制是消息(mbox),个人感觉是它是queue中只有一个信息的特殊情况,从代码中可以很清楚的看到,因为之前有关于queue的学习笔记,所以一并讲一下mbox.为什么有了qu ...

随机推荐

C#使用Oxyplot绘制监控界面
C#中可选的绘图工具有很多,除了Oxyplot还有DynamicDataDisplay(已经改名为InteractiveDataDisplay)等等.不过由于笔者这里存在一些环境上的特殊要求,.Net ...
Anaconda基本认识
Anaconda Distribution是执行Python数据科学和机器学习最简单的方法. 它包括250多种流行的数据科学软件包,以及适用于Windows,Linux和MacOS的conda软件包和 ...
java架构之路-（分布式zookeeper）zookeeper集群配置和选举机制详解
上次博客我们说了一下zookeeper的配置文件,以及命令的使用https://www.cnblogs.com/cxiaocai/p/11597465.html.我们这次来说一下我们的zookeepe ...
阿里云服务器CentOS6.9安装Mysql
上篇讲了CentOS6.9安装tomcat,这篇来讲mysql的安装 1.查看CentOS是否安装了MySQL yum list installed | grep mysql //查看CentOS是否 ...
挑战程序设计——迷宫的最短路径（BFS）
题目详情 Description 给定一个大小为 N * M 的迷宫.迷宫由通道和墙壁组成,每一步可以向邻接的上下左右四格的通道移动.请求出从起点到终点所需的最小步数限制条件: N,M <= ...
编程小技巧之 Linux 文本处理命令
合格的程序员都善于使用工具,正所谓君子性非异也,善假于物也.合理的利用 Linux 的命令行工具,可以提高我们的工作效率. 本文简单的介绍三个能使用 Linux 文本处理命令的场景,给大家开阔一下思路 ...
Akka实现WordCount(Scala)
Akka实现WordCount(Scala): 架构图: 项目结构: pom.xml <project xmlns="http://maven.apache.org/POM/4.0.0 ...
MongoDB 学习笔记之分片和副本集混合运用
分片和副本集混合运用: 基本架构图: 搭建详细配置: 3个shard + 3个replicat set + 3个configserver + 3个Mongos shardrsname Primary ...
链表二：链表中倒数第k个结点
题目:链表中倒数第k个结点描述:输入一个链表,输出该链表中倒数第k个结点.解决方案:思路: 根据规律得出倒数第k个节点是 n-k+1个节点方法一:先计算出链表的长度,在循环走到n-k+1步.(相当于 ...
goLang 纳秒转毫秒转英文时间格式
package main import ( "fmt" "time" ) func main(){ fmt.Println(time.Now().Unix()) ...

<Machine Learning - 李宏毅> 学习笔记

<Machine Learning - 李宏毅> 学习笔记

第一章 机器学习介绍

第二章 为什么要学习机器学习

第三章 回归 Regression

小结

第五章 误差从哪里来

<Machine Learning - 李宏毅> 学习笔记的更多相关文章

随机推荐

热门专题

第一章机器学习介绍

第二章为什么要学习机器学习

第三章回归 Regression

第五章误差从哪里来