参考：https://blog.csdn.net/red_stone1/article/details/78519599

1. 正交化(Orthogonalization)

机器学习中有许多参数、超参数需要调试。

通过每次只调试一个参数，保持其它参数不变而得到的模型某一性能改变是一种最常用的调参策略，我们称之为正交化方法（Orthogonalization）。

对应到机器学习监督式学习模型中，可以大致分成四个独立的“功能”：

Fit training set well on cost function
- 优化训练集可以通过使用更复杂NN，使用Adam等优化算法来实现
Fit dev set well on cost function
- 优化验证集可以通过正则化，采用更多训练样本来实现
Fit test set well on cost function
- 优化测试集可以通过使用更多的验证集样本来实现
Performs well in real world
- 提升实际应用模型可以通过更换验证集，使用新的cost function来实现

这些调节方法只会对应一个“功能”，是正交的。

2. 单一数字评估指标(Single number evaluation metric)

构建、优化机器学习模型时，单值评价指标非常必要。有了量化的单值评价指标后，我们就能根据这一指标比较不同超参数对应的模型的优劣，从而选择最优的那个模型。

精确率( precision)：反映了模型判定的正例中真正正例的比重。
- 在垃圾短信分类器中，是指预测出的垃圾短信中真正垃圾短信的比例。
- $precison = \frac{TP}{TP+FP}$
召回率{ recall)：反映了总正例中被模型正确判定正例的比重。
- 医学领域也叫做灵敏度( sensitivity)。在垃圾短信分类器中,指所有真的垃圾短信被分类器正确找出来的比例。
- $recall = \frac{TP}{P}$
F值 ☆☆☆
- F 值 ($F_\beta-score$) 是精确率和召回率的调和平均：
  - $F_\beta-score=\frac{(1+\beta^2)*precison*recall}{(\beta^2*precision+recall)}$
  - $\beta一般大于0。当\beta=1时，退化为 F1$，即 $F_1=\frac{2\cdot P\cdot R}{P+R}$
  - $F_1$ 是最常用的评价指标，即表示二者同等重要
例，有A和B两个模型，它们的准确率（Precision）和召回率（Recall）分别如下：

Classifier	Precision	Recall
A	95%	90%
B	98%	85%

然后得到了A和B模型各自的F1 Score：

Classifier	Precision	Recall	F1 Score
A	95%	90%	92.4%
B	98%	85%	91.0%

从F1 Score来看，A模型比B模型更好一些。通过引入单值评价指标F1 Score，很方便对不同模型进行比较。

3. 满足和优化指标(Satisficing and Optimizing metic)

有时候，要把所有的性能指标都综合在一起，构成单值评价指标是比较困难的。

解决办法是，我们可以把某些性能作为优化指标（Optimizing metic），寻求最优化值
而某些性能作为满意指标（Satisficing metic），只要满足阈值就行了

例，有A，B，C三个模型，各个模型的Accuracy和Running time如下：

我们可以将Accuracy作为优化指标（Optimizing metic），将Running time作为满意指标（Satisficing metic）

给Running time设定一个阈值，在其满足阈值的情况下，选择Accuracy最大的模型。如果设定Running time必须在100ms以内，显然，模型C不满足阈值条件，首先剔除；模型B相比较模型A而言，Accuracy更高。

4. Train/dev/test distributions

应该尽量保证dev sets和test sets来源于同一分布且都反映了实际样本的情况。

如果dev sets和test sets不来自同一分布，那么我们从dev sets上选择的“最佳”模型往往不能够在test sets上表现得很好。

5. Size of the dev and test sets

当样本数量不多（小于一万）的时候，通常将Train/dev/test sets的比例设为60%/20%/20%，在没有dev sets的情况下，Train/test sets的比例设为70%/30%。
当样本数量很大（百万级别）的时候，通常将相应的比例设为98%/1%/1%或99%/1%。
对于dev sets数量的设置，遵循的准则是通过dev sets能够评价不同模型，以便选择出更好的模型。
对于test sets数量的设置，遵循的准则是通过test sets能够反映出模型在实际中的表现。

6. When to change dev/test sets and metrics

算法模型的评价标准：有时候需要根据实际情况进行动态调整，目的是让算法模型在实际应用中有更好的效果。

如，识别猫类的例子。初始的评价标准是错误率，算法A错误率为3%，算法B错误率为5%。
显然，A更好一些。但是，实际使用时发现算法A会通过一些色情图片，但是B没有出现这种情况。B可能对用户更好一点。
这时候，我们就需要改变之前单纯只是使用错误率作为评价标准，而考虑新的情况进行改变。例如增加色情图片的权重。

原来的cost function：

\[J=\frac1m\sum_{i=1}^mL(\hat y^{(i)},y^{(i)})
\]

更改评价标准后的cost function：

\[J=\frac{1}{w^{(i)}}\sum_{i=1}^mw^{(i)}L(\hat y^{(i)},y^{(i)}) \\
w^{(i)}=\begin{cases}
1, & x^{(i)}\ is\ non-porn\\
10, & x^{(i)}\ is\ porn
\end{cases}
\]

机器学习可分为两个过程：

Define a metric（度量标准） to evaluate classifiers
How to do well on this metric

总结：

7. Why human-level performance

8. 可避免误差(Avoidable bias)

贝叶斯误差（对贝叶斯误差的估计）和 Training Error 之间的差值 -- 可避免误差：误差有个无法超越的最低水平
Training error 和 Dev error之间的差值，大概说明你的算法在方差问题上还有多少改善空间

如图，右边可避免误差在0.5%，2%是方差的指标（应该专注它）; 左边7%为可避免偏差大小（应该专注于它），2%方差大小；

9. Understanding human-level performance

10. 改善模型表现

Coursera Deep Learning笔记结构化机器学习项目（上）的更多相关文章

Coursera Deep Learning笔记结构化机器学习项目（下）
参考:https://blog.csdn.net/red_stone1/article/details/78600255https://blog.csdn.net/red_stone1/article ...
Deeplearning.ai课程笔记-结构化机器学习项目
目录一. 正交化二. 指标 1. 单一数字评估指标 2. 优化指标.满足指标三. 训练集.验证集.测试集 1. 数据集划分 2. 验证集.测试集分布 3. 验证集.测试集大小四. 比较人类表现 ...
DeepLearning.ai学习笔记（三）结构化机器学习项目--week2机器学习策略(2)
一.进行误差分析很多时候我们发现训练出来的模型有误差后,就会一股脑的想着法子去减少误差.想法固然好,但是有点headlong~ 这节视频中吴大大介绍了一个比较科学的方法,具体的看下面的例子还是以猫 ...
吴恩达《深度学习》-课后测验-第三门课结构化机器学习项目（Structuring Machine Learning Projects）-Week1 Bird recognition in the city of Peacetopia (case study)( 和平之城中的鸟类识别(案例研究))
Week1 Bird recognition in the city of Peacetopia (case study)( 和平之城中的鸟类识别(案例研究)) 1.Problem Statement ...
Coursera Deep Learning笔记逻辑回归典型的训练过程
Deep Learning 用逻辑回归训练图片的典型步骤. 笔记摘自:https://xienaoban.github.io/posts/59595.html 1. 处理数据 1.1 向量化(Vect ...
Deep Learning.ai学习笔记_第三门课_结构化机器学习项目
目录第一周机器学习策略(1) 第二周机器学习策略(2) 目标:学习一些机器学习优化改进策略,使得搭建的学习模型能够朝着最有希望的方向前进. 第一周机器学习策略(1) 搭建机器学习系统的挑战:尝 ...
吴恩达《深度学习》-第三门课结构化机器学习项目（Structuring Machine Learning Projects）-第一周机器学习（ML）策略（1）（ML strategy（1））-课程笔记
第一周机器学习(ML)策略(1)(ML strategy(1)) 1.1 为什么是 ML 策略?(Why ML Strategy?) 希望在这门课程中,可以教给一些策略,一些分析机器学习问题的方法, ...
DeepLearning.ai学习笔记（三）结构化机器学习项目--week1 机器学习策略
一.为什么是ML策略如上图示,假如我们在构建一个喵咪分类器,数据集就是上面几个图,训练之后准确率达到90%.虽然看起来挺高的,但是这显然并不具一般性,因为数据集太少了.那么此时可以想到的ML策略有哪 ...
Coursera Deep Learning笔记深度卷积网络
参考 1. Why look at case studies 介绍几个典型的CNN案例: LeNet-5 AlexNet VGG Residual Network(ResNet): 特点是可以构建很深 ...

随机推荐

Raid（0/1/5/10）
一.Raid需要的硬盘数量 1.raid 0: 最少1块硬盘(但是1块盘没有意义,至少2块才有实际意义) 2.raid 1: 最少2块硬盘 3.raid 5: 最少3块硬盘 4 ...
Tricks
由于本人着实有些菜,因此在此积累一些巧妙的 $Tricks$ ,以备不时之需... 与其说是 $Tricks$ 不如说是学习笔记?? 数学组合数常见的数列斐波那契数列图论树论 \(P ...
python3 爬虫五大模块之五：信息采集器
Python的爬虫框架主要可以分为以下五个部分: 爬虫调度器:用于各个模块之间的通信,可以理解为爬虫的入口与核心(main函数),爬虫的执行策略在此模块进行定义: URL管理器:负责URL的管理,包括 ...
Winform EF CodeFist方式连接数据库
直接生成ado.net 实体数据模型挺方便的,但只有一步步的手写代码才能更好的理解EF,在学习asp.net core过程中手写代码已经明白了怎么回事,但实现过程有些麻烦不知道如何记录,但Winfor ...
CSS003. 盒子水平垂直居中简写属性（place-items）
place-items CSS 中的 place-items 是一个简写属性 ,它允许你在相关的布局(如 Grid 或 Flexbox)中可以同时沿着块级和内联方向对齐元素 (例如:align-it ...
小狐狸钱包怎么使用？MetaMask(小狐狸) 使用教程 - 如何添加BSC链、Heco链
MetaMask介绍 MetaMask是一款在谷歌浏览器Chrome上使用的插件类型的以太坊钱包,只需要在谷歌浏览器添加对应的扩展程序即可使用. 1.Download & Install: 官 ...
截断误差VS舍入误差
截断误差:是指计算某个算式时没有精确的计算结果,如积分计算,无穷级数计算等,使用极限的形式表达的,显然我们只能截取有限项进行计算,此时必定会有误差存在,这就是截断误差. 舍入误差:是指由于计算机表示 ...
jquery监听动态添加的input的change事件
使用下面方法在监听普通的input的change事件正常 $('#pp').on('change', 'input.videos_poster_input', function () { consol ...
php发送邮件方法-亲测可用,email.class.php过期解决办法
php虽然提供了mail()函数,但并不好用,而PHPMailer是一个不错的邮件发送工具,使用起来也是非常简单!使用PHPMailer发送邮件: <?php header("cont ...
hashCode 和 equals 的区别
今天记录一下hashCode的知识,以前都没有怎么接触过的,感觉还是很陌生,专门去学习了一下首先我最大的问题就是hashCode究竟是干什么的,现在也一知半解了吧, 哈希值是一个对象的地址值,是一 ...

Coursera Deep Learning笔记 结构化机器学习项目 （上）

1. 正交化(Orthogonalization)

2. 单一数字评估指标(Single number evaluation metric)

3. 满足和优化指标(Satisficing and Optimizing metic)

4. Train/dev/test distributions

5. Size of the dev and test sets

6. When to change dev/test sets and metrics

7. Why human-level performance

8. 可避免误差(Avoidable bias)

9. Understanding human-level performance

9. Understanding human-level performance

10. 改善模型表现

Coursera Deep Learning笔记 结构化机器学习项目 （上）的更多相关文章

随机推荐

热门专题

Coursera Deep Learning笔记结构化机器学习项目（上）

Coursera Deep Learning笔记结构化机器学习项目（上）的更多相关文章