参考：https://blog.csdn.net/red_stone1/article/details/78519599

1. 正交化(Orthogonalization)

机器学习中有许多参数、超参数需要调试。

通过每次只调试一个参数，保持其它参数不变而得到的模型某一性能改变是一种最常用的调参策略，我们称之为正交化方法（Orthogonalization）。

对应到机器学习监督式学习模型中，可以大致分成四个独立的“功能”：

Fit training set well on cost function
- 优化训练集可以通过使用更复杂NN，使用Adam等优化算法来实现
Fit dev set well on cost function
- 优化验证集可以通过正则化，采用更多训练样本来实现
Fit test set well on cost function
- 优化测试集可以通过使用更多的验证集样本来实现
Performs well in real world
- 提升实际应用模型可以通过更换验证集，使用新的cost function来实现

这些调节方法只会对应一个“功能”，是正交的。

2. 单一数字评估指标(Single number evaluation metric)

构建、优化机器学习模型时，单值评价指标非常必要。有了量化的单值评价指标后，我们就能根据这一指标比较不同超参数对应的模型的优劣，从而选择最优的那个模型。

精确率( precision)：反映了模型判定的正例中真正正例的比重。
- 在垃圾短信分类器中，是指预测出的垃圾短信中真正垃圾短信的比例。
- \(precison = \frac{TP}{TP+FP}\)
召回率{ recall)：反映了总正例中被模型正确判定正例的比重。
- 医学领域也叫做灵敏度( sensitivity)。在垃圾短信分类器中,指所有真的垃圾短信被分类器正确找出来的比例。
- \(recall = \frac{TP}{P}\)
F值 ☆☆☆
- F 值 (\(F_\beta-score\)) 是精确率和召回率的调和平均：
  - \(F_\beta-score=\frac{(1+\beta^2)*precison*recall}{(\beta^2*precision+recall)}\)
  - \(\beta一般大于0。当\beta=1时，退化为 F1\)，即 \(F_1=\frac{2\cdot P\cdot R}{P+R}\)
  - \(F_1\) 是最常用的评价指标，即表示二者同等重要
例，有A和B两个模型，它们的准确率（Precision）和召回率（Recall）分别如下：

Classifier	Precision	Recall
A	95%	90%
B	98%	85%

然后得到了A和B模型各自的F1 Score：

Classifier	Precision	Recall	F1 Score
A	95%	90%	92.4%
B	98%	85%	91.0%

从F1 Score来看，A模型比B模型更好一些。通过引入单值评价指标F1 Score，很方便对不同模型进行比较。

3. 满足和优化指标(Satisficing and Optimizing metic)

有时候，要把所有的性能指标都综合在一起，构成单值评价指标是比较困难的。

解决办法是，我们可以把某些性能作为优化指标（Optimizing metic），寻求最优化值
而某些性能作为满意指标（Satisficing metic），只要满足阈值就行了

例，有A，B，C三个模型，各个模型的Accuracy和Running time如下：

我们可以将Accuracy作为优化指标（Optimizing metic），将Running time作为满意指标（Satisficing metic）

给Running time设定一个阈值，在其满足阈值的情况下，选择Accuracy最大的模型。如果设定Running time必须在100ms以内，显然，模型C不满足阈值条件，首先剔除；模型B相比较模型A而言，Accuracy更高。

4. Train/dev/test distributions

应该尽量保证dev sets和test sets来源于同一分布且都反映了实际样本的情况。

如果dev sets和test sets不来自同一分布，那么我们从dev sets上选择的“最佳”模型往往不能够在test sets上表现得很好。

5. Size of the dev and test sets

当样本数量不多（小于一万）的时候，通常将Train/dev/test sets的比例设为60%/20%/20%，在没有dev sets的情况下，Train/test sets的比例设为70%/30%。
当样本数量很大（百万级别）的时候，通常将相应的比例设为98%/1%/1%或99%/1%。
对于dev sets数量的设置，遵循的准则是通过dev sets能够评价不同模型，以便选择出更好的模型。
对于test sets数量的设置，遵循的准则是通过test sets能够反映出模型在实际中的表现。

6. When to change dev/test sets and metrics

算法模型的评价标准：有时候需要根据实际情况进行动态调整，目的是让算法模型在实际应用中有更好的效果。

如，识别猫类的例子。初始的评价标准是错误率，算法A错误率为3%，算法B错误率为5%。
显然，A更好一些。但是，实际使用时发现算法A会通过一些色情图片，但是B没有出现这种情况。B可能对用户更好一点。
这时候，我们就需要改变之前单纯只是使用错误率作为评价标准，而考虑新的情况进行改变。例如增加色情图片的权重。

原来的cost function：

\[J=\frac1m\sum_{i=1}^mL(\hat y^{(i)},y^{(i)})
\]

更改评价标准后的cost function：

\[J=\frac{1}{w^{(i)}}\sum_{i=1}^mw^{(i)}L(\hat y^{(i)},y^{(i)}) \\
w^{(i)}=\begin{cases}
1, & x^{(i)}\ is\ non-porn\\
10, & x^{(i)}\ is\ porn
\end{cases}
\]

机器学习可分为两个过程：

Define a metric（度量标准） to evaluate classifiers
How to do well on this metric

总结：

7. Why human-level performance

8. 可避免误差(Avoidable bias)

贝叶斯误差（对贝叶斯误差的估计）和 Training Error 之间的差值 -- 可避免误差：误差有个无法超越的最低水平
Training error 和 Dev error之间的差值，大概说明你的算法在方差问题上还有多少改善空间

如图，右边可避免误差在0.5%，2%是方差的指标（应该专注它）; 左边7%为可避免偏差大小（应该专注于它），2%方差大小；

9. Understanding human-level performance

10. 改善模型表现

Coursera Deep Learning笔记结构化机器学习项目（上）的更多相关文章

Coursera Deep Learning笔记结构化机器学习项目（下）
参考:https://blog.csdn.net/red_stone1/article/details/78600255https://blog.csdn.net/red_stone1/article ...
Deeplearning.ai课程笔记-结构化机器学习项目
目录一. 正交化二. 指标 1. 单一数字评估指标 2. 优化指标.满足指标三. 训练集.验证集.测试集 1. 数据集划分 2. 验证集.测试集分布 3. 验证集.测试集大小四. 比较人类表现 ...
DeepLearning.ai学习笔记（三）结构化机器学习项目--week2机器学习策略(2)
一.进行误差分析很多时候我们发现训练出来的模型有误差后,就会一股脑的想着法子去减少误差.想法固然好,但是有点headlong~ 这节视频中吴大大介绍了一个比较科学的方法,具体的看下面的例子还是以猫 ...
吴恩达《深度学习》-课后测验-第三门课结构化机器学习项目（Structuring Machine Learning Projects）-Week1 Bird recognition in the city of Peacetopia (case study)( 和平之城中的鸟类识别(案例研究))
Week1 Bird recognition in the city of Peacetopia (case study)( 和平之城中的鸟类识别(案例研究)) 1.Problem Statement ...
Coursera Deep Learning笔记逻辑回归典型的训练过程
Deep Learning 用逻辑回归训练图片的典型步骤. 笔记摘自:https://xienaoban.github.io/posts/59595.html 1. 处理数据 1.1 向量化(Vect ...
Deep Learning.ai学习笔记_第三门课_结构化机器学习项目
目录第一周机器学习策略(1) 第二周机器学习策略(2) 目标:学习一些机器学习优化改进策略,使得搭建的学习模型能够朝着最有希望的方向前进. 第一周机器学习策略(1) 搭建机器学习系统的挑战:尝 ...
吴恩达《深度学习》-第三门课结构化机器学习项目（Structuring Machine Learning Projects）-第一周机器学习（ML）策略（1）（ML strategy（1））-课程笔记
第一周机器学习(ML)策略(1)(ML strategy(1)) 1.1 为什么是 ML 策略?(Why ML Strategy?) 希望在这门课程中,可以教给一些策略,一些分析机器学习问题的方法, ...
DeepLearning.ai学习笔记（三）结构化机器学习项目--week1 机器学习策略
一.为什么是ML策略如上图示,假如我们在构建一个喵咪分类器,数据集就是上面几个图,训练之后准确率达到90%.虽然看起来挺高的,但是这显然并不具一般性,因为数据集太少了.那么此时可以想到的ML策略有哪 ...
Coursera Deep Learning笔记深度卷积网络
参考 1. Why look at case studies 介绍几个典型的CNN案例: LeNet-5 AlexNet VGG Residual Network(ResNet): 特点是可以构建很深 ...

随机推荐

shell运算方式
1.(())--整数运算 [root@m01 /server/scripts]# a=1 [root@m01 /server/scripts]# b=2 [root@m01 /server/scrip ...
Apache Hudi内核之文件标记机制深入解析
1. 摘要 Hudi 支持在写入时自动清理未成功提交的数据.Apache Hudi 在写入时引入标记机制来有效跟踪写入存储的数据文件. 在本博客中,我们将深入探讨现有直接标记文件机制的设计,并解释了其 ...
什么是内存屏障？ Why Memory Barriers ?
要了解如何使用memory barrier,最好的方法是明白它为什么存在.CPU硬件设计为了提高指令的执行速度,增设了两个缓冲区(store buffer, invalidate que ...
了解HTTP基本知识板块
一.HTTP 协议概述 HTTP协议采用了请求/响座模型. 客户端向服务器发送-个请求,请求头包含请求的方法.URT..协议版本.以以及包含请求修饰符.客户信息和内容的类似于MIME的消息结构. 服 ...
CodeForce-807C Success Rate(二分数学)
Success Rate CodeForces - 807C 给你4个数字 x y p q ,要求让你求最小的非负整数b,使得 (x+a)/(y+b)==p/q,同时a为一个整数且0<=a< ...
adobe media encoder cc 2018无法打开,报错0xc0000005
在我这里是因为显卡的原因下载NVIDIA然后打开NVIDIA控制面板,在里面选择软件的显卡,挨个试就行, 还不行就在设备管理器中将多余的先禁用,试一试
fontawesome图标不显示的原因
1.查看css路径是否正确 2.查看font文件夹内的字体文件是否引入 3.查看font文件夹内的字体资源路径是否正确
httprunner环境准备：Pycharm创建httprunner项目
使用命令行方式,可能会不大习惯,下面来一个通过Pycharm来创建httprunner项目. 创建虚拟环境. 安装httprunner 创建脚手架目录:httprunner startproject ...
js 模板方法模式
* 分离出共同点 function Beverage() {} Beverage.prototype.boilWater = function() { console.log("把水煮沸&q ...
centos7安装部署SVN
SVN介绍 SVN是个自由.开源的版本控制系统,绝大多数开源软件都使用SVN作为代码版本管理软件. SVN的官方网站http://subversion.apache.org/.目前SVN在开源社区 ...

Coursera Deep Learning笔记 结构化机器学习项目 （上）

1. 正交化(Orthogonalization)

2. 单一数字评估指标(Single number evaluation metric)

3. 满足和优化指标(Satisficing and Optimizing metic)

4. Train/dev/test distributions

5. Size of the dev and test sets

6. When to change dev/test sets and metrics

7. Why human-level performance

8. 可避免误差(Avoidable bias)

9. Understanding human-level performance

9. Understanding human-level performance

10. 改善模型表现

Coursera Deep Learning笔记 结构化机器学习项目 （上）的更多相关文章

随机推荐

热门专题

Coursera Deep Learning笔记结构化机器学习项目（上）

Coursera Deep Learning笔记结构化机器学习项目（上）的更多相关文章