机器学习ML策略

1、为什么是ML策略

例如：识别cat分类器的识别率是90%，怎么进一步提高识别率呢？

想法：

（1）收集更多数据

（2）收集更多的多样性训练样本

（3）使用梯度下降训练更长时间

（4）尝试Adam代替梯度下降

（5）尝试更大的网络

（6）尝试更小的网络

（7）尝试dropout

（8）尝试L2正则化

（9）修改网络架构（激励函数，隐含层单元数目）

2、正交化

正交化（正交性）是一种系统设计属性，它可以确保修改算法的一个指令或者组成部分将不会对系统的其他组成部分产生或者传播副作用。使得核查算法变得容易，减少测试和开发算法的时间。

一个好的机器学习算法按算法流程需要满足（正交化）：

（1）在训练集中表现好（接近人类）。如果不好，可换大型网络或者更换优化算法

（2）在验证集中表现好。如果不好，可尝试正则化或者使用大一点规模的训练集

（3）在测试集中表现好。如果不好，可尝试大一点的验证集

（4）在真实世界中表现好。如果不好，测试集不正确或者代价函数有问题

3、单一数字评估指标

混淆矩阵：

True Positive（TP）：正类预测为正类

True Negtive（TN）：负类预测为负类

False Positive（FP）：负类预测为正类（误报）

False Negative（FN）：正类预测为负类（漏报）

	Positive	Negative
True	TP	TN
False	FP	FN

精确率（precision）：针对预测结果而言的，它表示的是预测为正的样本中有多少是对的

P = TP/（TP+FP）

准确率（accuracy）：ACC = （TP+TN）/（TP+TN+FP+FN）

召回率（recall）：针对我们原来的样本而言的，它表示的是样本中的正例有多少被预测正确的

R = TP/（TP+FN）

F1值：2/F1 = 1/P +1/R ---> F1 = 2TP/（2TP+FP+FN）

在信息检索领域，精确率和召回率又被称为查准率和查全率，

查准率＝检索出的相关信息量 / 检索出的信息总量

查全率＝检索出的相关信息量 / 系统中的相关信息总量

机器学习ML策略的更多相关文章

[机器学习] ML重要概念：梯度（Gradient）与梯度下降法（Gradient Descent）
引言机器学习栏目记录我在学习Machine Learning过程的一些心得笔记,涵盖线性回归.逻辑回归.Softmax回归.神经网络和SVM等等,主要学习资料来自网上的免费课程和一些经典书籍,免费课 ...
机器学习 - ML
CNCC - 2016 | 机器学习(原文链接) Machine Learning - ML,机器学习起源于人工智能,是AI的一个分支. 机器学习的理论基础:计算学习理论 - Computationa ...
机器学习 ML.NET 发布 1.0 RC
ML.NET 是面向.NET开发人员的开源和跨平台机器学习框架(Windows,Linux,macOS),通过使用ML.NET,.NET开发人员可以利用他们现有的工具和技能组,为情感分析,推荐,图像分 ...
机器学习 - ML + 深度学习 - DL
机器学习 CNCC - 2016 | 机器学习(原文链接) Machine Learning - ML,机器学习起源于人工智能,是AI的一个分支. 机器学习的理论基础:计算学习理论 - Computa ...
.NET机器学习 ML.NET 1.4预览版和模型生成器更新
ML.NET 是面向.NET开发人员的开源和跨平台机器学习框架. ML.NET 还包括Model Builder (一个简单的UI工具)和 CLI ,使用自动机器学习(AutoML)构建自定义 ...
认识：人工智能AI 机器学习 ML 深度学习DL
人工智能人工智能(Artificial Intelligence),英文缩写为AI.它是研究.开发用于模拟.延伸和扩展人的智能的理论.方法.技术及应用系统的一门新的技术科学. 人工智能是对人的意识. ...
PCB 机器学习(ML.NET)初体验实现PCB加投率预测
使用ML.NET建立PCB加投率模型对单一蚀刻工序进行加投率预测, 此实例为最简单预测,要想实现全流程加投率预测挑战难度还是挺大的,可以查看另一种关于大数据在PCB行业应用---加投率计算基本原理:P ...
吴恩达《深度学习》-第三门课结构化机器学习项目（Structuring Machine Learning Projects）-第一周机器学习（ML）策略（1）（ML strategy（1））-课程笔记
第一周机器学习(ML)策略(1)(ML strategy(1)) 1.1 为什么是 ML 策略?(Why ML Strategy?) 希望在这门课程中,可以教给一些策略,一些分析机器学习问题的方法, ...
DeepLearning.ai学习笔记（三）结构化机器学习项目--week1 机器学习策略
一.为什么是ML策略如上图示,假如我们在构建一个喵咪分类器,数据集就是上面几个图,训练之后准确率达到90%.虽然看起来挺高的,但是这显然并不具一般性,因为数据集太少了.那么此时可以想到的ML策略有哪 ...

随机推荐

Bootstrap3基础 list-inline 无序列表横向显示
内容参数 OS Windows 10 x64 browser Firefox 65.0.2 framework Bootstrap 3.3.7 editor ...
windows下如何安装vundle?
参考: http://blog.csdn.net/zhuxiaoyang2000/article/details/8636472 vundle是gmarik 受 ruby的 bunler的启发开发的. ...
newcoder H肥猪（单调队列 / 线段树）题解
题意: 小B来到了一个异世界,成为了肥猪之王. 在这个异世界,共有n种肥猪,编号分别为1,...,n. 小B希望集齐这n种肥猪. 召集肥猪有两种方式: 1. 花费a[i]的金币召唤一只编号为i的肥猪. ...
python 之循环语句
python提供了for循环和while循环以及嵌套循环(在python中没有do..while循环) while 循环语法: while 判断条件: 执行语句...... 实际案例: numbers ...
（转）awesome-text-summarization
awesome-text-summarization 2018-07-19 10:45:13 A curated list of resources dedicated to text summari ...
MongoDB集群配置笔记二（实战）
单台mongodb配置文件: dbpath=/opt/mongodb/data logpath=/opt/mongodb/logs/mongodb.log logappend=true fork=tr ...
tcpdump使用方法
TcpDump可以将网络中传送的数据包完全截获下来提供分析.它支持针对网络层.协议.主机.网络或端口的过滤,并提供and.or.not等逻辑语句来帮助你去掉无用的信息. 工作中使用tcpdump命令抓 ...
C语言深入学习
浮点数: x = Mx*2^Ex为一个规格化浮点数,Mx为x的尾数,Ex为x的阶码. 1e-6:表示1 * 10 ^ (-6). 编译时执行: sizeof是运算符(而非函数),在编译时执行,不会导致 ...
Java中JSONObject相关操作
maven项目pom配置: <dependency> <groupId>net.sf.json-lib</groupId> <artifactId>js ...
CoordinatorLayout实现的效果(标题栏效果)
一.效果 CoordinatorLayouy是一个能够协调子布局的容器布局. 使用引入: compile 'com.android.support:design:24.1.1' 常见的使用方法如下:1 ...

机器学习ML策略

机器学习ML策略的更多相关文章

随机推荐

热门专题