ubuntu之路——day11.5 迁移学习

在深度学习领域中，最强力的理念之一就是可以将神经网络学习的一种知识应用到另一个独立的任务中。

看上面的例子，首先我们有一个已经完成训练的神经网络，其目标是图像识别，我们有了绿色的1000000张图片并训练了上面的网络。

在完成图像识别后，我们希望将我们的模型用于放射诊断任务，这就是一种迁移。

我们的做法是，把以及训练好的网络的输出层及其权重都删除掉，然后重新随机权重给最后一层，并且让它在放射诊断数据上进行训练。

在使用源数据进行训练的时候，我们把这一过程称为预训练pre-training，其目标是训练网络的各层参数。

在使用放射数据进行训练的时候，我们把这一过程称为微调fine tuning

迁移学习起到作用的场合往往在于，我们有许多的源数据，但只有少量的目标数据，如上图绿色数据。

但是如果我们有红色数据分布的话，迁移学习不会有太大的坏处，但是也别指望这会对于模型有很大的帮助。因为少量的源数据无法给与神经网络的各个隐含层足够的信息。

when transfer learning make sense？

1.task A and B have the same input x

比如上面的例子中图片识别和放射检测都是图像输入

2.You have a lot more data for Task A than Task B

其原因在于，对于目标B来说每个样本b的价值很高，但是每个样本a的价值很低，如果要通过源域A给予目标域B足够的信息，就需要很多很多的样本a才能达到足够的价值。

3.Low level features from A could be helpful for learning B

所谓低层次特征比如说，上面例子中的普通图像识别也许给予神经网络各层颜色、边缘、光线等等低层次特征的学习参数，这有可能对放射图片识别带来帮助。

ubuntu之路——day11.5 迁移学习的更多相关文章

ubuntu之路——day11.6 多任务学习
在迁移学习transfer learning中,你的步骤是串行的sequential process 在多任务学习multi-task learning中,你试图让单个神经网络同时做几件事情,然后这里 ...
ubuntu之路——day11.7 end-to-end deep learning
在传统的数据处理系统或学习系统中,有一些工作需要多个步骤进行,但是端到端的学习就是用一个神经网络来代替中间所有的过程. 举个例子,在语音识别中: X(Audio)----------MFCC----- ...
ubuntu之路——day11.2 快速搭建系统并进行迭代、在不同的划分上进行训练和测试
快速搭建系统并进行迭代 1.建立dev/test set,并确定你的目标 2.快速建立初始化的系统 3.使用前面提到的bias/variance分析和错误分析来进行模型优化和迭代针对以上的过程,An ...
ubuntu之路——day8.1 深度学习优化算法之mini-batch梯度下降法
所谓Mini-batch梯度下降法就是划分训练集和测试集为等分的数个子集,比如原来有500W个样本,将其划分为5000个baby batch,每个子集中有1000个样本,然后每次对一个mini-bat ...
ubuntu之路——day11.4 定位数据不匹配与人工合成数据
1.人工检验train和dev/test之间的区别: 比如:汽车语音识别中的噪音.地名难以识别等等 2.使得你的训练集更靠近(相似于)dev/test,收集更多类似于dev的数据: 比如:dev中存在 ...
ubuntu之路——day11.3 不匹配数据划分的偏差和方差
在11.2中,我们提到了一种数据划分的方法,那么怎么衡量这种数据划分方法中的误差呢? 来看一个例子:有20w条各种领域的语音识别数据,2w条汽车语音定位数据 train+dev+test,其中trai ...
ubuntu之路——day11.1 如何进行误差分析
举个例子还是分类猫图片的例子假设在dev上测试的时候,有100张图片被误分类了.现在要做的就是手动检查所有被误分类的图片,然后看一下这些图片都是因为什么原因被误分类了. 比如有些可能因为被误分类为 ...
ubuntu之路——day9.1 深度学习超参数的调优
参数重要性: 第一阶:α即learning rate 第二阶:momentum中的β,hidden units的数量,mini-batch的大小第三阶:hidden layers的数量,learni ...
ubuntu之路——day8.2 深度学习优化算法之指数加权平均与偏差修正，以及基于指数加权移动平均法的动量梯度下降法
首先感谢吴恩达老师的免费公开课,以下图片均来自于Andrew Ng的公开课指数加权平均法在统计学中被称为指数加权移动平均法,来看下面一个例子: 这是伦敦在一些天数中的气温分布图 Vt = βVt- ...

随机推荐

React Native 开发豆瓣评分（八）首页开发
首页完成效果展示: 一.开发占位图组件在没有数据的时候使用占位图替代 items 的位置. 在 components 目录里创建 moviesItemPlaceholder.js import Re ...
详解iOS的presentViewController(转)
一.用途和相关概念iOS中显示ViewController的方式有两种push和modal,modal也叫模态,模态显示VC是iOS的重要特性之一,其主要用于有以下场景: - 收集用户输入信息- 临时 ...
根据值获取枚举类对象工具类EnumUtils
枚举类 public enum Sex { man("M","男"),woman("W","女"); private S ...
tomcat运行一段时间出“org.apache.coyote.http11.Http11Processor.service Error parsing HTTP request header”
试了好多种方法,貌似还是没有解决问题,不过也学到了点东西,记录下备忘吧. 异常详情: 1.首先看到最多的就是说在server.xml中的Connector中添加maxHttpHeaderSize=&q ...
python 执行系统命令模块比较
python 执行系统命令模块比较 1.os.system模块仅仅在子终端运行命令,返回状态码,0为成功,其他为失败,但是不返回执行结果如果再命令行下执行,结果直接打印出来 >>> ...
InteiiJ IDEA中如何制定制定哪一个配置文件
项目下有好些application.property文件彼此之间也不是什么从application.property中指定dev就去对应dev的关系就想用我本地的数据库于是添加了一个appl ...
Spring Boot+STOMP解决消息乱序问题
当我们使用Spring Boot+websocket进行前后端进行通信时,我们需要注意:服务器可以随时向客户端发送消息.默认的情况下,不保证:服务器发送的消息与到达客户端的消息的顺序是一致的.可能先发 ...
python蟒蛇绘制的代码以及目前还不知道怎么用的RGB颜色对照表
#PythonDraw.py import turtle#引入海龟库 turtle.setup(650,350,200,200)#确定窗口大小,长650,高350,确定窗口位置,距离电脑左上角200, ...
DFS遍历拷贝所有子文件夹及目录列表 (Java版)
如题注意,文件夹是不能拷贝的, 需要mkdir的文件选择合适的流进行拷贝 main测试方法 /** * 主测试类,默认将D:\\base01 下的复制到D:\\base02 * @param ar ...
git常用命令总结--原创
0.git status 仓库状态1.git add 工作区-->暂存区2.git commit 暂存区-->版本库3.git log 查看日志4.git reset --hard hea ...

ubuntu之路——day11.5 迁移学习

ubuntu之路——day11.5 迁移学习的更多相关文章

随机推荐

热门专题