0.读书笔记之The major advancements in Deep Learning in 2016
The major advancements in Deep Learning in 2016
地址:https://tryolabs.com/blog/2016/12/06/major-advancements-deep-learning-2016/
主要挑战是unsupervised learning 无监督学习,2016年大量的研究专注于generative models 生成模型。几大巨头谷歌和脸书分别创新于自然语言处理NLP。
无监督学习
无监督学习指的是在没有额外信息的新数据中,提取数据模式和结构。以往的经典解决办法是自动编码(autoencoders),主要包含多层感知机(multilayer perceptron MLP):输入和输出具有相同的大小,隐层训练用来覆盖输入。从隐层得到的输出能够用来聚类,降维,提高监督分类甚至是数据压缩。
对抗式网络generative adversarial Networks GANs
基于生成模型下的新方法:对抗式网络。它能够使模型处理成无监督学习。Yann LeCun认为对抗式网络将会是机器学习未来20年最重要的ideal
lan Goodfellow在2014年就已经提出了GANs这个概念,然而直到2016年才开始展现它真正的潜力。Deep Convolutional GAN结构能够提高训练技术和更好的结构水平。它能够调和原来神经网络的一些限制,稍后介绍的新应用也会有大幅度的灵活性提高。
The intuitive idea
GANs有两个网络模型,生成模型generator model G,判别模型discriminatory model D,G生成的结果意图混淆D,使其分不清楚是真实样本还是虚假样本。在GANs中,G 会生成输出,D来判断是否来自于同一个训练集。
G会产生一定的noise Z,D将会从数据集中获得输入D(x),从G中获得输入D(G(Z)),将其进行分类。D和G同时进行学习,一旦G训练成功,那么G就能产生和训练集有相似特性的新样本。新样本从细节中来看虽然不像原始训练集一样,但是仍然可以捕获到一些具体地方面能够使其看起来似乎来自图片集。
infoGAN
最近有关于GANs的一些设想已经不仅仅是近似数据分布问题,还有学习可翻译的有用处的数据代表向量。这就是信息对抗式网络。这些向量代表需要有丰富的信息,同时需要可理解。意味着我们可以区别从G模型产生的输出形状转换类型的部分向量。infoGANs模型是由八月的时候openAI研究者所提出来的,果壳中,infoGAN能够从无监督方式中产生数据集的具体信息。例如,应用在MNIST 数据集中的时候,在没有手动标记的数据中,能够推断出旋转数字的类型和产生样本的宽度。
conditional GANs
GANs的另一个扩展就是转换对抗式网络cGAN,这个模型所产生样本能够有额外信息(分类标签,内容,另一个图片),在使用这个模型能够强化G所产生的输出类型。这个模型已经应用在某些应用中了:
在图片添加文本内容:所产生的图片基于图片中的描述(用CNN或者LSTM来产生解码向量)所作为的额外信息。论文:Generative Adversarial Text to Image Synthesis (Jun 2016).
图片与图片之间的转换:将输入图片和输出图片进行相关映射。论文:Image-to-Image Translation with Conditional Adversarial Nets (Nov 2016).
超分辨率:从网上下载的不太清晰的图片,经过生成器的处理后尽量使得图片能够有比较自然的细节版本,论文:Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network (Nov 2016).
You can check more about generative models in this blog post or in this talk by Ian Goodfellow.
Natural Language Processing NLP
为了能够与机器进行流利地交流,首先需要解决以下问题:文本理解,问答,机器转换。
文本理解:JMT建立了一个单一模型,能够学习5大NLP任务。语音部分标记,分词,从属语法解析,语义相关性,文本蕴含。这个模型最大的魅力在于端到端可训练模式。意味着不同层之间可以进行合作,从而在底层任务中提高结果。这是一个突破点:利用高层能力提高底层结果。
问答:新应用模型:Dynamic Coattention Network(DCN)动态共注意网络。是选择在阅读text后再回答问题,还是先看问题再阅读text,如果选择A,则会详细注意text的每一个细节以防后面的问题、DCN做同样的事情,根据文档产生一系列代表问题并且试图做出解答,之后再可能的答案里进行收敛到最终答案。
机器翻译:九月份谷歌提出了一个新模型:Google neural machine translation GNMT,这个模型主要是训练语言翻译对象,比如说中文翻译至英文。能够启动zero-shot translation,零翻译即可以翻译一对并没有训练过的语言。
Community
机器学习技术能够有利于社区。openAI是一个创建于2015年,将学术与工厂结合的无利润组织。创办动机来源于希望将AI技术能够让更多人的受益,同时避免有AI超级力量的产生。另一个方面,Amazon,deepmind,google,facebook ,IBM,微软。在这个先进公共领域的理解中,需要有支持开放性平台进行讨论。
十大开源工具:
- TensorFlow by Google.
- Keras by François Chollet.
- CNTK by Microsoft.
- MXNET by Distributed (Deep) Machine Learning Community. Adapted by Amazon.
- Theano by Université de Montréal.
- Torch by Ronan Collobert, Koray Kavukcuoglu, Clement Farabet. Widely used by Facebook.
0.读书笔记之The major advancements in Deep Learning in 2016的更多相关文章
- (转) The major advancements in Deep Learning in 2016
The major advancements in Deep Learning in 2016 Pablo Tue, Dec 6, 2016 in MACHINE LEARNING DEEP LEAR ...
- [译]2016年深度学习的主要进展(译自:The Major Advancements in Deep Learning in 2016)
译自:The Major Advancements in Deep Learning in 2016 建议阅读时间:10分钟 https://tryolabs.com/blog/2016/12/06/ ...
- 强化学习读书笔记 - 06~07 - 时序差分学习(Temporal-Difference Learning)
强化学习读书笔记 - 06~07 - 时序差分学习(Temporal-Difference Learning) 学习笔记: Reinforcement Learning: An Introductio ...
- 李宏毅机器学习笔记4:Brief Introduction of Deep Learning、Backpropagation(后向传播算法)
李宏毅老师的机器学习课程和吴恩达老师的机器学习课程都是都是ML和DL非常好的入门资料,在YouTube.网易云课堂.B站都能观看到相应的课程视频,接下来这一系列的博客我都将记录老师上课的笔记以及自己对 ...
- <玩转Django2.0>读书笔记:表单
1. 表单字段 参考: 官方文档 Django表单字段汇总 2. 表单代码示例(forms.Form) # form.py代码 # 获取数据库数据 choices_list = [(i+1,v['ty ...
- <玩转Django2.0>读书笔记:模板和模型
1. 模板内置标签 Django常用内置标签 标签 描述 {% for %} 遍历输出变量的内容 {% if %} 对变量进行条件判断 {% csrf_token %} 生成csrf_token标签, ...
- vue2.0读书笔记2-进阶
一.深入响应式原理 二.过渡效果 三.过渡状态 四.Render函数 五.自定义指令 六.混合 七.插件 八.单文件组件 九.生产环境 十.路由 vue-router: http://router.v ...
- <玩转Django2.0>读书笔记:邮件和分页
1. 发送邮件 # settings.py设置 # 邮箱设置 EMAIL_USE_SSL = True # 邮件服务器 EMAIL_HOST = 'smtp.qq.com' # 邮件服务端口 EMAI ...
- <玩转Django2.0>读书笔记:URL规则和视图
1. 带变量的URL #urls.py from django.urls import path from .view import * urlpatterns = [ path('',index_v ...
随机推荐
- .NET委托和事件
.net学习之委托和事件 1.什么是委托 通俗的说:委托就是一个能够存储符合某种格式(方法签名)的方法的指针的容器 上传图片: 2.委托语法 准备一个方法:string Hello(string ...
- python 中使用celery
http://www.thinksaas.cn/group/topic/395734/
- 图说js中的this——深入理解javascript中this指针
没搞错吧!js写了那么多年,this还是会搞错!没搞错,javascript就是回搞错! ………… 文章来源自——周陆军的个人网站:http://zhoulujun.cn/zhoulujun/html ...
- Zend框架设置数据库连接编码为utf8三种方法
第一种:$conn['host'] = '127.0.0.1';$conn['username'] = '56_' . $tenant['tenant'];$conn['password'] = $t ...
- Bitnami Redmine插件记录
1.bitnami安装时自带了开发环境,如ruby.rails.devkit. 为了版本兼容,应使用bitnami的命令行. 2.通过use_redmine启动命令行:运行Bitnami\redmin ...
- get([index])
get([index]) 概述 取得其中一个匹配的元素. num表示取得第几个匹配的元素.从0开始,返回的是DOM对象,类似的有eq(index),不过eq(index)返回的是jQuery对象. 这 ...
- Wpf 中的DataGrid的Header属性,动态bind时不起作用
在使用wpf开发软件时,有使用到DataGrid,DataGridTextColumn的Header 属性使用DynamicResource binding,在修改绑定数据源时,header并没有更新 ...
- java ide 导出可运行jar包
常常会用到写个jar搬到其他地方运行的情况,这里做个笔记记录下如何利用eclipse或者idea导出jar. 导出jar包最好的方式个人认为是把依赖的包都打包进目标jar,这样一个jar可以很happ ...
- IIS出现Service Unavailable 错误
IIS访问操作出现以下问题时要如何解决:
- Bootstrap相关总结
1.工具提示 Tooltips js调用显示 $('#example').tooltip( { title:'这个是一个提示', }); $('#example').tooltip('show');