0.读书笔记之The major advancements in Deep Learning in 2016
The major advancements in Deep Learning in 2016
地址:https://tryolabs.com/blog/2016/12/06/major-advancements-deep-learning-2016/
主要挑战是unsupervised learning 无监督学习,2016年大量的研究专注于generative models 生成模型。几大巨头谷歌和脸书分别创新于自然语言处理NLP。
无监督学习
无监督学习指的是在没有额外信息的新数据中,提取数据模式和结构。以往的经典解决办法是自动编码(autoencoders),主要包含多层感知机(multilayer perceptron MLP):输入和输出具有相同的大小,隐层训练用来覆盖输入。从隐层得到的输出能够用来聚类,降维,提高监督分类甚至是数据压缩。
对抗式网络generative adversarial Networks GANs
基于生成模型下的新方法:对抗式网络。它能够使模型处理成无监督学习。Yann LeCun认为对抗式网络将会是机器学习未来20年最重要的ideal
lan Goodfellow在2014年就已经提出了GANs这个概念,然而直到2016年才开始展现它真正的潜力。Deep Convolutional GAN结构能够提高训练技术和更好的结构水平。它能够调和原来神经网络的一些限制,稍后介绍的新应用也会有大幅度的灵活性提高。
The intuitive idea
GANs有两个网络模型,生成模型generator model G,判别模型discriminatory model D,G生成的结果意图混淆D,使其分不清楚是真实样本还是虚假样本。在GANs中,G 会生成输出,D来判断是否来自于同一个训练集。
G会产生一定的noise Z,D将会从数据集中获得输入D(x),从G中获得输入D(G(Z)),将其进行分类。D和G同时进行学习,一旦G训练成功,那么G就能产生和训练集有相似特性的新样本。新样本从细节中来看虽然不像原始训练集一样,但是仍然可以捕获到一些具体地方面能够使其看起来似乎来自图片集。
infoGAN
最近有关于GANs的一些设想已经不仅仅是近似数据分布问题,还有学习可翻译的有用处的数据代表向量。这就是信息对抗式网络。这些向量代表需要有丰富的信息,同时需要可理解。意味着我们可以区别从G模型产生的输出形状转换类型的部分向量。infoGANs模型是由八月的时候openAI研究者所提出来的,果壳中,infoGAN能够从无监督方式中产生数据集的具体信息。例如,应用在MNIST 数据集中的时候,在没有手动标记的数据中,能够推断出旋转数字的类型和产生样本的宽度。
conditional GANs
GANs的另一个扩展就是转换对抗式网络cGAN,这个模型所产生样本能够有额外信息(分类标签,内容,另一个图片),在使用这个模型能够强化G所产生的输出类型。这个模型已经应用在某些应用中了:
在图片添加文本内容:所产生的图片基于图片中的描述(用CNN或者LSTM来产生解码向量)所作为的额外信息。论文:Generative Adversarial Text to Image Synthesis (Jun 2016).
图片与图片之间的转换:将输入图片和输出图片进行相关映射。论文:Image-to-Image Translation with Conditional Adversarial Nets (Nov 2016).
超分辨率:从网上下载的不太清晰的图片,经过生成器的处理后尽量使得图片能够有比较自然的细节版本,论文:Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network (Nov 2016).
You can check more about generative models in this blog post or in this talk by Ian Goodfellow.
Natural Language Processing NLP
为了能够与机器进行流利地交流,首先需要解决以下问题:文本理解,问答,机器转换。
文本理解:JMT建立了一个单一模型,能够学习5大NLP任务。语音部分标记,分词,从属语法解析,语义相关性,文本蕴含。这个模型最大的魅力在于端到端可训练模式。意味着不同层之间可以进行合作,从而在底层任务中提高结果。这是一个突破点:利用高层能力提高底层结果。
问答:新应用模型:Dynamic Coattention Network(DCN)动态共注意网络。是选择在阅读text后再回答问题,还是先看问题再阅读text,如果选择A,则会详细注意text的每一个细节以防后面的问题、DCN做同样的事情,根据文档产生一系列代表问题并且试图做出解答,之后再可能的答案里进行收敛到最终答案。
机器翻译:九月份谷歌提出了一个新模型:Google neural machine translation GNMT,这个模型主要是训练语言翻译对象,比如说中文翻译至英文。能够启动zero-shot translation,零翻译即可以翻译一对并没有训练过的语言。
Community
机器学习技术能够有利于社区。openAI是一个创建于2015年,将学术与工厂结合的无利润组织。创办动机来源于希望将AI技术能够让更多人的受益,同时避免有AI超级力量的产生。另一个方面,Amazon,deepmind,google,facebook ,IBM,微软。在这个先进公共领域的理解中,需要有支持开放性平台进行讨论。
十大开源工具:
- TensorFlow by Google.
- Keras by François Chollet.
- CNTK by Microsoft.
- MXNET by Distributed (Deep) Machine Learning Community. Adapted by Amazon.
- Theano by Université de Montréal.
- Torch by Ronan Collobert, Koray Kavukcuoglu, Clement Farabet. Widely used by Facebook.
0.读书笔记之The major advancements in Deep Learning in 2016的更多相关文章
- (转) The major advancements in Deep Learning in 2016
The major advancements in Deep Learning in 2016 Pablo Tue, Dec 6, 2016 in MACHINE LEARNING DEEP LEAR ...
- [译]2016年深度学习的主要进展(译自:The Major Advancements in Deep Learning in 2016)
译自:The Major Advancements in Deep Learning in 2016 建议阅读时间:10分钟 https://tryolabs.com/blog/2016/12/06/ ...
- 强化学习读书笔记 - 06~07 - 时序差分学习(Temporal-Difference Learning)
强化学习读书笔记 - 06~07 - 时序差分学习(Temporal-Difference Learning) 学习笔记: Reinforcement Learning: An Introductio ...
- 李宏毅机器学习笔记4:Brief Introduction of Deep Learning、Backpropagation(后向传播算法)
李宏毅老师的机器学习课程和吴恩达老师的机器学习课程都是都是ML和DL非常好的入门资料,在YouTube.网易云课堂.B站都能观看到相应的课程视频,接下来这一系列的博客我都将记录老师上课的笔记以及自己对 ...
- <玩转Django2.0>读书笔记:表单
1. 表单字段 参考: 官方文档 Django表单字段汇总 2. 表单代码示例(forms.Form) # form.py代码 # 获取数据库数据 choices_list = [(i+1,v['ty ...
- <玩转Django2.0>读书笔记:模板和模型
1. 模板内置标签 Django常用内置标签 标签 描述 {% for %} 遍历输出变量的内容 {% if %} 对变量进行条件判断 {% csrf_token %} 生成csrf_token标签, ...
- vue2.0读书笔记2-进阶
一.深入响应式原理 二.过渡效果 三.过渡状态 四.Render函数 五.自定义指令 六.混合 七.插件 八.单文件组件 九.生产环境 十.路由 vue-router: http://router.v ...
- <玩转Django2.0>读书笔记:邮件和分页
1. 发送邮件 # settings.py设置 # 邮箱设置 EMAIL_USE_SSL = True # 邮件服务器 EMAIL_HOST = 'smtp.qq.com' # 邮件服务端口 EMAI ...
- <玩转Django2.0>读书笔记:URL规则和视图
1. 带变量的URL #urls.py from django.urls import path from .view import * urlpatterns = [ path('',index_v ...
随机推荐
- 【原创】Android ExpandableListView使用
ExpandableView的使用可以绑定到SimpleExpandableListAdapter,主要是看这个Adapter怎么用. 这个类默认的构造函数有9个参数, 很好地解释了什么叫做又臭又长. ...
- 相机拍的图,电脑上画的图,word里的文字,电脑屏幕,手机屏幕,相机屏幕显示大小一切的一切都搞明白了!
相机拍的图,电脑上画的图,word里的文字,电脑屏幕,手机屏幕,相机屏幕显示大小一切的一切都搞明白了! 先说图片X×dpi=点数dotX是图片实际尺寸,简单点,我们只算图片的高吧,比如说拍了张图片14 ...
- 关于IE11版本下JS中时间判断的问题
最近在做代码的优化及浏览器的兼容问题.遇到了谷歌.火狐.360兼容模式.IE(8以上)版本对时间判断大小的问题 . 在谷歌.火狐.360.IE11以下IE8以上版本下 var d1="201 ...
- Android Monkey测试(转载)
Monkey是一款通过命令行来对我们APP进行测试的工具,可以运行在模拟器里或真机上.它向系统发送伪随机的用户事件流,实现对正应用程序进行压力测试. 官方介绍 :https://developer.a ...
- CSS之float样式总结
从四大开始开始慢慢接触前端,大概半年多过去了,虽然做了一些东西,但感觉有些点始终不是很清晰.有时候为了赶进度,没有太多时间对某个点进行全面深入思考分析,只能从网上搜一搜,试一试,只要效果出来了,任务就 ...
- C#中常用的转义字符及@符号的一些作用
转义符指的就是一个'\'+一个特殊的字符,组成了一个具有特殊意义的字符. \n:表示换行. /b表示一个退格键.放到字符串两边没有效果. \t:表示tab键的空格 \":表示一个英文半角的 ...
- python opencv 实现Reinhard颜色迁移算法
Reinhard颜色迁移算法的过程很简单,流程如下,细节部分见原文,题目为color transfer between images: 将参考图片和目标图片转换到LAB空间下 得到参考图片和目标图片的 ...
- Linux下的Hello world
总算正式开始学习Linux了. 先从Hello world入手. 1. 查看当前目录 lenovo@ubuntu:~$ pwd /home/lenovo 2. 新建test目录 lenovo@ubun ...
- openlayers 3 简书
1. 简书http://www.jianshu.com/p/6785e755fa0d 2. 文档 http://anzhihun.coding.me/ol3-primer/ch03/03-02.htm ...
- The Number Off of FFF
X soldiers from the famous “FFF army'' is standing in a line, from left to right. You, as the captai ...