LSTM与Highway-LSTM算法实现的研究概述

zoerywzhou@gmail.com

http://www.cnblogs.com/swje/

作者:Zhouwan

 2015-12-22

 

声明:

1)该LSTM的学习系列是整理自网上很多大牛和机器学习专家所无私奉献的资料的。具体引用的资料请看参考文献。具体的版本声明也参考原文献。

2)本文仅供学术交流,非商用。所以每一部分具体的参考资料并没有详细对应。如果某部分不小心侵犯了大家的利益,还望海涵,并联系博主删除。

3)本人才疏学浅,整理总结的时候难免出错,还望各位前辈不吝指正,谢谢。

请联系:zoerywzhou@gmail.com 或13813017783@163.com

 
本研究课题系本人本科毕业设计,开题报告初步确定,后面会实时更新,希望能与大家相互交流,共同进步!
 
一、研究计划: 
 
1、理解LSTM的基本概念、原理与相关应用
2、剖析LSTM的代码实现
3、理解深度学习中Highway的思想,以及如何在LSTM中实现Highway
4、剖析Highway-LSTM代码
5、选择一个应用,进行验证
 
定期(每隔一月)对算法剖析的进展做总结,目标在3月底,完全掌握LSTM的代码与算法。
 
二、以下为部分学习资料的链接:
 
Github上的资源:
 
 
Basic LSTM by Torch (LUA) https://github.com/karpathy/char-rnn 
 
Highway LSTM by Torch (LUA) https://github.com/yoonkim/lstm-char-cnn 
 
 
LSTM implementation: http://apaszke.github.io/posts.html 
 

部分参考文献:

[High-way-lstm-1]High-way LSTM RNNS FOR Distant Speech Recognition.pdf : 访问密码 510b

[High-way-lstm-2]Character-Aware Neural Language Models.pdf  :访问密码 510b

神经网络课件:NN-Lectures:CSC321 Winter 2015 Introduction to Neural Networks:访问密码 0442

三、我的学习计划如下:

1、2015.12.23、24,28-30;2016.1.3、4(一周时间)————理解LSTM的基本概念、原理与相关应用
  (1)结合NN-lectures课件和以下网址看BP算法,了解其原理:(2015.12.23、24)
 
                                 
      Principles of training multi-layer neural network using backpropagation                                       
  (2)理解LSTM的基本概念、原理:(12.28~31)
 
 
      LSTM implementation: http://apaszke.github.io/posts.html   (译文)    
 
      
      深入浅出LSTM神经网络:http://www.csdn.net/article/2015-06-05/2824880
 
      Learning to read with recurrent neural networks(博士生Zachary Chase Lipton)
 
      顺便理解一下RNN,Andrej Karpathy写了篇非常棒的博客:递归神经网络不可思议的有效性英文原版
 
(3)了解LSTM的应用:(2016.1.3、4)

 目前了解到的LSTM应用大概有以下几个:
 
来自知乎:http://www.zhihu.com/question/37082800/answer/70333603

(1) Language Model
The Unreasonable Effectiveness of Recurrent Neural Networks

(2) Image Captioning
[CVPR15]]Long-term Recurrent Convolutional Networks for Visual Recognition and Description
Deep Visual-Semantic Alignments for Generating Image Descriptions

(3)Speech Recognition

(4)Machine Translation
[NIPS15]Sequence to Sequence Learning with Neural Networks.

 
2、2016.1.5-2016.1.19 ————剖析LSTM的代码实现,动手编程序,并写一篇总结日志,发布到CSDN上:
 
    2016.1.5-2016.1.10 ——Basic LSTM (LUA) https://github.com/wojzaremba/lstm    
       https://github.com/bgshih/crnn
 
       学LUA:(在线学习手册):http://manual.luaer.cn/
        关于LUA闭包的解释:http://www.2cto.com/kf/201503/382691.html
 
    2016.1.11-2016.1.18 ——Basic LSTM by Torch (LUA) https://github.com/karpathy/char-rnn 
 
    2016.1.19 ——写一篇总结日志,发布到CSDN上
 
 *******************************************************************
   

 非学习时间:2016.1.19-2.22寒假回家,暂定每周两天时间看看论文
 {
    2016.1.19寒假回家!
  
    提高time:健身、读书【写读后感】、写日志【完成日志《保研之路》,分享到保研论坛】
 }

 

 *******************************************************************
 
 
3、2016.2.15-2016.2.27 ————理解深度学习中Highway的思想,以及如何在LSTM中实现Highway
 
 
 2016.2.28-2016.2.29 ——写一篇总结日志,发布到CSDN上
 
4、2016.3.1-2016.3.29 ————剖析Highway-LSTM代码
 
  Highway LSTM by Torch (LUA) https://github.com/yoonkim/lstm-char-cnn 
 
 2016.3.30-2016.3.31 ——写一篇总结日志,发布到CSDN上
 
5、2016.4.1-2016.4.30 ————选择一个应用,进行验证
    
 
 先做出来,再看应用吧。。

LSTM与Highway-LSTM算法实现的研究概述的更多相关文章

  1. Highway LSTM 学习笔记

    Highway LSTM 学习笔记 zoerywzhou@gmail.com http://www.cnblogs.com/swje/ 作者:Zhouwan  2016-4-5   声明 1)该Dee ...

  2. 理解LSTM网络--Understanding LSTM Networks(翻译一篇colah's blog)

    colah的一篇讲解LSTM比较好的文章,翻译过来一起学习,原文地址:http://colah.github.io/posts/2015-08-Understanding-LSTMs/ ,Posted ...

  3. LSTM和双向LSTM讲解及实践

    LSTM和双向LSTM讲解及实践 目录 RNN的长期依赖问题LSTM原理讲解双向LSTM原理讲解Keras实现LSTM和双向LSTM 一.RNN的长期依赖问题 在上篇文章中介绍的循环神经网络RNN在训 ...

  4. 使用Keras进行深度学习:(六)LSTM和双向LSTM讲解及实践

    欢迎大家关注我们的网站和系列教程:http://www.tensorflownews.com/,学习更多的机器学习.深度学习的知识! 介绍 长短期记忆(Long Short Term Memory, ...

  5. DNA甲基化研究概述

    DNA甲基化研究概述 生信技能树 已关注 2018.01.23 11:43 字数 993 阅读 183评论 0喜欢 1 DNA甲基化(DNA methylation)是最早被研究的重要表观遗传修饰之一 ...

  6. PaddlePaddle︱开发文档中学习情感分类(CNN、LSTM、双向LSTM)、语义角色标注

    PaddlePaddle出教程啦,教程一部分写的很详细,值得学习. 一期涉及新手入门.识别数字.图像分类.词向量.情感分析.语义角色标注.机器翻译.个性化推荐. 二期会有更多的图像内容. 随便,帮国产 ...

  7. SSE图像算法优化系列二十四: 基于形态学的图像后期抗锯齿算法--MLAA优化研究。

    偶尔看到这样的一个算法,觉得还是蛮有意思的,花了将近10天多的时间研究了下相关代码. 以下为百度的结果:MLAA全称Morphological Antialiasing,意为形态抗锯齿是AMD推出的完 ...

  8. 【uva 1615】Highway(算法效率--贪心 区间选点问题)

    题意:给定平面上N个点和一个值D,要求在x轴上选出尽量少的点,使得对于给定的每个店,都有一个选出的点离它的欧几里德距离不超过D. 解法:先把问题转换成模型,把对平面的点满足条件的点在x轴的直线上可得到 ...

  9. 对A-Star寻路算法的粗略研究

    首先来看看完成后的效果: 其中灰色代表路障,绿色是起点和移动路径,红色代表终点   // = openArray[i+1].F) { minNode = openArray[i+1]; } } sta ...

随机推荐

  1. postman 编码加密汇总

    1.MD5加密 /*加密方式:将 请求头的user-agent内容+请求方式+当前时间+(Base64)请求body中的stacode参数 拼接后得到的字符串进行MD5加密*/ //1.获取reque ...

  2. mysql大致学习路径

  3. MapReduceTopK TreeMap

    版权声明: https://blog.csdn.net/zhangxiango/article/details/33319281 MapReduce TopK统计加排序中介绍的TopK在mapredu ...

  4. 如何用云存储和CDN加速网站图片视频、阿里云OSS的使用(转)

    总有人说阿里云主机带宽小,那只是因为你还停留在单机架构上. 阿里的架构设计,云主机主要用来跑程序的,附件的存储和访问主要靠OSS. 有人又会说了,OSS按存储费+流量双重计费伤不起,只是你不知道OSS ...

  5. Python2 socket TCPServer 多线程并发 超时关闭

    在阿里云上测试过,可以直接使用. 用IP和端口发送数据,会返回echo:+接收到的数据 #coding=utf-8 import socket import threading,getopt,sys, ...

  6. 系统架构师考试——程序计数器 PC, 指令寄存器IR、状态寄存器SR、通用寄存器GR

    ● 计算机执行程序时,在一个指令周期的过程中,为了能够从内存中读指令操作码,首先是将__(9)___的内容送到地址总线上. (9)A.程序计数器PC    B.指令寄存器IR C.状态寄存器SR    ...

  7. css字体样式

    css字体样式(Font Style) 属性       css文本样式 序号 中文说明 标记语法 1 字体样式 {font:font-style font-variant font-weight f ...

  8. asp.net,关于Listview+DataPager控件使用

    关于Listview+DataPager控件使用1.DAL层,根据开始条数+结束条数查询数据.2.BLL层,startRowIndex和maximumRows进行查询.(startRowIndex + ...

  9. 建议44:理解模块pickle优劣

    # -*- coding:utf-8 -*- ''' pickle 估计是最通用的序列化模块了,它还有个C 语言的实现cPickle,相比pickle 来说 具有较好的性能,其速度大概是pickle ...

  10. [转载]OpenWRT使用wifidog实现强制认证的WIFI热点 | 半个橙子

    首先安装wifidog到OpenWRT的路由器: opkg update opkg install wifidog wifidog依赖下面这些模块: iptables-mod-extra iptabl ...