LSTM与Highway-LSTM算法实现的研究概述

zoerywzhou@gmail.com

http://www.cnblogs.com/swje/

作者:Zhouwan

 2015-12-22

 

声明:

1)该LSTM的学习系列是整理自网上很多大牛和机器学习专家所无私奉献的资料的。具体引用的资料请看参考文献。具体的版本声明也参考原文献。

2)本文仅供学术交流,非商用。所以每一部分具体的参考资料并没有详细对应。如果某部分不小心侵犯了大家的利益,还望海涵,并联系博主删除。

3)本人才疏学浅,整理总结的时候难免出错,还望各位前辈不吝指正,谢谢。

请联系:zoerywzhou@gmail.com 或13813017783@163.com

 
本研究课题系本人本科毕业设计,开题报告初步确定,后面会实时更新,希望能与大家相互交流,共同进步!
 
一、研究计划: 
 
1、理解LSTM的基本概念、原理与相关应用
2、剖析LSTM的代码实现
3、理解深度学习中Highway的思想,以及如何在LSTM中实现Highway
4、剖析Highway-LSTM代码
5、选择一个应用,进行验证
 
定期(每隔一月)对算法剖析的进展做总结,目标在3月底,完全掌握LSTM的代码与算法。
 
二、以下为部分学习资料的链接:
 
Github上的资源:
 
 
Basic LSTM by Torch (LUA) https://github.com/karpathy/char-rnn 
 
Highway LSTM by Torch (LUA) https://github.com/yoonkim/lstm-char-cnn 
 
 
LSTM implementation: http://apaszke.github.io/posts.html 
 

部分参考文献:

[High-way-lstm-1]High-way LSTM RNNS FOR Distant Speech Recognition.pdf : 访问密码 510b

[High-way-lstm-2]Character-Aware Neural Language Models.pdf  :访问密码 510b

神经网络课件:NN-Lectures:CSC321 Winter 2015 Introduction to Neural Networks:访问密码 0442

三、我的学习计划如下:

1、2015.12.23、24,28-30;2016.1.3、4(一周时间)————理解LSTM的基本概念、原理与相关应用
  (1)结合NN-lectures课件和以下网址看BP算法,了解其原理:(2015.12.23、24)
 
                                 
      Principles of training multi-layer neural network using backpropagation                                       
  (2)理解LSTM的基本概念、原理:(12.28~31)
 
 
      LSTM implementation: http://apaszke.github.io/posts.html   (译文)    
 
      
      深入浅出LSTM神经网络:http://www.csdn.net/article/2015-06-05/2824880
 
      Learning to read with recurrent neural networks(博士生Zachary Chase Lipton)
 
      顺便理解一下RNN,Andrej Karpathy写了篇非常棒的博客:递归神经网络不可思议的有效性英文原版
 
(3)了解LSTM的应用:(2016.1.3、4)

 目前了解到的LSTM应用大概有以下几个:
 
来自知乎:http://www.zhihu.com/question/37082800/answer/70333603

(1) Language Model
The Unreasonable Effectiveness of Recurrent Neural Networks

(2) Image Captioning
[CVPR15]]Long-term Recurrent Convolutional Networks for Visual Recognition and Description
Deep Visual-Semantic Alignments for Generating Image Descriptions

(3)Speech Recognition

(4)Machine Translation
[NIPS15]Sequence to Sequence Learning with Neural Networks.

 
2、2016.1.5-2016.1.19 ————剖析LSTM的代码实现,动手编程序,并写一篇总结日志,发布到CSDN上:
 
    2016.1.5-2016.1.10 ——Basic LSTM (LUA) https://github.com/wojzaremba/lstm    
       https://github.com/bgshih/crnn
 
       学LUA:(在线学习手册):http://manual.luaer.cn/
        关于LUA闭包的解释:http://www.2cto.com/kf/201503/382691.html
 
    2016.1.11-2016.1.18 ——Basic LSTM by Torch (LUA) https://github.com/karpathy/char-rnn 
 
    2016.1.19 ——写一篇总结日志,发布到CSDN上
 
 *******************************************************************
   

 非学习时间:2016.1.19-2.22寒假回家,暂定每周两天时间看看论文
 {
    2016.1.19寒假回家!
  
    提高time:健身、读书【写读后感】、写日志【完成日志《保研之路》,分享到保研论坛】
 }

 

 *******************************************************************
 
 
3、2016.2.15-2016.2.27 ————理解深度学习中Highway的思想,以及如何在LSTM中实现Highway
 
 
 2016.2.28-2016.2.29 ——写一篇总结日志,发布到CSDN上
 
4、2016.3.1-2016.3.29 ————剖析Highway-LSTM代码
 
  Highway LSTM by Torch (LUA) https://github.com/yoonkim/lstm-char-cnn 
 
 2016.3.30-2016.3.31 ——写一篇总结日志,发布到CSDN上
 
5、2016.4.1-2016.4.30 ————选择一个应用,进行验证
    
 
 先做出来,再看应用吧。。

LSTM与Highway-LSTM算法实现的研究概述的更多相关文章

  1. Highway LSTM 学习笔记

    Highway LSTM 学习笔记 zoerywzhou@gmail.com http://www.cnblogs.com/swje/ 作者:Zhouwan  2016-4-5   声明 1)该Dee ...

  2. 理解LSTM网络--Understanding LSTM Networks(翻译一篇colah's blog)

    colah的一篇讲解LSTM比较好的文章,翻译过来一起学习,原文地址:http://colah.github.io/posts/2015-08-Understanding-LSTMs/ ,Posted ...

  3. LSTM和双向LSTM讲解及实践

    LSTM和双向LSTM讲解及实践 目录 RNN的长期依赖问题LSTM原理讲解双向LSTM原理讲解Keras实现LSTM和双向LSTM 一.RNN的长期依赖问题 在上篇文章中介绍的循环神经网络RNN在训 ...

  4. 使用Keras进行深度学习:(六)LSTM和双向LSTM讲解及实践

    欢迎大家关注我们的网站和系列教程:http://www.tensorflownews.com/,学习更多的机器学习.深度学习的知识! 介绍 长短期记忆(Long Short Term Memory, ...

  5. DNA甲基化研究概述

    DNA甲基化研究概述 生信技能树 已关注 2018.01.23 11:43 字数 993 阅读 183评论 0喜欢 1 DNA甲基化(DNA methylation)是最早被研究的重要表观遗传修饰之一 ...

  6. PaddlePaddle︱开发文档中学习情感分类(CNN、LSTM、双向LSTM)、语义角色标注

    PaddlePaddle出教程啦,教程一部分写的很详细,值得学习. 一期涉及新手入门.识别数字.图像分类.词向量.情感分析.语义角色标注.机器翻译.个性化推荐. 二期会有更多的图像内容. 随便,帮国产 ...

  7. SSE图像算法优化系列二十四: 基于形态学的图像后期抗锯齿算法--MLAA优化研究。

    偶尔看到这样的一个算法,觉得还是蛮有意思的,花了将近10天多的时间研究了下相关代码. 以下为百度的结果:MLAA全称Morphological Antialiasing,意为形态抗锯齿是AMD推出的完 ...

  8. 【uva 1615】Highway(算法效率--贪心 区间选点问题)

    题意:给定平面上N个点和一个值D,要求在x轴上选出尽量少的点,使得对于给定的每个店,都有一个选出的点离它的欧几里德距离不超过D. 解法:先把问题转换成模型,把对平面的点满足条件的点在x轴的直线上可得到 ...

  9. 对A-Star寻路算法的粗略研究

    首先来看看完成后的效果: 其中灰色代表路障,绿色是起点和移动路径,红色代表终点   // = openArray[i+1].F) { minNode = openArray[i+1]; } } sta ...

随机推荐

  1. JavaWeb—Servlet

    1.什么是Servlet 用来扩展web服务器功能的组件——早期的web服务器只能处理静态资源的请求,即需要事先将html文件准备好,并存放到web服务器上面.不能够处理动态资源的请求(需要计算,动态 ...

  2. ABAP rfc 发布webservice 错误

    一.SICF 测试服务报错: 哎呀,找不到网页! 网站在检索此网址时出现错误.托管此网站的服务器可能关闭进行维护或配置不正确. HTTP ERROR 500

  3. 2015.7.16(小高开忍住没有减仓,大盘涨3.5%,百股涨停——买进中重、中航,指导WXL错误)

    1.大智慧轻微高开,按照昨天总结的震荡行情指导操作(pic1) a.震荡行情,开盘5分钟的走势不能指导操作, b.操作一定要等到2峰2谷出现后再做!开盘价不能作为峰.谷! c.只有当通道出现2.0%以 ...

  4. Git配置出现的问题

    git是代码版本同步工具,适用于团队开发,进公司第一堂课就是配置Git.接下来就把其中遇到的问题记录一下,与大家共享一下. 首先,在Bitbucket上注册账户,之后给管理员说一下,让他邀请你加入开发 ...

  5. HTML学习笔记(下)

    表格标签 <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3 ...

  6. 建议13:使用Python模块re实现解析小工具

    # -*- coding:utf-8 -*- # ''' Python re 的主要功能: re.compile(pattern[, flags]) 把正则表达式的模式和标识转化成正则表达式对象,供 ...

  7. 一个由自增运算符以及C语法顺序细节引起的bug

     一.问题描述 在编写modbus代码时发生一件由语法细节引起的bug,起因是自增运算符以及C语法顺序. 输入的数据是2233=0X08B9,高低字节顺序是0x08 0xB9, 使用modbus po ...

  8. 【Flask】Sqlalchemy lazy

    ### 懒加载:在一对多,或者多对多的时候,如果想要获取多的这一部分的数据的时候,往往能通过一个属性就可以全部获取了.比如有一个作者,想要或者这个作者的所有文章,那么可以通过user.articles ...

  9. jQuery之DOM操作大全

    jQuery属性操作 获取元素属性的语法:attr(name) 例子:$("#img1").attr("src"); 设置元素单个属性的语法:attr(key, ...

  10. Eclipse SVN插件设置

    项目开发中,开发人员用SVN来管理代码,在和服务器同步时,需要避免上传不必要的一些编译文件,如.class,.log,target等文件,这里需要设置同步选项. 打开Eclipse ---> W ...