LSTM与Highway-LSTM算法实现的研究概述

zoerywzhou@gmail.com

http://www.cnblogs.com/swje/

作者:Zhouwan

 2015-12-22

 

声明:

1)该LSTM的学习系列是整理自网上很多大牛和机器学习专家所无私奉献的资料的。具体引用的资料请看参考文献。具体的版本声明也参考原文献。

2)本文仅供学术交流,非商用。所以每一部分具体的参考资料并没有详细对应。如果某部分不小心侵犯了大家的利益,还望海涵,并联系博主删除。

3)本人才疏学浅,整理总结的时候难免出错,还望各位前辈不吝指正,谢谢。

请联系:zoerywzhou@gmail.com 或13813017783@163.com

 
本研究课题系本人本科毕业设计,开题报告初步确定,后面会实时更新,希望能与大家相互交流,共同进步!
 
一、研究计划: 
 
1、理解LSTM的基本概念、原理与相关应用
2、剖析LSTM的代码实现
3、理解深度学习中Highway的思想,以及如何在LSTM中实现Highway
4、剖析Highway-LSTM代码
5、选择一个应用,进行验证
 
定期(每隔一月)对算法剖析的进展做总结,目标在3月底,完全掌握LSTM的代码与算法。
 
二、以下为部分学习资料的链接:
 
Github上的资源:
 
 
Basic LSTM by Torch (LUA) https://github.com/karpathy/char-rnn 
 
Highway LSTM by Torch (LUA) https://github.com/yoonkim/lstm-char-cnn 
 
 
LSTM implementation: http://apaszke.github.io/posts.html 
 

部分参考文献:

[High-way-lstm-1]High-way LSTM RNNS FOR Distant Speech Recognition.pdf : 访问密码 510b

[High-way-lstm-2]Character-Aware Neural Language Models.pdf  :访问密码 510b

神经网络课件:NN-Lectures:CSC321 Winter 2015 Introduction to Neural Networks:访问密码 0442

三、我的学习计划如下:

1、2015.12.23、24,28-30;2016.1.3、4(一周时间)————理解LSTM的基本概念、原理与相关应用
  (1)结合NN-lectures课件和以下网址看BP算法,了解其原理:(2015.12.23、24)
 
                                 
      Principles of training multi-layer neural network using backpropagation                                       
  (2)理解LSTM的基本概念、原理:(12.28~31)
 
 
      LSTM implementation: http://apaszke.github.io/posts.html   (译文)    
 
      
      深入浅出LSTM神经网络:http://www.csdn.net/article/2015-06-05/2824880
 
      Learning to read with recurrent neural networks(博士生Zachary Chase Lipton)
 
      顺便理解一下RNN,Andrej Karpathy写了篇非常棒的博客:递归神经网络不可思议的有效性英文原版
 
(3)了解LSTM的应用:(2016.1.3、4)

 目前了解到的LSTM应用大概有以下几个:
 
来自知乎:http://www.zhihu.com/question/37082800/answer/70333603

(1) Language Model
The Unreasonable Effectiveness of Recurrent Neural Networks

(2) Image Captioning
[CVPR15]]Long-term Recurrent Convolutional Networks for Visual Recognition and Description
Deep Visual-Semantic Alignments for Generating Image Descriptions

(3)Speech Recognition

(4)Machine Translation
[NIPS15]Sequence to Sequence Learning with Neural Networks.

 
2、2016.1.5-2016.1.19 ————剖析LSTM的代码实现,动手编程序,并写一篇总结日志,发布到CSDN上:
 
    2016.1.5-2016.1.10 ——Basic LSTM (LUA) https://github.com/wojzaremba/lstm    
       https://github.com/bgshih/crnn
 
       学LUA:(在线学习手册):http://manual.luaer.cn/
        关于LUA闭包的解释:http://www.2cto.com/kf/201503/382691.html
 
    2016.1.11-2016.1.18 ——Basic LSTM by Torch (LUA) https://github.com/karpathy/char-rnn 
 
    2016.1.19 ——写一篇总结日志,发布到CSDN上
 
 *******************************************************************
   

 非学习时间:2016.1.19-2.22寒假回家,暂定每周两天时间看看论文
 {
    2016.1.19寒假回家!
  
    提高time:健身、读书【写读后感】、写日志【完成日志《保研之路》,分享到保研论坛】
 }

 

 *******************************************************************
 
 
3、2016.2.15-2016.2.27 ————理解深度学习中Highway的思想,以及如何在LSTM中实现Highway
 
 
 2016.2.28-2016.2.29 ——写一篇总结日志,发布到CSDN上
 
4、2016.3.1-2016.3.29 ————剖析Highway-LSTM代码
 
  Highway LSTM by Torch (LUA) https://github.com/yoonkim/lstm-char-cnn 
 
 2016.3.30-2016.3.31 ——写一篇总结日志,发布到CSDN上
 
5、2016.4.1-2016.4.30 ————选择一个应用,进行验证
    
 
 先做出来,再看应用吧。。

LSTM与Highway-LSTM算法实现的研究概述的更多相关文章

  1. Highway LSTM 学习笔记

    Highway LSTM 学习笔记 zoerywzhou@gmail.com http://www.cnblogs.com/swje/ 作者:Zhouwan  2016-4-5   声明 1)该Dee ...

  2. 理解LSTM网络--Understanding LSTM Networks(翻译一篇colah's blog)

    colah的一篇讲解LSTM比较好的文章,翻译过来一起学习,原文地址:http://colah.github.io/posts/2015-08-Understanding-LSTMs/ ,Posted ...

  3. LSTM和双向LSTM讲解及实践

    LSTM和双向LSTM讲解及实践 目录 RNN的长期依赖问题LSTM原理讲解双向LSTM原理讲解Keras实现LSTM和双向LSTM 一.RNN的长期依赖问题 在上篇文章中介绍的循环神经网络RNN在训 ...

  4. 使用Keras进行深度学习:(六)LSTM和双向LSTM讲解及实践

    欢迎大家关注我们的网站和系列教程:http://www.tensorflownews.com/,学习更多的机器学习.深度学习的知识! 介绍 长短期记忆(Long Short Term Memory, ...

  5. DNA甲基化研究概述

    DNA甲基化研究概述 生信技能树 已关注 2018.01.23 11:43 字数 993 阅读 183评论 0喜欢 1 DNA甲基化(DNA methylation)是最早被研究的重要表观遗传修饰之一 ...

  6. PaddlePaddle︱开发文档中学习情感分类(CNN、LSTM、双向LSTM)、语义角色标注

    PaddlePaddle出教程啦,教程一部分写的很详细,值得学习. 一期涉及新手入门.识别数字.图像分类.词向量.情感分析.语义角色标注.机器翻译.个性化推荐. 二期会有更多的图像内容. 随便,帮国产 ...

  7. SSE图像算法优化系列二十四: 基于形态学的图像后期抗锯齿算法--MLAA优化研究。

    偶尔看到这样的一个算法,觉得还是蛮有意思的,花了将近10天多的时间研究了下相关代码. 以下为百度的结果:MLAA全称Morphological Antialiasing,意为形态抗锯齿是AMD推出的完 ...

  8. 【uva 1615】Highway(算法效率--贪心 区间选点问题)

    题意:给定平面上N个点和一个值D,要求在x轴上选出尽量少的点,使得对于给定的每个店,都有一个选出的点离它的欧几里德距离不超过D. 解法:先把问题转换成模型,把对平面的点满足条件的点在x轴的直线上可得到 ...

  9. 对A-Star寻路算法的粗略研究

    首先来看看完成后的效果: 其中灰色代表路障,绿色是起点和移动路径,红色代表终点   // = openArray[i+1].F) { minNode = openArray[i+1]; } } sta ...

随机推荐

  1. Zookeeper配置说明

    转载自:https://my.oschina.net/u/2338362/blog/399361 Zookeeper的安装和配置十分简单, 既可以配置成单机模式, 也可以配置成集群模式. 下面将分别进 ...

  2. mysql数据库补充知识7 索引原理与慢查询优化

    一 介绍 为何要有索引? 一般的应用系统,读写比例在10:1左右,而且插入操作和一般的更新操作很少出现性能问题,在生产环境中,我们遇到最多的,也是最容易出问题的,还是一些复杂的查询操作,因此对查询语句 ...

  3. 剑指offer 面试40题

    面试40题: 题目:最小的k个数 题:输入n个整数,找出其中最小的K个数.例如输入4,5,1,6,2,7,3,8这8个数字,则最小的4个数字是1,2,3,4,. 解题代码一: # -*- coding ...

  4. 2015.7.7——跌停板做T,就算要搏跌停反弹也要看卖一档压力啊

    1.今天中色股份和以往不同买卖盘为正!————今天要重新观察这种新常态下的盘面运作 是否会出现如2015.7.6中描述的“前期错过了皮城中的黄金买点,...其实只要买卖盘为负,后期还会有再次尝试该低点 ...

  5. LeetCode:对角线遍历【498】

    LeetCode:对角线遍历[498] 题目描述 给定一个含有 M x N 个元素的矩阵(M 行,N 列),请以对角线遍历的顺序返回这个矩阵中的所有元素,对角线遍历如下图所示. 示例: 输入: [ [ ...

  6. javaweb学习纲要

    Java Web  概述 大纲: 1.C/S体系结构 2.B/S体系机构 3.两种体系结构比较 4.主流的Web程序应用平台 5.java web学习路线图 1.C/S体系结构 C/S是Client/ ...

  7. php 跨域 form提交 2种方法

    出于安全因素考虑,直接跨域访问是不允许的,下面介绍二种跨域的方法. 一,通过php curl function curlPost($url,$params) { $postData = ''; for ...

  8. iOS NSCoding 的学习 和 使用

    起初接触的轻量级 物理存储 方式 是 plist  可以存储 系统级别的 字典 数组   但是不能存储自定义的对象类 那会 用自定义对象做存储的 需求也不大 主要 是 还没建立面向对象意识,会的也少. ...

  9. OC源文件扩展名

    常见的文件扩展名 扩展名 含义 扩展名 含义 .c C语言源文件 .mm Objective-C++源文件 .cc..cpp C++源文件 .pl Perl源文件 .h 头文件 .o Object(编 ...

  10. PMON使用手册

    转:http://www.docin.com/p-1949877603.html