LSTM与Highway-LSTM算法实现的研究概述

zoerywzhou@gmail.com

http://www.cnblogs.com/swje/

作者:Zhouwan

 2015-12-22

 

声明:

1)该LSTM的学习系列是整理自网上很多大牛和机器学习专家所无私奉献的资料的。具体引用的资料请看参考文献。具体的版本声明也参考原文献。

2)本文仅供学术交流,非商用。所以每一部分具体的参考资料并没有详细对应。如果某部分不小心侵犯了大家的利益,还望海涵,并联系博主删除。

3)本人才疏学浅,整理总结的时候难免出错,还望各位前辈不吝指正,谢谢。

请联系:zoerywzhou@gmail.com 或13813017783@163.com

 
本研究课题系本人本科毕业设计,开题报告初步确定,后面会实时更新,希望能与大家相互交流,共同进步!
 
一、研究计划: 
 
1、理解LSTM的基本概念、原理与相关应用
2、剖析LSTM的代码实现
3、理解深度学习中Highway的思想,以及如何在LSTM中实现Highway
4、剖析Highway-LSTM代码
5、选择一个应用,进行验证
 
定期(每隔一月)对算法剖析的进展做总结,目标在3月底,完全掌握LSTM的代码与算法。
 
二、以下为部分学习资料的链接:
 
Github上的资源:
 
 
Basic LSTM by Torch (LUA) https://github.com/karpathy/char-rnn 
 
Highway LSTM by Torch (LUA) https://github.com/yoonkim/lstm-char-cnn 
 
 
LSTM implementation: http://apaszke.github.io/posts.html 
 

部分参考文献:

[High-way-lstm-1]High-way LSTM RNNS FOR Distant Speech Recognition.pdf : 访问密码 510b

[High-way-lstm-2]Character-Aware Neural Language Models.pdf  :访问密码 510b

神经网络课件:NN-Lectures:CSC321 Winter 2015 Introduction to Neural Networks:访问密码 0442

三、我的学习计划如下:

1、2015.12.23、24,28-30;2016.1.3、4(一周时间)————理解LSTM的基本概念、原理与相关应用
  (1)结合NN-lectures课件和以下网址看BP算法,了解其原理:(2015.12.23、24)
 
                                 
      Principles of training multi-layer neural network using backpropagation                                       
  (2)理解LSTM的基本概念、原理:(12.28~31)
 
 
      LSTM implementation: http://apaszke.github.io/posts.html   (译文)    
 
      
      深入浅出LSTM神经网络:http://www.csdn.net/article/2015-06-05/2824880
 
      Learning to read with recurrent neural networks(博士生Zachary Chase Lipton)
 
      顺便理解一下RNN,Andrej Karpathy写了篇非常棒的博客:递归神经网络不可思议的有效性英文原版
 
(3)了解LSTM的应用:(2016.1.3、4)

 目前了解到的LSTM应用大概有以下几个:
 
来自知乎:http://www.zhihu.com/question/37082800/answer/70333603

(1) Language Model
The Unreasonable Effectiveness of Recurrent Neural Networks

(2) Image Captioning
[CVPR15]]Long-term Recurrent Convolutional Networks for Visual Recognition and Description
Deep Visual-Semantic Alignments for Generating Image Descriptions

(3)Speech Recognition

(4)Machine Translation
[NIPS15]Sequence to Sequence Learning with Neural Networks.

 
2、2016.1.5-2016.1.19 ————剖析LSTM的代码实现,动手编程序,并写一篇总结日志,发布到CSDN上:
 
    2016.1.5-2016.1.10 ——Basic LSTM (LUA) https://github.com/wojzaremba/lstm    
       https://github.com/bgshih/crnn
 
       学LUA:(在线学习手册):http://manual.luaer.cn/
        关于LUA闭包的解释:http://www.2cto.com/kf/201503/382691.html
 
    2016.1.11-2016.1.18 ——Basic LSTM by Torch (LUA) https://github.com/karpathy/char-rnn 
 
    2016.1.19 ——写一篇总结日志,发布到CSDN上
 
 *******************************************************************
   

 非学习时间:2016.1.19-2.22寒假回家,暂定每周两天时间看看论文
 {
    2016.1.19寒假回家!
  
    提高time:健身、读书【写读后感】、写日志【完成日志《保研之路》,分享到保研论坛】
 }

 

 *******************************************************************
 
 
3、2016.2.15-2016.2.27 ————理解深度学习中Highway的思想,以及如何在LSTM中实现Highway
 
 
 2016.2.28-2016.2.29 ——写一篇总结日志,发布到CSDN上
 
4、2016.3.1-2016.3.29 ————剖析Highway-LSTM代码
 
  Highway LSTM by Torch (LUA) https://github.com/yoonkim/lstm-char-cnn 
 
 2016.3.30-2016.3.31 ——写一篇总结日志,发布到CSDN上
 
5、2016.4.1-2016.4.30 ————选择一个应用,进行验证
    
 
 先做出来,再看应用吧。。

LSTM与Highway-LSTM算法实现的研究概述的更多相关文章

  1. Highway LSTM 学习笔记

    Highway LSTM 学习笔记 zoerywzhou@gmail.com http://www.cnblogs.com/swje/ 作者:Zhouwan  2016-4-5   声明 1)该Dee ...

  2. 理解LSTM网络--Understanding LSTM Networks(翻译一篇colah's blog)

    colah的一篇讲解LSTM比较好的文章,翻译过来一起学习,原文地址:http://colah.github.io/posts/2015-08-Understanding-LSTMs/ ,Posted ...

  3. LSTM和双向LSTM讲解及实践

    LSTM和双向LSTM讲解及实践 目录 RNN的长期依赖问题LSTM原理讲解双向LSTM原理讲解Keras实现LSTM和双向LSTM 一.RNN的长期依赖问题 在上篇文章中介绍的循环神经网络RNN在训 ...

  4. 使用Keras进行深度学习:(六)LSTM和双向LSTM讲解及实践

    欢迎大家关注我们的网站和系列教程:http://www.tensorflownews.com/,学习更多的机器学习.深度学习的知识! 介绍 长短期记忆(Long Short Term Memory, ...

  5. DNA甲基化研究概述

    DNA甲基化研究概述 生信技能树 已关注 2018.01.23 11:43 字数 993 阅读 183评论 0喜欢 1 DNA甲基化(DNA methylation)是最早被研究的重要表观遗传修饰之一 ...

  6. PaddlePaddle︱开发文档中学习情感分类(CNN、LSTM、双向LSTM)、语义角色标注

    PaddlePaddle出教程啦,教程一部分写的很详细,值得学习. 一期涉及新手入门.识别数字.图像分类.词向量.情感分析.语义角色标注.机器翻译.个性化推荐. 二期会有更多的图像内容. 随便,帮国产 ...

  7. SSE图像算法优化系列二十四: 基于形态学的图像后期抗锯齿算法--MLAA优化研究。

    偶尔看到这样的一个算法,觉得还是蛮有意思的,花了将近10天多的时间研究了下相关代码. 以下为百度的结果:MLAA全称Morphological Antialiasing,意为形态抗锯齿是AMD推出的完 ...

  8. 【uva 1615】Highway(算法效率--贪心 区间选点问题)

    题意:给定平面上N个点和一个值D,要求在x轴上选出尽量少的点,使得对于给定的每个店,都有一个选出的点离它的欧几里德距离不超过D. 解法:先把问题转换成模型,把对平面的点满足条件的点在x轴的直线上可得到 ...

  9. 对A-Star寻路算法的粗略研究

    首先来看看完成后的效果: 其中灰色代表路障,绿色是起点和移动路径,红色代表终点   // = openArray[i+1].F) { minNode = openArray[i+1]; } } sta ...

随机推荐

  1. final 变量

    一.final对象 使用final关键字修饰一个变量时,是指引用不能变,引用的对象中的内容还是可以改变的.例如,对于如下语句: final StringBuffer a=new StringBuffe ...

  2. GAN综述

    生成式对抗模型GAN (Generativeadversarial networks) 是Goodfellow等[1]在 2014年提出的一种生成式模型,目前已经成为人工智能学界一个热门的研究方向,著 ...

  3. Django CSRF 原理分析

    原文链接: https://blog.csdn.net/u011715678/article/details/48752873 参考链接:https://blog.csdn.net/clark_fit ...

  4. MySQL数据库(9)_MySQL数据库常用操作命令

    注:刚安装好的MySql包含一个含空密码的root帐户和一个匿名帐户,这是很大的安全隐患,对于一些重要的应用我们应将安全性尽可能提高,在这里应把匿名帐户删除. root帐户设置密码,可用如下命令进行: ...

  5. jQuery:自学笔记(5)——Ajax

    jQuery:自学笔记(5)——Ajax 使用Ajax快捷函数 说明 出于简化AJAX开发工作的流程,jQuery提供了若干了快捷函数. 实例 1.显示 test.php 返回值(HTML 或 XML ...

  6. Ubuntu 16.04 php卸载

    1.卸载 apache2 sudo apt-get --purge remove apache2* sudo apt-get autoremove apache2 (--purge 是完全删除并且不保 ...

  7. $UML统一建模语言简介

    (一)UML概述 1.面向对象软件开发的过程: (1)OOA(面向对象分析):建立分析模型并文档化. (2)OOD(面向对象设计):用面向对象思想对OOA的结果进行细化,得出设计模型. (3)OOP( ...

  8. Python与硬件学习笔记:蜂鸣器(转)

    相信大家对蜂鸣器都不会陌生,很多产品和方案中都会用到蜂鸣器,大部分都是使用蜂鸣器来做提示或报警,比如按键按下.开始工作.工作结束或是故障等等.这里对单片机在蜂鸣器驱动上的应用作一下描述. 蜂鸣器的介绍 ...

  9. Django框架之cookie和session及开发登录功能

    1.cookie是什么? Web应用程序是使用HTTP协议传输数据的.HTTP协议是无状态的协议.一旦数据交换完毕,客户端与服务器端的连接就会关闭,再次交换数据需要建立新的连接.这就意味着服务器无法从 ...

  10. 20145240 《Java程序设计》第二次实验报告

    20145240 <Java程序设计>第二次实验报告 北京电子科技学院(BESTI)实验报告 课程:Java程序设计 班级:1452 指导教师:娄嘉鹏 实验日期:2016.04.12 实验 ...