TDNN模型示例

TDNN拼帧:

层:(0,3)

层:(-9,0)

层:(0,3)

层:(-6,0)

层:(0,3)

层:(-3,0)

层:(0,3)

层:(-3,0)

 
 

输出依赖

帧,各层需要的帧的时间索引如下:

层:1,4

层:-9,-6,1,4

层:-9,-6,1,4,7

层:-15,-12,-9,-6,-3,1,4,7

层:-15,-12,-9,-6,-3,1,4,7,10

层:-18,-15,-12,-9,-6,-3,1,4,7,10

层:-18,-15,-12,-9,-6,-3,1,4,7,10,13

层:-21,-18,-15,-12,-9,-6,-3,1,4,7,10,13

 
 

 
 

帧,各层需要的帧的时间索引如下:

层:2,5

...

层:-20,-17,-14,-11,-8,-5,-2,2,5,8,11,14

 
 

帧,各层需要的帧的时间索引如下:

层:3,6

...

层:-19,-16,-13,-10,-7,-4,-1,3,6,9,11,15

帧,各层需要的帧的时间索引如下:

层:4,7

...

层:-18,-15,-12,-9,-6,-3,1,4,7,10,13,16

 
 

TDNN的拼帧索引

 
 

第一层不需要受到此限制

层:(0,3)

层:(-9,0)

层:(0,3)

层:(-6,0)

层:(0,3)

层:(-3,0)

层:(0,3)

层:(-3,0)

层:(-2,-1,0,1,2)

 
 

LSTM的延时

与TDNN类似,单向LSTM依赖于历史信息,双向LSTM(BLSTM)依赖于历史信息与未来信息

信息包括
记忆(Cell)与输出(Recurrent)

 
 

默认情况下,对于长度为T帧的语句,在t时刻:

LSTM依赖于

t时刻上一层的输出

BLSTM依赖于

t时刻上一层的输出

那么,在t-1时刻:

LSTM依赖于

t-1时刻上一层的输出

BLSTM依赖于

t-1时刻上一层的输出

依此类推:

LSTM将依赖于所有的历史信息

BLSTM将依赖于所有的信息(历史信息+未来信息)

也就是说,所有帧(T帧)都需要进行LSTM计算

Chain TDNN/LSTM的拼帧索引、延时的更多相关文章

  1. (转)FFMPEG解码H264拼帧简解

    http://blog.csdn.net/ikevin/article/details/7649095 H264的I帧通常 0x00 0x00 0x00 0x01 0x67 开始,到下一个帧头开始之前 ...

  2. linux 串口 拼帧处理

    串口每次read数据可能不是完整的数据,参照网上的代码,写了拼帧的代码#include <stdio.h> #include <termios.h> #include < ...

  3. android 通过帧动画方式播放Gif动画

    注意:经过本人测试,这个方法很耗内存, 图片一多就崩了.慎用 <1>用工具(photoshop或者FireWorks)将GIF动画图片分解成多个GIF静态图片,然后保存在res\drawa ...

  4. 第二周02:Fusion ICP逐帧融合

    本周主要任务02:Fusion 使用ICP进行逐帧融合 任务时间: 2014年9月8日-2014年9月14日 任务完成情况: 已实现将各帧融合到统一的第一帧所定义的摄像机坐标系下,但是由于部分帧之间的 ...

  5. RS-485半双工延时问题

    学习485总线时,遇到延时问题,困扰很久.通过学习知道了485半双工收发时必须延时,以保证系统的稳定性.可靠性.好多资料都介绍了485 防静电.抗干扰电路.惟独没提 每一帧收发停止位(或第9位)的延时 ...

  6. nnet3中的数据类型

    目标与背景 之前的nnet1和nnet2基于Component对象,是一个组件的堆栈.每个组件对应一个神经网络层,为简便起见,将一个仿射变换后接一个非线性表示为一层网络,因此每层网络有两个组件.这些旧 ...

  7. uvc摄像头代码解析7

    13.uvc视频初始化 13.1 uvc数据流控制 struct uvc_streaming_control { __u16 bmHint; __u8 bFormatIndex; //视频格式索引 _ ...

  8. 信号为E时,如何让语音识别脱“网”而出?

    欢迎大家前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~ 本文由腾讯教育云发表于云+社区专栏 一般没有网络时,语音识别是这样的 ▽ 而同等环境下,嵌入式语音识别,是这样的 ▽ 不仅可以帮您边说边识. ...

  9. LTE 测试文档(翻译)

    Testing Documentation 翻译 (如有不当的地方,欢迎指正!)     1 概述   为了测试和验证 ns-3 LTE 模块,文档提供了几个 test suites (集成在 ns- ...

随机推荐

  1. pytorch实现性别检测

    卷积神经网络的训练是耗时的,很多场合不可能每次都从随机初始化参数开始训练网络.   1.训练 pytorch中自带几种常用的深度学习网络预训练模型,如VGG.ResNet等.往往为了加快学习的进度,在 ...

  2. loss函数和cost函数

    loss函数指单个样本的预测值和真值的偏差 cost函数指整体样本的预测值和真值的偏差

  3. 理解MySQL数据库事务

    1. 什么是事务处理? 事务处理是一种机制,它是用来管理必须成批执行的mysql操作.来保证数据库不完整的操作结果. 2. 为什么要使用事务处理? 在使用mysql操作数据的过程中,如果只是简单的中小 ...

  4. PyInstaller Extractor安装和使用方法

    PyInstaller Extractor是可以提取出PyInstaller所创建的windows可执行文件的资源内容. 关于PyInstaller的介绍:PyInstaller安装使用方法 使用Py ...

  5. openstack第四章:neutron— 网络服务

    第四篇neutron— 网络服务 一.neutron 介绍:   Neutron 概述 传统的网络管理方式很大程度上依赖于管理员手工配置和维护各种网络硬件设备:而云环境下的网络已经变得非常复杂,特别是 ...

  6. Flask 快速使用 进阶—— (2)

    案例:可配置发送信息的系统 假如我们有这样的一个系统,可以发送短息,邮件和微信,后期可能还会增加一些平台,怎么才可以做到快速切换的去使用某种功能呢,在这里我会通过在配置文件中简单的配置就可以实现 在项 ...

  7. linux 运维工程师发展路线

    linux运维发展常见的就是下面两条路线:第一条:运维应用-->系统架构-->运维开发-->系统开发第二条:运维应用-->应用dba-->架构dba-->开发DBA ...

  8. T66099 小xzy的数对 题解

    T66099 小xzy的数对 题目背景 老师带同学参加表演,要求学生两两一组表演,但有些学生一起会发生冲突,现在老师想知道有多少组学生分到一起时不会发生冲突. 题目描述 学生发生冲突当且仅当他们身上的 ...

  9. 如何查看kernel社区的变更历史

    kernel社区稳定版本的地址为: https://git.kernel.org/pub/scm/linux/kernel/git/stable/linux.git/ 如果我们想查找某一个文件,比如 ...

  10. 七、Java多人博客系统-2.0版本-docker部署

    docker是当下很热门的技术,是对之前的部署系统方式的彻底改变.之前部署系统,需要安装数据库.初始化数据库,安装jdk,配置jdk,部署应用程序,修改配置文件等,很繁琐.一般现场运维人员很难搞定,现 ...