TDNN模型示例

TDNN拼帧:

层:(0,3)

层:(-9,0)

层:(0,3)

层:(-6,0)

层:(0,3)

层:(-3,0)

层:(0,3)

层:(-3,0)

 
 

输出依赖

帧,各层需要的帧的时间索引如下:

层:1,4

层:-9,-6,1,4

层:-9,-6,1,4,7

层:-15,-12,-9,-6,-3,1,4,7

层:-15,-12,-9,-6,-3,1,4,7,10

层:-18,-15,-12,-9,-6,-3,1,4,7,10

层:-18,-15,-12,-9,-6,-3,1,4,7,10,13

层:-21,-18,-15,-12,-9,-6,-3,1,4,7,10,13

 
 

 
 

帧,各层需要的帧的时间索引如下:

层:2,5

...

层:-20,-17,-14,-11,-8,-5,-2,2,5,8,11,14

 
 

帧,各层需要的帧的时间索引如下:

层:3,6

...

层:-19,-16,-13,-10,-7,-4,-1,3,6,9,11,15

帧,各层需要的帧的时间索引如下:

层:4,7

...

层:-18,-15,-12,-9,-6,-3,1,4,7,10,13,16

 
 

TDNN的拼帧索引

 
 

第一层不需要受到此限制

层:(0,3)

层:(-9,0)

层:(0,3)

层:(-6,0)

层:(0,3)

层:(-3,0)

层:(0,3)

层:(-3,0)

层:(-2,-1,0,1,2)

 
 

LSTM的延时

与TDNN类似,单向LSTM依赖于历史信息,双向LSTM(BLSTM)依赖于历史信息与未来信息

信息包括
记忆(Cell)与输出(Recurrent)

 
 

默认情况下,对于长度为T帧的语句,在t时刻:

LSTM依赖于

t时刻上一层的输出

BLSTM依赖于

t时刻上一层的输出

那么,在t-1时刻:

LSTM依赖于

t-1时刻上一层的输出

BLSTM依赖于

t-1时刻上一层的输出

依此类推:

LSTM将依赖于所有的历史信息

BLSTM将依赖于所有的信息(历史信息+未来信息)

也就是说,所有帧(T帧)都需要进行LSTM计算

Chain TDNN/LSTM的拼帧索引、延时的更多相关文章

  1. (转)FFMPEG解码H264拼帧简解

    http://blog.csdn.net/ikevin/article/details/7649095 H264的I帧通常 0x00 0x00 0x00 0x01 0x67 开始,到下一个帧头开始之前 ...

  2. linux 串口 拼帧处理

    串口每次read数据可能不是完整的数据,参照网上的代码,写了拼帧的代码#include <stdio.h> #include <termios.h> #include < ...

  3. android 通过帧动画方式播放Gif动画

    注意:经过本人测试,这个方法很耗内存, 图片一多就崩了.慎用 <1>用工具(photoshop或者FireWorks)将GIF动画图片分解成多个GIF静态图片,然后保存在res\drawa ...

  4. 第二周02:Fusion ICP逐帧融合

    本周主要任务02:Fusion 使用ICP进行逐帧融合 任务时间: 2014年9月8日-2014年9月14日 任务完成情况: 已实现将各帧融合到统一的第一帧所定义的摄像机坐标系下,但是由于部分帧之间的 ...

  5. RS-485半双工延时问题

    学习485总线时,遇到延时问题,困扰很久.通过学习知道了485半双工收发时必须延时,以保证系统的稳定性.可靠性.好多资料都介绍了485 防静电.抗干扰电路.惟独没提 每一帧收发停止位(或第9位)的延时 ...

  6. nnet3中的数据类型

    目标与背景 之前的nnet1和nnet2基于Component对象,是一个组件的堆栈.每个组件对应一个神经网络层,为简便起见,将一个仿射变换后接一个非线性表示为一层网络,因此每层网络有两个组件.这些旧 ...

  7. uvc摄像头代码解析7

    13.uvc视频初始化 13.1 uvc数据流控制 struct uvc_streaming_control { __u16 bmHint; __u8 bFormatIndex; //视频格式索引 _ ...

  8. 信号为E时,如何让语音识别脱“网”而出?

    欢迎大家前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~ 本文由腾讯教育云发表于云+社区专栏 一般没有网络时,语音识别是这样的 ▽ 而同等环境下,嵌入式语音识别,是这样的 ▽ 不仅可以帮您边说边识. ...

  9. LTE 测试文档(翻译)

    Testing Documentation 翻译 (如有不当的地方,欢迎指正!)     1 概述   为了测试和验证 ns-3 LTE 模块,文档提供了几个 test suites (集成在 ns- ...

随机推荐

  1. DEV SIT UAT PET SIM PRD PROD常见环境英文缩写含义

    英文缩写 英文 中文 DEV development 开发 SIT System Integrate Test 系统整合测试(内测) UAT User Acceptance Test 用户验收测试 P ...

  2. [LeetCode] 8. 字符串转换整数 (atoi)

    题目链接:https://leetcode-cn.com/problems/string-to-integer-atoi/ 题目描述: 请你来实现一个 atoi 函数,使其能将字符串转换成整数. 首先 ...

  3. exgcd

    int exgcd(int a,int b,int &x,int &y){ if (b==0){ x=1,y=0; return a; } int d=exgcd(b,a%b,y,x) ...

  4. MongoDB 创建基础索引、组合索引、唯一索引以及优化

    一.索引 MongoDB 提供了多样性的索引支持,索引信息被保存在system.indexes 中,且默认总是为_id创建索引,它的索引使用基本和MySQL 等关系型数据库一样.其实可以这样说说,索引 ...

  5. CentOS7.5脱机安装SQL Server 2017(NEW)

    发现搜到的都是在线下载安装的,都是只安装了mssql-server服务,没有mssql-server-agent服务.还以为linux下mssql没有agent服务呢.一番测试发现可以脱机安装,但是能 ...

  6. jeecg字典表—普通表

    创建普通表 同步数据库(创建对应的表) 验证功能效果 添加用户表,并添加对应的级别属性 同步用户表 字典功能测试 然后生成最新代码,添加到菜单即可

  7. 599. Minimum Index Sum of Two Lists(easy)

    Suppose Andy and Doris want to choose a restaurant for dinner, and they both have a list of favorite ...

  8. Python 中关于 round 函数的坑

    round函数很简单(而且不需要引入math模块),对浮点数进行近似取值,保留几位小数. 比如 # -*- coding: UTF-8 -*- r1=round(12.12345,3) r2=roun ...

  9. jQuery 事件对象的属性

    jQuery 在遵循 W3C 规范的情况下,对事件对象的常用属性进行了封装,使得事件处理在各大浏览器下都可以正常运行而不需要进行浏览器类型判断. (1) event.type 该方法的作用是可以获取到 ...

  10. ABP项目启动及源代码结构

    在整体介绍ABP项目之前我们需要从官方网站下载模板项目,下载以后放到一个本地目录下,启动VS打开源代码.具体下载的步骤如下: 一   创建ABP项目模板 1 进入官方网站然后选择特定的样板项目. 2 ...