论文翻译——Lattice indexing for spoken term detection
第II节简要介绍与本文有关的先前工作
第III节介绍文中使用的定义以及术语
第IV节介绍如何从原始ASR lattices中生成倒排索引结构
第V节详细介绍了ASR结构以及实验使用的数据
第VI节提供了在一个大数据集之上,提出的倒排索引结构
的STD实验评估。
第VII节总结倒排索引结构的优点以及未来展望
IV 带权自动机的时间因子转换器
本节提出了一种为大数据集语料库构建时间索引的有效算法。在解决了[15]中的非确定性因子转换器相关的问题之后,我们提出了一种因子转换器结构——时间因子转换器
(TFT),弧(arc)的权重存储时间信息。为了便于比较,本文基于[2]进行开发。

Timed Factor Transducer of Weighted Automata
factor(因子,substring),子字符串,子串



为大语音数据集构造一种有效的时间系数的算法,提出了一种新的因子转换器结构——基于时间的因子转换器(TFT)。
问题在于如何创建一个基于时间的索引,可用于被这些自动机接收的任意字符串的任意因子的直接搜索。
核心想法是,通过带权有限状态转换器T将每个因子进行映射,因子的时间索引可以表示为:
- 该因子所属的多个自动机的集合;
- 因子在每个自动机中间隔的开始-结束时间;
- 在对应时间间隔中实际出现在对应自动机中的后验概率;
- 预处理:对每个输入自动机进行预处理,以获得一个后验Lattice,其中不重叠的弧集被分别标记;
- 构建时间因子转换器:对每个处理过的输入自动机中,构造一个能确切识别输入因子集的中间因子转换器;
- 因子选择:将这些中间因子转换器转换为确定性转换器,方法是用消歧符号对每个因子进行扩展,然后应用加权自动机优化;
- 在时间因子转换器中搜索:对这些确定性转换器进行合并、进一步优化,以获得整个数据集的确定性倒排索引。
以下详述算法的各个阶段
- 预处理

由[2]给出的算法为语句中出现的所有因子生成索引项(一个因子生成一个索引)。这是SUR(话语检索)问题的理想做法。对于STD(话语检测),我们希望为非重叠事件(occurrences)保留单独的索引项,以确保包含查询条件的确切时间间隔。这种分离可以通过对具有相同输入标签和重叠时间跨度的弧进行聚类来实现。
聚类算法如下。对于每个输入标签:
1)根据结束时间对收集的二元组(开始时间,结束时间)进行排序;
2)确定最大的一组不重叠的二元组(开始时间,结束时间)并将它们分配为簇头;
3)根据最大重叠分类剩余的弧。
示出了预处理算法对图1的自动机的应用。

预处理后:

- 构建时间因子转换器






- 因子生成。通常以以下方式对所有因子进行索引:
- 将每个弧的权重进行映射:















- 因子选择
除了通过对每一个因子进行分析,我们可以利用WFST形式的因子选择滤波来限制、转化或减少索引数。[2]介绍了应用于算法各个阶段的各种滤波器。每个滤波器都由算法过程中获得的一些自动机组成,以实现特定的滤波操作。一种这样的过滤器是将单词映射到音素序列的发音词典。 这个过滤器应用于词级lattice来获得音素级lattice。在我们的例子中,应用这样的过滤器可以保证相应的状态更新。另一个例子是限制因子数的简单语法。在因子生成步骤之后应用该过滤器,并删除语法不接受的因子。我们利用这种语法来拒绝静音符号,即,包括静音符号的因子未被索引。
- 在TFT(时间因子转换器)中进行搜索
用户查询通常是一个未加权的字符串,但它也可以是一个随机的自动加权自动机X,或者是可编译为自动机的布尔查询或者正则表达式的字符串。通过以下步骤得到对查询X的响应R的另一个自动机:
- 在输入端[22]对X与Y进行合成,并将得到的转换器投影到其输出标签上;


- 将因子转换器与修改的因子转换器进行对比
为了便于比较,图5(b)和(c)给出了从图1中的自动机中获得的FT [2]和MFT [15]。结构性来说,FT与TFFT十分类似。区别在于,FT没有储存任何时间信息。另一方面,MFT与FT或TFT相比,差异较大。TFT信息编码与输出标签 即非最终弧上的每个输出标签都表示一个时间间隔。 在第二节中,我们指出了与这两种结构有关的问题。 所提出的方法通过索引定时信息并为非重叠因子保留单独的条目 - 而不是用于FTFT的外部转换,从而缓解了FT的问题。另一方面,通过将定时信息嵌入到权重中来解决MFT的问题。除去群集中的消息之后,最终的TFT可以是 除了最后的过渡之外,它是完全确定的。 另外请注意,我们不再有量化问题,这是量化标签时间的产品。
论文翻译——Lattice indexing for spoken term detection的更多相关文章
- 深度学习论文翻译解析(四):Faster R-CNN: Down the rabbit hole of modern object detection
论文标题:Faster R-CNN: Down the rabbit hole of modern object detection 论文作者:Zhi Tian , Weilin Huang, Ton ...
- 深度学习论文翻译解析(七):Support Vector Method for Novelty Detection
论文标题:Support Vector Method for Novelty Detection 论文作者:Bernhard Scholkopf, Robert Williamson, Alex Sm ...
- 深度学习论文翻译解析(八):Rich feature hierarchies for accurate object detection and semantic segmentation
论文标题:Rich feature hierarchies for accurate object detection and semantic segmentation 标题翻译:丰富的特征层次结构 ...
- 深度学习论文翻译解析(十一):OverFeat: Integrated Recognition, Localization and Detection using Convolutional Networks
论文标题:OverFeat: Integrated Recognition, Localization and Detection using Convolutional Networks 标题翻译: ...
- 深度学习论文翻译解析(十三):Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks
论文标题:Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 标题翻译:基于区域提议(Regi ...
- [原创]Faster R-CNN论文翻译
Faster R-CNN论文翻译 Faster R-CNN是互怼完了的好基友一起合作出来的巅峰之作,本文翻译的比例比较小,主要因为本paper是前述paper的一个简单改进,方法清晰,想法自然.什 ...
- R-CNN论文翻译
R-CNN论文翻译 Rich feature hierarchies for accurate object detection and semantic segmentation 用于精确物体定位和 ...
- SSD: Single Shot MultiBoxDetector英文论文翻译
SSD英文论文翻译 SSD: Single Shot MultiBoxDetector 2017.12.08 摘要:我们提出了一种使用单个深层神经网络检测图像中对象的方法.我们的方法,名为SSD ...
- R-FCN论文翻译
R-FCN论文翻译 R-FCN: Object Detection viaRegion-based Fully Convolutional Networks 2018.2.6 论文地址:R-FCN ...
随机推荐
- Django ORM 使用原生 SQL
使用原生sql的 方法 : raw # row方法:(掺杂着原生sql和orm来执行的操作) res = CookBook.objects.raw('select id as nid from epo ...
- 从Linux 与 Unix 异同,看开源世界的发展!
从Linux 与 Unix 异同,看开源世界的发展! 如果你是一名20多岁或30多岁的软件开发人员,那么你已成长在一个由Linux主导的世界中.数十年来,它一直是数据中心的重要参与者,尽管很难找到明确 ...
- 二。Hibernate 查询 HQL、SQL方式
hibernate的查询1.HQL方式:所有查询都是根据java对象名来完成,对象名替换表名2.SQL方式:保留原来的sql查询风格3.可以通过设置第一条和最大条数来实现各种数据库的分页查询4.通过B ...
- python day06
深浅拷贝 1.值拷贝 ls1 = [1,2,3] ls2 = ls1 #ls2直接把栈区里ls1存的地址拿过来,也指向堆区里列表的id #原列表发生ls1改变(不是重新赋值),ls2也跟着发生改变 2 ...
- 19 款仿 Bootstrap 后台管理主题免费下载
声明: 1. 本篇文章提到的仿 Bootstrap 风格的主题,是基于 jQuery 的 ASP.NET MVC 控件库的主题. 2. FineUIMvc(基础版)完全免费,可以用于商业项目. 目录 ...
- 爬取5K分辨率超清唯美壁纸
目录 爬取5K分辨率超清唯美壁纸 简介 编写思路 使用教程 演示图片 完整源代码 @ 爬取5K分辨率超清唯美壁纸 简介 壁纸的选择其实很大程度上能看出电脑主人的内心世界,有的人喜欢风景,有的人喜欢星空 ...
- spring boot中配置日志log和热部署
Java的日志有很多 个人强烈不推荐log4j ,推荐log4j2和logback 在高并发,多线程的环境下log4j1 的性能和log4j2相比可以用junk来形容 对就是junk.log4j2的 ...
- dede织梦 arclist标签完美支持currentstyle属性
由于客户需求,所以进行对文章的arclist标签进行设置当前样式(currentstyle),修改前记得备份. dede版本v5.7sp 找到PHP修改: include/taglib/arclist ...
- java基础-03基本语法
关键词 常用关键字53个(含2个保留字): 1.保留关键字(2个) const --常量 常数:用于修改字段或局部变量的声明. goto--转到 指定跳转到标签,找到标签后,程序将处理从下一行开始的命 ...
- 播放器授权后播放内容时出现Cnario logo水印
问题描述 Player获取License后, 通过Messeenger发布到Player的内容前面出现Cnario 的logo水印, 如下图样式: 原因 出现这种情况一般是由于License授权不正确 ...





