双数组Trie树中叶子结点check[t]=t的证明

双数组Trie树，其实就是用两个一维数组来表示Trie树这种数据结构。

一个数组称为BASE，另一个数组为CHECK。转移条件如下：

对于状态s，接收字符c，转移到状态t

BASE[s]+c=t
CHECK[t]=BASE[s]

BASE数组保存结点的基地址
CHECK数组标识结点的前驱信息

对于根结点，定义：

根结点的状态为0，\(t_根=0\)

根结点的基地址为1，放在BASE数组下标为0处保存，故\(BASE[t_根]=BASE[0]=1\)。

\(CHECK[t_根]=CHECK[0]=0\)

对于Trie树中的一个结点nodeA，有如下信息：

字符'A'，这是给人看的
字符'A'的状态，用\(t_A\)来表示，\(t_A\)是一个整数。从根结点，经过条件 'A' 转移到nodeA，即：\(BASE[0]+code(A)=t_A=1+65=66\)，其中code(A)一般为该字符的ASCII码。
字符'A'的基地址，使用BASE数组来保存
由于字符'A'对应的结点nodeA的前驱是根结点，即\(CHECK[t_A]=BASE[0]=1\)

对于叶子结点node_leaf，定义该叶子结点的基地址为begin，code(node_leaf)=0，对于状态为t_leaf：

现在来证明：CHECK[t_leaf]=t_leaf

BASE[begin+code(node_leaf)]=t_leaf 得到：BASE[begin]=t_leaf
CHECK[t_leaf]=BASE[begin] 得到：CHECK[t_leaf]=t_leaf

其中，第1、2点就是由转移条件，证明完毕。

另外，在Hancks的这篇文章中，有如下引用：

3、然后将这群兄弟节点的check设为check[begin + a1…an] = begin;很显然，叶子节点i的check[i]的值一定等于i，因为它是兄弟节点中的第一个，并且它的code为0。

就好理解了。
另外，对于叶子结点而言，BASE[t_leaf]=-index，参考，其中 -index 表示：该叶子结点所代表的关键词在词典中顺序。（当构造双数组树时，词典先加载到TreeMap中，是有序的）

双数组Trie树中叶子结点check[t]=t的证明的更多相关文章

[转]双数组TRIE树原理
原文名称: An Efficient Digital Search Algorithm by Using a Double-Array Structure 作者: JUN-ICHI AOE 译文: 使 ...
双数组trie树的基本构造及简单优化
一基本构造 Trie树是搜索树的一种,来自英文单词"Retrieval"的简写,可以建立有效的数据检索组织结构,是中文匹配分词算法中词典的一种常见实现.它本质上是一个确定的有限状 ...
双数组Trie的一种实现
An Implementation of Double-Array Trie 双数组Trie的一种实现原文:http://linux.thai.net/~thep/datrie/datrie.htm ...
python Trie树和双数组TRIE树的实现. 拥有3个功能:插入,删除,给前缀智能找到所有能匹配的单词
#coding=utf- #字典嵌套牛逼,别人写的,这样每一层非常多的东西,搜索就快了,树高26.所以整体搜索一个不关多大的单词表 #还是O(). ''' Python 字典 setdefault() ...
双数组Trie树(DoubleArrayTrie)Java实现
http://www.hankcs.com/program/java/%E5%8F%8C%E6%95%B0%E7%BB%84trie%E6%A0%91doublearraytriejava%E5%AE ...
双数组Trie树 (Double-array Trie) 及其应用
双数组Trie树(Double-array Trie, DAT)是由三个日本人提出的一种Trie树的高效实现 [1],兼顾了查询效率与空间存储.Ansj便是用DAT(虽然作者宣称是三数组Trie树,但 ...
Ansj分词双数组Trie树实现与arrays.dic词典格式
http://www.hankcs.com/nlp/ansj-word-pairs-array-tire-tree-achieved-with-arrays-dic-dictionary-format ...
从Trie树到双数组Trie树
Trie树原理又称单词查找树,Trie树,是一种树形结构,是一种哈希树的变种.它的优点是:利用字符串的公共前缀来减少查询时间,最大限度地减少无谓的字符串比较,能在常数时间O(len)内实现插入和查 ...
双数组字典树(Double Array Trie)
参考文献 1.双数组字典树(DATrie)详解及实现 2.小白详解Trie树 3.论文<基于双数组Trie树算法的字典改进和实现> DAT的基本内容介绍这里就不展开说了,从Trie过来的同 ...

随机推荐

BZOJ 5097: [Lydsy1711月赛]实时导航（最短路 + bitset）
题意 \(n\) 个点的有向图,边权 \(\in \{1, 2, 3, 4\}\) ,\(m\) 次修改边权/加边/删边,\(q\) 次询问:以 \(s_i\) 为起点,输出它到其他点的最短 ...
网络文件系统(NFS)简介
网络文件系统(Network File System, NFS)是一种分布式文件系统协议,最初由Sun Microsystems公司开发,并于1984年发布.其功能旨在允许客户端主机可以像访问本地存储 ...
[2017-7-25]Android Learning Day3
最近真的有点迷茫,感觉没有一个完整的教学体系很难进行下去,有的都是自己瞎捉摸,就跟以前ACM的时候一样,动不动就“这就是一道,水题暴力就行了”.“我们枚举一下所有的状态,找一下规律就行了”,mmp哟. ...
LVM-COW写实备份
[root@localhost ~]# fdisk -l /dev/sdb /dev/sdc | grep "LVM"/dev/sdb1 1 9660 77593918+ 8e L ...
ssh-key 与 git账户配置以及多账户配置，以及通信方式从https切换到ssh
参考:http://www.cnblogs.com/dubaokun/p/3550870.html 在使用git的时候,git与远程服务器是一般通过ssh传输的(也支持ftp,https),我们在管理 ...
luogu P4299 首都
题目描述在X星球上有N个国家,每个国家占据着X星球的一座城市.由于国家之间是敌对关系,所以不同国家的两个城市是不会有公路相连的. X星球上战乱频发,如果A国打败了B国,那么B国将永远从这个星球消失, ...
php 限制类的对象类型
事实上,采用哪种处理参数类型的策略,取决于任何潜在bug的严重程度.通常PHP会根据语境自动转换大多数基本数据类型. 因此,你需要在检测类型.转换类型和依赖良好清晰的文档(无论决定用哪一种,都应该提供 ...
模拟@Test的功能实现
注解和注释区别 * 注释:给程序员看的.* 注解:给虚拟机看的.(让虚拟机看到程序中的注解,注解代表程序的一些特殊的功能.) JDK中提供的注解 @Override :描述子类重写父类的方法: * J ...
Zabbix监控服务器硬盘状态
安装Iptables服务: [root@localhost /]# yum install iptables-services [root@localhost /]# vim /etc/sysconf ...
JS判断手机还是电脑访问网站
function check() { let browser = navigator.userAgent;//用户访问的类型 let phone = ["Android", &qu ...

双数组Trie树中叶子结点check[t]=t的证明

双数组Trie树中叶子结点check[t]=t的证明的更多相关文章

随机推荐

热门专题