介绍

字典树,也称Trie、字母树,指的是某个字符串集合对应的形如下图的有根树。树的每条边上对应有恰好一个字符,每个顶点代表从根到该节点的路径所对应的字符串(将所有经过的边上的字符按顺序连接起来)。有时我们也称Trie上的边为转移,顶点为状态。

流程

初始化

一棵空Trie仅包含一个根节点,该点的字符指针均指向空。

插入

当需要插入一个字符串S时,我们令一个指针P起初指向根节点。然后,依次扫描S中的每个字符 c :

1.若P的c字符指针指向一个己经存在的节点Q,则令P=Q。

2.若P的c字符指针指向空,则新建一个节点Q ,令P的 c 字符指针指向Q,然后令P=Q。 当S中的字符扫描完毕时,在当前节点P上标记它是一个字符串的末尾。

查询

当需要查询一个字符串S在Trie中是否存在时,我们令一个指针P起初指向根节点,然后依次扫描S中的每个字符c :

1.若P的c字符指针指向空,则说明S没有被插入过Trie ,结束查询。

2.若P的c字符指针指向一个已经存在的节点Q,则令P=Q 。

当S中的字符扫描完毕时,若当前节点P被标记为一个字符串的末尾,则说明S 在 Trie 中存在,否则说明S没有被插入过Trie。

在上图所示的例子中,需要插入和查询的字符串都由小写字母构成,所以Trie 的每个节点具有 26个字符指针,分别为a到z。上图展示了在一棵空 Trie中依次插入 " cab " " cos " " car " " cat " " cate"和"rain"后的Trie 的形态,灰色标记了单词的末尾节点。

可以看出在Trie 中,字符数据都体现在树的边(指针)上,树的节点仅保存一些额外信息,例如单词结尾标记等。其空间复杂度是O ( NC ) ,其中 N 是节点个数, C是字符集的大小。

初始化
.int ch[N][Z];   //Z为字符集大小  
.bool bo[N];   
 //若bo=true则表示从根到该点经过的边上字母组成的字符串是实际字符串集合中的元素
现在要对一个字符集为小写英文字母的Trie插入一个字符串S:
.void insert(char *s) {               //char *s表示一个字符数组  
.    int len = strlen(s);  
.    int u = ;                     //1为根节点 
.    for(int i = ; i < len; ++i){  
.        int c = s[i] - 'a';  
.        if(!ch[u][c])  
.        ch[u][c] = ++tot;  //若不存在这条边则要新建一个节点与转移边
.        u = ch[u][c];      //tot为总点数 
.     }  
.   bo[u] = true; 
. //在串的结尾处将bo赋值,表示它代表一个实际字符串集合中的元素
.}
查询一个字符串S是否是给定字符串集合中某个串的前缀:
.bool find(char s[]) {  
.    int len = strlen(s);  
.    int u = ;  
.    for(int i = ; i < len; ++i){  
.        int c = s[i] - 'a';  
.        if(!ch[u][c]) return false;  
.        u = ch[u][c];  
.    }  
.    return true;  
.}  

【例题1】Phone List(信息学奥赛一本通 1471)

【题目描述】

给定 n 个长度不超过 10 的数字串,问其中是否存在两个数字串 S,T,使得 S 是 T 的前缀,多组数据。

【输入】

第一行一个整数 T,表示数据组数。 对于每组数据,第一行一个数 n,接下来 n 行输入 n 个数字串。

【输出】

对于每组数据,若存在两个数字串 S,T,使得 S 是 T 的前缀,则输出 NO ,否则输出 YES 。 请注意此处结果与输出的对应关系!

【输入样例】

2

3

911

97625999

91125426

5

113

12340

123440

12345

98346

【输出样例】

NO

YES


【例题2】The XOR Largest Pair(信息学奥赛一本通 1472)

【题目描述】

在给定的 N 个整数 A1,A2,…, AN 中选出两个进行异或运算,得到的结果最大是多少?

【输入】

第一行一个整数 N。 第二行 N 个整数 Ai。

【输出】

一个整数表示答案。

【输入样例】

5

2 9 5 7 0

【输出样例】

14

思路:

对于每个 i ( 1<=i <= N ) ,我们希望找到一个 j ( 1 <=j < i ) ,使Ai xor Aj最大。

我们可以把每个整数看作长度为 32 的二进制 01 串(数值较小时在前边补 0 ),并且把A1~Ai-1对应的 32 位二进制串插入一棵 Trie 树(最低二进制位为叶子节点)。接下来,对于 Ai 对应的 32 位二进制串,我们在 Trie 中进行一次与查询类似的过程,每一步都尝试沿着“与 Ai 的当前位相反的字符指针”向下访问。若“与 Ai 的当前位相反的字符指针”指向空节点,则只好访问与 Ai 当前位相同的字符指针。根据 xor 运算“相同得 0 ,不同得 1 ”的性质,该方法即可找出与 A i做 xor 运算结果最大的Aj。

Trie字典树(超详细!!!)的更多相关文章

  1. 踹树(Trie 字典树)

    Trie 字典树 ~~ 比 KMP 简单多了,无脑子选手学不会KMP,不会结论题~~ 自己懒得造图了OI WIKI 真棒 字典树大概长这么个亚子 呕吼真棒 就是将读进去的字符串根据当前的字符是什么和所 ...

  2. 萌新笔记——C++里创建 Trie字典树(中文词典)(一)(插入、遍历)

    萌新做词典第一篇,做得不好,还请指正,谢谢大佬! 写了一个词典,用到了Trie字典树. 写这个词典的目的,一个是为了压缩一些数据,另一个是为了尝试搜索提示,就像在谷歌搜索的时候,打出某个关键字,会提示 ...

  3. Trie字典树 动态内存

    Trie字典树 #include "stdio.h" #include "iostream" #include "malloc.h" #in ...

  4. 算法导论:Trie字典树

    1. 概述 Trie树,又称字典树,单词查找树或者前缀树,是一种用于快速检索的多叉树结构,如英文字母的字典树是一个26叉树,数字的字典树是一个10叉树. Trie一词来自retrieve,发音为/tr ...

  5. 标准Trie字典树学习二:Java实现方式之一

    特别声明: 博文主要是学习过程中的知识整理,以便之后的查阅回顾.部分内容来源于网络(如有摘录未标注请指出).内容如有差错,也欢迎指正! 系列文章: 1. 标准Trie字典树学习一:原理解析 2.标准T ...

  6. 817E. Choosing The Commander trie字典树

    LINK 题意:现有3种操作 加入一个值,删除一个值,询问pi^x<k的个数 思路:很像以前lightoj上写过的01异或的字典树,用字典树维护数求异或值即可 /** @Date : 2017- ...

  7. C++里创建 Trie字典树(中文词典)(一)(插入、遍历)

    萌新做词典第一篇,做得不好,还请指正,谢谢大佬! 写了一个词典,用到了Trie字典树. 写这个词典的目的,一个是为了压缩一些数据,另一个是为了尝试搜索提示,就像在谷歌搜索的时候,打出某个关键字,会提示 ...

  8. 数据结构 -- Trie字典树

    简介 字典树:又称单词查找树,Trie树,是一种树形结构,是一种哈希树的变种. 优点:利用字符串的公共前缀来减少查询时间,最大限度地减少无谓的字符串比较,查询效率比哈希树高. 性质:   1.  根节 ...

  9. Trie字典树详解

    今天上午省选字符串......只会KMP.连hash都不会的我被大佬虐惨了......于是我要发奋图强学习字符串,学习字符串当然就要从Trie树这种可爱的数据结构开始啦!!! 一.什么是Trie树?? ...

随机推荐

  1. 提高性能,MySQL 读写分离环境搭建

    这是松哥之前一个零散的笔记,整理出来分享给大伙! MySQL 读写分离在互联网项目中应该算是一个非常常见的需求了.受困于 Linux 和 MySQL 版本问题,很多人经常会搭建失败,今天松哥就给大伙举 ...

  2. linux服务器的SSH 配置

    远程连接服务器: 就是通过文字或图形接口的方式来远程登陆另外一台服务器系统,让你在远程的终端前面登陆linux 主机以取得可操作主机的接口 主要的远程连接服务器的主要类型: 1)文字接口明文传输 : ...

  3. 【模板整合计划】DP动态规划

    [模板整合计划]DP动态规划 一:[背包] 1.[01背包] 采药 \([P1048]\) #include<algorithm> #include<cstdio> int T ...

  4. python 练习题:计算的BMI指数,并根据BMI指数条件选择

    小明身高1.75,体重80.5kg.请根据BMI公式(体重除以身高的平方)帮小明计算他的BMI指数,并根据BMI指数:低于18.5:过轻18.5-25:正常25-28:过重28-32:肥胖高于32:严 ...

  5. MarkDown 常用语法规则

    > # 标题 # 标题1:h1的效果 ## 标题2:h2的效果 ### 标题3:h3的效果 #### 标题4:h4的效果 ##### 标题5:h5的效果 ###### 标题6:h6的效果 ### ...

  6. 【C#常用方法】2.DataTable(或DataSet)与Excel文件之间的导出与导入(使用NPOI)

    DataTable与Excel之间的互导 1.项目添加NPOI的引用 NPOI项目简介: NPOI是一个开源的C#读写Excel.WORD等微软OLE2组件文档的项目,特点是可以在没有安装Office ...

  7. 常用的python内置模块

    1.time模块: time模块是普通的时间模块 在python的三种时间表现形式: 1.时间戳: 给电脑看的. - 自1970-01-01 00:00:00到当前时间,按秒计算,计算了多少秒. 2. ...

  8. 微服务架构 ------ DockerCompose从安装到项目部署

    DockerCompose的目的:简化Docker的启动和停止流程,以及编排Docker启动服务与服务之间的关系 DockerCompose的安装:curl -L https://get.daoclo ...

  9. 前后端分离项目Vue+drf开发部署总结

    思维导图xmind文件:https://files-cdn.cnblogs.com/files/benjieming/%E5%89%8D%E5%90%8E%E7%AB%AF%E5%88%86%E7%A ...

  10. Mybatis逆向工程的使用。

    指定配置文件与main运行生成 public class GeneratorSqlmap { public void generator() throws Exception { List<St ...