Trie字典树(超详细!!!)
介绍
字典树,也称Trie、字母树,指的是某个字符串集合对应的形如下图的有根树。树的每条边上对应有恰好一个字符,每个顶点代表从根到该节点的路径所对应的字符串(将所有经过的边上的字符按顺序连接起来)。有时我们也称Trie上的边为转移,顶点为状态。

流程
初始化
一棵空Trie仅包含一个根节点,该点的字符指针均指向空。
插入
当需要插入一个字符串S时,我们令一个指针P起初指向根节点。然后,依次扫描S中的每个字符 c :
1.若P的c字符指针指向一个己经存在的节点Q,则令P=Q。
2.若P的c字符指针指向空,则新建一个节点Q ,令P的 c 字符指针指向Q,然后令P=Q。 当S中的字符扫描完毕时,在当前节点P上标记它是一个字符串的末尾。
查询
当需要查询一个字符串S在Trie中是否存在时,我们令一个指针P起初指向根节点,然后依次扫描S中的每个字符c :
1.若P的c字符指针指向空,则说明S没有被插入过Trie ,结束查询。
2.若P的c字符指针指向一个已经存在的节点Q,则令P=Q 。
当S中的字符扫描完毕时,若当前节点P被标记为一个字符串的末尾,则说明S 在 Trie 中存在,否则说明S没有被插入过Trie。

在上图所示的例子中,需要插入和查询的字符串都由小写字母构成,所以Trie 的每个节点具有 26个字符指针,分别为a到z。上图展示了在一棵空 Trie中依次插入 " cab " " cos " " car " " cat " " cate"和"rain"后的Trie 的形态,灰色标记了单词的末尾节点。


可以看出在Trie 中,字符数据都体现在树的边(指针)上,树的节点仅保存一些额外信息,例如单词结尾标记等。其空间复杂度是O ( NC ) ,其中 N 是节点个数, C是字符集的大小。
初始化
.int ch[N][Z]; //Z为字符集大小
.bool bo[N];
//若bo=true则表示从根到该点经过的边上字母组成的字符串是实际字符串集合中的元素
现在要对一个字符集为小写英文字母的Trie插入一个字符串S:
.void insert(char *s) { //char *s表示一个字符数组
. int len = strlen(s);
. int u = ; //1为根节点
. for(int i = ; i < len; ++i){
. int c = s[i] - 'a';
. if(!ch[u][c])
. ch[u][c] = ++tot; //若不存在这条边则要新建一个节点与转移边
. u = ch[u][c]; //tot为总点数
. }
. bo[u] = true;
. //在串的结尾处将bo赋值,表示它代表一个实际字符串集合中的元素
.}
查询一个字符串S是否是给定字符串集合中某个串的前缀:
.bool find(char s[]) {
. int len = strlen(s);
. int u = ;
. for(int i = ; i < len; ++i){
. int c = s[i] - 'a';
. if(!ch[u][c]) return false;
. u = ch[u][c];
. }
. return true;
.}
【例题1】Phone List(信息学奥赛一本通 1471)
【题目描述】
给定 n 个长度不超过 10 的数字串,问其中是否存在两个数字串 S,T,使得 S 是 T 的前缀,多组数据。
【输入】
第一行一个整数 T,表示数据组数。 对于每组数据,第一行一个数 n,接下来 n 行输入 n 个数字串。
【输出】
对于每组数据,若存在两个数字串 S,T,使得 S 是 T 的前缀,则输出 NO ,否则输出 YES 。 请注意此处结果与输出的对应关系!
【输入样例】
2
3
911
97625999
91125426
5
113
12340
123440
12345
98346
【输出样例】
NO
YES


【例题2】The XOR Largest Pair(信息学奥赛一本通 1472)
【题目描述】
在给定的 N 个整数 A1,A2,…, AN 中选出两个进行异或运算,得到的结果最大是多少?
【输入】
第一行一个整数 N。 第二行 N 个整数 Ai。
【输出】
一个整数表示答案。
【输入样例】
5
2 9 5 7 0
【输出样例】
14
思路:
对于每个 i ( 1<=i <= N ) ,我们希望找到一个 j ( 1 <=j < i ) ,使Ai xor Aj最大。
我们可以把每个整数看作长度为 32 的二进制 01 串(数值较小时在前边补 0 ),并且把A1~Ai-1对应的 32 位二进制串插入一棵 Trie 树(最低二进制位为叶子节点)。接下来,对于 Ai 对应的 32 位二进制串,我们在 Trie 中进行一次与查询类似的过程,每一步都尝试沿着“与 Ai 的当前位相反的字符指针”向下访问。若“与 Ai 的当前位相反的字符指针”指向空节点,则只好访问与 Ai 当前位相同的字符指针。根据 xor 运算“相同得 0 ,不同得 1 ”的性质,该方法即可找出与 A i做 xor 运算结果最大的Aj。

Trie字典树(超详细!!!)的更多相关文章
- 踹树(Trie 字典树)
Trie 字典树 ~~ 比 KMP 简单多了,无脑子选手学不会KMP,不会结论题~~ 自己懒得造图了OI WIKI 真棒 字典树大概长这么个亚子 呕吼真棒 就是将读进去的字符串根据当前的字符是什么和所 ...
- 萌新笔记——C++里创建 Trie字典树(中文词典)(一)(插入、遍历)
萌新做词典第一篇,做得不好,还请指正,谢谢大佬! 写了一个词典,用到了Trie字典树. 写这个词典的目的,一个是为了压缩一些数据,另一个是为了尝试搜索提示,就像在谷歌搜索的时候,打出某个关键字,会提示 ...
- Trie字典树 动态内存
Trie字典树 #include "stdio.h" #include "iostream" #include "malloc.h" #in ...
- 算法导论:Trie字典树
1. 概述 Trie树,又称字典树,单词查找树或者前缀树,是一种用于快速检索的多叉树结构,如英文字母的字典树是一个26叉树,数字的字典树是一个10叉树. Trie一词来自retrieve,发音为/tr ...
- 标准Trie字典树学习二:Java实现方式之一
特别声明: 博文主要是学习过程中的知识整理,以便之后的查阅回顾.部分内容来源于网络(如有摘录未标注请指出).内容如有差错,也欢迎指正! 系列文章: 1. 标准Trie字典树学习一:原理解析 2.标准T ...
- 817E. Choosing The Commander trie字典树
LINK 题意:现有3种操作 加入一个值,删除一个值,询问pi^x<k的个数 思路:很像以前lightoj上写过的01异或的字典树,用字典树维护数求异或值即可 /** @Date : 2017- ...
- C++里创建 Trie字典树(中文词典)(一)(插入、遍历)
萌新做词典第一篇,做得不好,还请指正,谢谢大佬! 写了一个词典,用到了Trie字典树. 写这个词典的目的,一个是为了压缩一些数据,另一个是为了尝试搜索提示,就像在谷歌搜索的时候,打出某个关键字,会提示 ...
- 数据结构 -- Trie字典树
简介 字典树:又称单词查找树,Trie树,是一种树形结构,是一种哈希树的变种. 优点:利用字符串的公共前缀来减少查询时间,最大限度地减少无谓的字符串比较,查询效率比哈希树高. 性质: 1. 根节 ...
- Trie字典树详解
今天上午省选字符串......只会KMP.连hash都不会的我被大佬虐惨了......于是我要发奋图强学习字符串,学习字符串当然就要从Trie树这种可爱的数据结构开始啦!!! 一.什么是Trie树?? ...
随机推荐
- springmvc项目转为springboot
说明 如果你的项目连maven项目都不是,请自行转为maven项目,在按照本教程进行. 本教程适用于spring+springmvc+mybatis+shiro的maven项目. 1.修改pom文件依 ...
- Centos7利用rsync实现文件同步
0x01 测试环境 CentOS 7.4 Rsync服务端:192.168.204.130 CentOS 7.4 Rsync客户端:192.168.204.168 0x02 rsync同步方式 第一种 ...
- Redis(六)管道(Pipelining)
管道技术并不是Redis特有的,管道技术在计算机科学中有很多地方的应用. 来自wiki的解释: In computing, a pipeline, also known as a data pipel ...
- EF Core中如何设置数据库表自己与自己的多对多关系
本文的代码基于.NET Core 3.0和EF Core 3.0 有时候在数据库设计中,一个表自己会和自己是多对多关系. 在SQL Server数据库中,现在我们有Person表,代表一个人,建表语句 ...
- VS2008激活找不到密匙输入框
VS2008试用版到期后会无法使用,网上一搜就能找到很多激活码: Visual Studio 2008 Professional Edition: XMQ2Y-4T3V6-XJ48Y-D3K2V-6C ...
- eclipse使用SVN来检索项目
file——import——搜索框输入SVN——点击SVN检索项目 ——输入想要检索的地址
- .net文件上传的坑记录
传送门:https://www.cnblogs.com/akwwl/p/3573666.html 之前错误:使用layui与web uploader上传文件都报异常,后来终于找到原因是asp.net默 ...
- C# vb .NET读取识别条形码线性条码gs1128
gs1-128,ean-128是比较常见的条形码编码规则类型的一种.如何在C#,vb等.NET平台语言里实现快速准确读取该类型条形码呢?答案是使用SharpBarcode! SharpBarcode是 ...
- Huawei LiteOS简介
Huawei LiteOS简介 Huawei LiteOS是华为面向物联网领域开发的一个基于实时内核的轻量级操作系统.本项目属于华为物联网操作系统Huawei LiteOS源码,现有基础内核支持任务管 ...
- Python 查看模块的帮助文档,方法和帮助信息
参考链接:https://blog.csdn.net/u013810296/article/details/55509284 这里介绍下python自带的查看帮助功能,可以在编程时不中断地迅速找到所需 ...