【学习笔记】带你从0开始学习 01Trie
01Trie
Section 1:普通 Trie
Section 1.1 什么是 Trie
Trie 树,即字典树,是一种树形结构。典型应用是用于统计和排序大量的字符串前缀来减少查询时间,最大限度地减少无谓的字符串比较。

Section 1.2 如何实现
具体地说,对于每个结点,我们要保存几个信息:
ch[26],保存此字符的下一个字符(\(a\sim z\))的存储地址(没有为 \(0\))。cnt,保存此节点被经过了多少次。
对于整个 Trie 树,我们还要额外保存
Tcnt,为节点数。Endp[],表示的是这个字符串是否以这个下标结尾(如果只是看是否是前缀,则不需要此数组)。
几个操作
insert:往 Trie 树里插入一个字符串。
具体实现:把字符串里的字符扫描一遍,设当前字符为 \(s\),如果 ch[s-'a'] 不等于 \(0\),跳转到 ch[s-'a'] 的存储下标。否则把 ch[s-'a'] 设为树的节点数加一,然后跳转。跳转时把当前节点的 \(cnt\) 加一。
跳到最后把当前节点 \(Endp\) 设为一。
find:查询 Trie 里是否有这个字符串。
具体实现:根据每个字符一个一个跳。
如果跳的时候 \(cnt=0\),说明没有。
如果跳到最后,有,但是 \(Endp_{nowNode}=0\) 即并不是以这个字符结尾的,说明没有。
否则有这个字符串,返回 true。
Section 1.3 代码实现
(只给出基础的插入和查询出现次数)
点击查看代码
#include <bits/stdc++.h>
using namespace std;
const int N=3000005;
struct Trie{
int T[N][63],Tsiz,Endp[N];
void init(){
for(int i=0;i<=Tsiz;i++) for(int j=0;j<=62;j++) T[i][j]=0;
for(int i=1;i<=Tsiz;i++) Endp[i]=0;
Tsiz=0;
}
int gethash(char ch){
if(islower(ch)) return ch-'a';
if(isupper(ch)) return ch-'A'+26;
if(isdigit(ch)) return ch-'0'+26+26;
}
void insert(string s){
int rt=0,len=s.length();
for(int i=0;i<len;i++){
int x=gethash(s[i]);
if(!T[rt][x]) T[rt][x]=++Tsiz;
rt=T[rt][x];
}
Endp[rt]++;
}
int find(string s){
int rt=0,len=s.length();
for(int i=0;i<len;i++){
int x=gethash(s[i]);
if(!T[rt][x]) return 0;
rt=T[rt][x];
}
return Endp[rt];
}
}trie;
int T,n,q;
int main(){
trie.init();
cin>>n>>q;
string s;
for(int i=1;i<=n;i++){
cin>>s;
trie.insert(s);
}
for(int i=1;i<=q;i++){
cin>>s;
cout<<trie.find(s)<<'\n';
}
}
Section 1.4 例题实现
(使用以上代码无法通过此题,请写 \(cnt\) 维护前缀)
Section 2:01Trie
Section 2.1 什么是 01Trie?
和普通 Trie 相似,但是每个节点只有两个值:\(0/1\)。
从根节点至下的一条路径保存着一个正整数从高到低的二进制位。
如下图:

中序遍历结果为(忽略根节点): \(00\ 01\ 10\ 11\)
我们会发现几点有趣的性质:
- 01Trie 是一棵二叉树,每个节点的左儿子为 \(0\),右儿子为 \(1\)。
- 从根节点往下,所有左儿子开始的路径值都小于右儿子开始的路径值。
运用这两点性质,我们就可以用 01Trie 造一棵平衡树。
Section 2.2 平衡树
对于每个节点,我们维护两个信息:
siz,维护以当前节点为根节点的子树大小。cnt,维护数字到当前节点为二进制的最后一位的数字个数。
此外,和普通 Trie 一样,我们还要维护树的大小 \(p\)。
几个操作
insert:平衡树的插入操作。首先,给每个经过的结点的 \(siz\) 加一,表示子树节点的个数多了一个。如果当前数字的当前二进制位为 \(0\),就把他放在左儿子,否则放在右儿子。插入到最后一位时给当前节点的 \(cnt\) 加 \(1\)。delete:平衡树的删除操作,与insert几乎一样,只是把最后一位 \(cnt-1\) 就行了。get_rank:查询当前数的排名。从根节点开始往下,如果当前数的当前二进制位为 \(1\),就把排名加上它的左子树的值(性质二)。get_kth:查询排名为 \(k\) 的数。从根节点往下,设它的左子树 \(siz\) 为 \(tmp\),则如果 \(k \le tmp\),则说明排名为 \(k\) 的节点在它的左子树上。否则向右子树查找,并把答案的当前二进制位设为 \(1\)。pre:求当前数的前驱。返回get_kth(get_rank(x))即可。nxt:求当前数的后继。返回get_kth(get_rank(x+1)+1)即可。
Section 2.3 代码实现
点击查看代码
#include <bits/stdc++.h>
using namespace std;
const int MAXLOG=24;
const int N=1e7;
class _01trie{
private:
struct node{
int ch[2];
int siz,cnt;
}T[1<<MAXLOG];
int p;
public:
void update(int x,int offset){
int now=0;
for(int i=MAXLOG-1;i>=0;i--){
bool now_bit=(x&(1<<i));
if(T[now].ch[now_bit]==0)
T[now].ch[now_bit]=++p;
now=T[now].ch[now_bit];
T[now].siz+=offset;
}
T[now].cnt+=offset;
}
int get_rank(int x){
int now=0,ans=0;
for(int i=MAXLOG-1;i>=0;i--){
bool now_bit=(x&(1<<i));
if(now_bit==1)
ans+=T[T[now].ch[0]].siz;
now=T[now].ch[now_bit];
if(now==0)
break;
}
return ans;
}
int get_kth(int k){
int now=0,ans=0;
for(int i=MAXLOG-1;i>=0;i--){
int tmp=T[T[now].ch[0]].siz;
if(k<=tmp)
now=T[now].ch[0];
else{
k-=tmp;
now=T[now].ch[1];
ans|=(1<<i);
}
if(now==0)
break;
}
return ans;
}
int pre(int x){
return get_kth(get_rank(x));
}
int nxt(int x){
return get_kth(get_rank(x+1)+1);
}
}Trie;
int n;
int opt,x;
int main(){
scanf("%d",&n);
for(int i=1;i<=n;i++){
scanf("%d%d",&opt,&x);
if(opt==1) Trie.update(x+N,1);
if(opt==2) Trie.update(x+N,-1);
if(opt==3) printf("%d\n",Trie.get_rank(x+N)+1);
if(opt==4) printf("%d\n",Trie.get_kth(x)-N);
if(opt==5) printf("%d\n",Trie.pre(x+N)-N);
if(opt==6) printf("%d\n",Trie.nxt(x+N)-N);
}
}
Section 2.4 例题
【学习笔记】带你从0开始学习 01Trie的更多相关文章
- 学习笔记︱Nvidia DIGITS网页版深度学习框架——深度学习版SPSS
DIGITS: Deep Learning GPU Training System1,是由英伟达(NVIDIA)公司开发的第一个交互式深度学习GPU训练系统.目的在于整合现有的Deep Learnin ...
- Hadoop源码学习笔记(3) ——初览DataNode及学习线程
Hadoop源码学习笔记(3) ——初览DataNode及学习线程 进入了main函数,我们走出了第一步,接下来看看再怎么走: public class DataNode extends Config ...
- 一起学ASP.NET Core 2.0学习笔记(二): ef core2.0 及mysql provider 、Fluent API相关配置及迁移
不得不说微软的技术迭代还是很快的,上了微软的船就得跟着她走下去,前文一起学ASP.NET Core 2.0学习笔记(一): CentOS下 .net core2 sdk nginx.superviso ...
- Linux简易APR内存池学习笔记(带源码和实例)
先给个内存池的实现代码,里面带有个应用小例子和画的流程图,方便了解运行原理,代码 GCC 编译可用.可以自己上网下APR源码,参考代码下载链接: http://pan.baidu.com/s/1hq6 ...
- NVIDIA DIGITS 学习笔记(NVIDIA DIGITS-2.0 + Ubuntu 14.04 + CUDA 7.0 + cuDNN 7.0 + Caffe 0.13.0)
转自:http://blog.csdn.net/enjoyyl/article/details/47397505?from=timeline&isappinstalled=0#10006-we ...
- [读书笔记]C#学习笔记五: C#3.0自动属性,匿名属性及扩展方法
前言 这一章算是看这本书最大的收获了, Lambda表达式让人用着屡试不爽, C#3.0可谓颠覆了我们的代码编写风格. 因为Lambda所需篇幅挺大, 所以先总结C#3.0智能编译器给我们带来的诸多好 ...
- C#学习笔记四: C#3.0自动属性&匿名属性及扩展方法
前言 这一章算是看这本书最大的收获了, Lambda表达式让人用着屡试不爽, C#3.0可谓颠覆了我们的代码编写风格. 因为Lambda所需篇幅挺大, 所以先总结C#3.0智能编译器给我们带来的诸多好 ...
- JVM 学习笔记 - 带你掌握JVM类加载机制
前言 往期JVM系列: 精美图文带你掌握 JVM 内存布局 本节主要内容: 类的生命周期 类加载阶段描述 数组类和非数组类在加载阶段的差别 父子类初始化顺序 接口的初始化 JVM如何处理 多线程同时初 ...
- [读书笔记]C#学习笔记七: C#4.0中微小改动-可选参数,泛型的可变性
前言 下面就开始总结C#4.0的一些变化了, 也是这本书中最后的一点内容了, 这一部分终于要更新完了. 同时感觉再来读第二遍也有不一样的收获. 今天很嗨的是武汉下雪了,明天周六,一切都是这么美好.哈哈 ...
随机推荐
- Linux磁盘分区-mount挂载
Linux磁盘分区类型 磁盘存储术语CHS head:磁头 磁头数=盘面数 track:磁道 磁道=柱面数 sector:扇区,512bytes cylinder:柱面 1柱面=512*secto ...
- 交换机POE技术知识大全
公众号关注 「开源Linux」 回复「学习」,有我为您特别筛选的学习资料~ 一个典型的以太网供电系统,在配线柜里保留以太网交换机设备,用一个带电源供电集线器(Midspan HUB)给局域网的双绞线提 ...
- 这 BUG,绝了
上周只上了三天班,但我也丝毫不敢懈怠,BUG 更是一个也没少写. 看着满屏幕的 ERROR,我陷入沉思.为什么我写的代如此烂,无法像大牛们写的那般优雅? 越想越自卑,越想越抑郁.我觉得这样不行,一定得 ...
- mapboxgl 中插值表达式的应用场景
目录 一.前言 二.语法 三.对地图颜色进行拉伸渲染 1. 热力图 2. 轨迹图 2. 模型网格渲染 四.随着地图缩放对图形属性进行插值 五.interpolate的高阶用法 六.总结 一.前言 in ...
- 【多线程】线程创建方式三:实现callable接口
线程创建方式三:实现callable接口 代码示例: import org.apache.commons.io.FileUtils; import java.io.File; import java. ...
- 技术分享 | 云原生多模型 NoSQL 概述
作者 朱建平,TEG/云架构平台部/块与表格存储中心副总监.08年加入腾讯后,承担过对象存储.键值存储,先后负责过KV存储-TSSD.对象存储-TFS等多个存储平台. NoSQL 技术和行业背景 No ...
- 基于 BaGet 搭建 Nuget 服务器
1 前言 1.1 BaGet 介绍 BaGet 是一个轻量级的,开源的,跨平台的 Nuget 和 symbol 服务器. 1.2 环境介绍 操作系统:CentOS 7 使用 Docker 安装 2 安 ...
- KMP算法(改进的模式匹配算法)——next函数
KMP算法简介 KMP算法是在基础的模式匹配算法的基础上进行改进得到的算法,改进之处在于:每当匹配过程中出现相比较的字符不相等时,不需要回退主串的字符位置指针,而是利用已经得到的部分匹配结果将模式串向 ...
- 【转】理解 CI 和 CD 之间的区别
有很多关于持续集成(CI)和持续交付(CD)的资料.很多文章用技术术语来进行解释,以及它们怎么帮助你的组织.可惜的是,在一些情况下,这些方法通常与特定工具.甚至供应商相关联.在公司食堂里非常常见的谈话 ...
- 渗透测试之sql注入验证安全与攻击性能
由于渗透测试牵涉到安全性以及攻击性,为了便于交流分享,本人这里不进行具体网址的透露了. 我们可以在网上查找一些公司官方网站如(http://www.XXXXXX.com/xxxx?id=1) 1.拿到 ...