trie是什么?1. 字典树 2.集合

(其实两个都对啊喂)

一颗普通的trie树一般类似于这样(图片来源于http://dongxicheng.org/structure/trietree/):

绿色的是根节点,如果字典集为全体小写字母的话,每一个节点就会有26个子节点(可以为空)。

(不过这些东西大佬们已经写了很多博客了在这里就不冗述了)

那么来看看trie的第二个十分十分十分重要的功能:集合。

如果不保存字母集,甚至不保存字符串,如果只保存“数”呢?

直接挂上maxlongint这么多的子节点???虽然只有一层(插入是O(1)),但是查询的话是O(n)的(因为无法有maxlongint的空间,所以查找相当于链表查找)。

或许会想到存储十进制下的每一位,不过怎么存呢?

从低位往高位存?好像只能检索某个数字是否存在,以及支持插入和删除,别忘了集合起码可以实现:插入、删除、查询某个数是否存在、查询某个数的排名、查询排名为k的数、查询某个数的前驱、查询某个数的后继。

(不过如果只需要判断某个数是否存在和插入以及删除的话,STL的map就已经实现了。)

先不说功能如何拓展,首先如果这么插入的话会发现树的高度与最大的那个数有关,看起来很不爽,那么就需要让它看起来比较好看,于是可以引入前导零了——把每个数都补成位数相同(在前面加上0)。

然后可以发现,这棵树最底层是插入的数的全集,但是遍历这颗树的时候从顶向下遍历比较舒服,于是就可以把这棵树重组一下了!从高位往低位进行插入!

这样的话会发现这棵树就可以支持所有的操作了!因为两个数字比较大小是可以从高位进行比较的!而且这些数的位数都相同所以从上往下遍历是可以实现的。

比如说查询排名,假设当前查到的数字的位数上的数为x,那么只要把同层所有小于x的数的size加一块就行了。

如果要查询第k大,那么就需要枚举一下当前位数以及之前位数的size之和,如果大于k的话就往当前位数左边走,否则往右面走,直到恰好小于k,然后k减掉这个值并递归到当前位数右面的那个位数后往下走。

(好像说的有点迷。。。不过这段其实没啥用。。。除非空间卡的很紧需要压一下位。。。不过那样的话还不如写个treap。。。)

然后可以发现这样的话代码实现太麻烦了,而且时间复杂度也变得很迷。

或许可以耗费一点空间而变得好写一些!比如说改成二进制!

改成二进制有如下几个好处:

1.计算机内存储的就是二进制,而且C/C++对位运算处理十分友善。

2.二进制下不是0就是1,不需要枚举所有的位数。

3.枚举位数十分好写,在本文后面的代码实现中可以看到。

对于排名查询和第k大查询跟前文的没什么区别,对于前驱和后继的话其实可以通过这两个而实现。

代码实现上,排名查询实际上返回的是小于该数的个数,而第k大查询正如其名。

那么来看一下前驱和后继如何查询(假设查询的这个数是x):

1.前驱:x的前驱就是kth(rank(x))。小于x的个数事实上就是比x小且最大的那个数的排名。

2.后继:x的后继就是kth(rank(x+1)+1)。最后一个x的排名再往后一个排名就是第一个比x大的数的排名。

当然有利也有弊,01trie也带来了一些不好的地方:

1.空间消耗过大,如果有n个数字那么空间消耗为O(32n),因为一个int是32字节。

2.不支持浮点数插入,当然有两种解决方式,第一种是离散化之后当成int来搞,不过一般题是不支持离线的样子,第二种是把浮点数拆成整数部分和小数部分,不过代价是空间复杂度的再一次上升。

在存储的时候有两种选择,一个是指针,一个是数组。

指针的话代码写起来比较符合人类的正常认知(从左到右),数组比较反人类(从里到外),不过有一种利用C/C++的地址运算符(方括号)实现的类指针写法(见本文后面的实现)。

但本文还并没有结束,01trie还有一种更有趣的用法,可以支持静态区间查询,也就是所谓的可持久化trie。

考虑新插入数的时候,建立一颗新的trie,然后每次查询[l,r]的时候将第r棵trie的出现次数与l-1棵trie的出现次数相减就是[l,r]的trie,然后就可以在这上面进行一系列trie的操作了。

但是,这么做的话空间复杂度是O(n^2)的,但是可以发现没有修改操作,每次只是添加一个数,也就是说只修改了一条链,那么每次只要将没修改的子节点接入到上一棵trie的子节点上就行。

附录一:tyvj平衡二叉树(01trie实现)

 #include <cstdio>
  * ;
 ], num[N], tot, root = ++ tot;
 #define walk for(int i = 31, rt = root, t ; ~i ; i --)
 #define cond(cd, st) if(x == cd) st;
 void ins(int val, int c) {
     val += (int)1e7;
     walk {
         ]) rt[ch][t] = ++ tot;
         (rt = rt[ch][t])[num] += c;
     }
 }
 , ) {
     val += (int)1e7;
     walk {
         )) ret += rt[ch][][num];
         rt = rt[ch][t];
     }
     return ret;
 }
 ) {
     walk
         ][num]) ret |=  << i, k -= rt[ch][][num], rt = rt[ch][];
         ];
     return ret - (int)1e7;
 }
 int main() {
     scanf("%d", &n);
     while(n --) {
         scanf("%d%d", &x, &y);
         cond(, ins(y, ));
         cond(, ins(y, -));
         cond(, printf());
         cond(, printf("%d\n", kth(y)));
         cond(, printf("%d\n", kth(rak(y))));
         cond(, printf() + )));
     }
 }

trie从入门到入殓的更多相关文章

  1. Trie树入门

    Trie树入门 貌似很多人会认为\(Trie\)是字符串类型,但是这是数据结构!!!. 详情见度娘 下面开始进入正题. PS:本文章所有代码未经编译,有错误还请大家指出. 引入 先来看一个问题 ​ 给 ...

  2. Trie树入门及训练

    什么叫Trie树? Trie树即字典树. 又称单词查找树,Trie树,是一种树形结构,是一种哈希树的变种.典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本 ...

  3. HDOJ1251-统计难题(trie树入门)

    统计难题 Time Limit: 4000/2000 MS (Java/Others)    Memory Limit: 131070/65535 K (Java/Others) Total Subm ...

  4. hdu 1251 统计难题(trie树入门)

    统计难题 Time Limit: 4000/2000 MS (Java/Others)    Memory Limit: 131070/65535 K (Java/Others)Total Submi ...

  5. hdu1251(Trie树)

    传送门:统计难题 分析:Trie树入门题,随便写写练下手感,统计每个节点被多少单词经过就可以了. #include <iostream> #include <cstdio> # ...

  6. HDU1251 统计难题 【trie树】

    统计难题 Time Limit: 4000/2000 MS (Java/Others)    Memory Limit: 131070/65535 K (Java/Others) Total Subm ...

  7. poj1056 (Trie入门)寻找字符串前缀

    题意:给你一堆字符串,问是否满足对于任意两个字符串a.b,a不是b的前缀 字典树==前缀树==Trie树 trie入门题,只用到了insert和query操作 #include <cstdio& ...

  8. POJ 2001-Shortest Prefixes(Trie 入门)

    题意:给你一组串,求每个串在组中唯一标志的最短前缀 分析:保存树上经过各节点的单词个数,扫描每个串当经过节点单词个数是一(能唯一标志)结束 #include <map> #include ...

  9. poj 2001 Shortest Prefixes trie入门

    Shortest Prefixes 题意:输入不超过1000个字符串,每个字符串为小写字母,长度不超过20:之后输出每个字符串可以简写的最短前缀串: Sample Input carbohydrate ...

随机推荐

  1. java 获得当前时间 年月日时分秒 星期几

    <%SimpleDateFormat df = new SimpleDateFormat("yyyy年MM月dd日 HH时mm分ss秒");//设置日期格式SimpleDat ...

  2. php中的命名空间

    a.php <?php namespace a\b; class Apple{ function get_info(){ echo 'aaa'.'<br/>'; } } ?> ...

  3. Java 9 揭秘(6. 封装模块)

    Tips 做一个终身学习的人. 在这章节中, 主要介绍以下内容: 封装Java模块的不同格式 JAR格式增强 什么是多版本JAR 如何创建和使用多版本JAR JMOD是什么格式 如何使用jmod工具来 ...

  4. ASP.NET 导出EXCEL文件处理多对应排列的

    这次项目遇到了一个导出excel需要对应排列的问题.本来在做这个项目之前都基本没做过excel导出的菜鸡,这次强行做还是有些忐忑的,加上那个表的结构比较奇特.    废话不多说,先介绍表结构吧 是数据 ...

  5. 记一次redis挂机导致的服务雪崩事故~不对,是故事

    事故时常有,最近特别多!但每次事故总会有人出来背锅!如果不是自己的锅,解决了对自己是一种成长,如果是自己的锅,恐怕锅大了,就得走人了,哈哈哈... 这不,最近又出了一个锅:从周五开始,每天到11点就不 ...

  6. 互联网级监控系统必备-时序数据库之Influxdb

    时间序列数据库,简称时序数据库,Time Series Database,一个全新的领域,最大的特点就是每个条数据都带有Time列. 时序数据库到底能用到什么业务场景,答案是:监控系统. Baidu一 ...

  7. RabbitMQ系列教程之七:RabbitMQ的 C# 客户端 API 的简介

    今天这篇博文是我翻译的RabbitMQ的最后一篇文章了,介绍一下RabbitMQ的C#开发的接口.好了,言归正传吧. Net/C# 客户端 API简介1.主要的命名空间,接口和类  定义核心的API的 ...

  8. (转)完整java开发中JDBC连接数据库代码和步骤

    JDBC连接数据库 •创建一个以JDBC连接数据库的程序,包含7个步骤: 1.加载JDBC驱动程序: 在连接数据库之前,首先要加载想要连接的数据库的驱动到JVM(Java虚拟机), 这通过java.l ...

  9. 【Mysql】Mysql关键字

    ADD ALL ALTER ANALYZE AND AS ASC ASENSITIVE BEFORE BETWEEN BIGINT BINARY BLOB BOTH BY CALL CASCADE C ...

  10. Java第三次上课课堂试验博文

    1.Java字段初始化的规律: 运行如下所示的代码 package demo; public class InitializeBlockDemo { /** * @param args */ publ ...