什么是字典树

基本概念

字典树,又称为单词查找树或Tire树,是一种树形结构,它是一种哈希树的变种,用于存储字符串及其相关信息。

基本性质

1.根节点不包含字符,除根节点外的每一个子节点都包含一个字符

2.从根节点到某一节点。从根节点到该节点路径上经过的字符连接起来,就是该节点对应的字符串

3.同一个节点的所有子节点包含的字符都不相同

运用方面

典型应用是用于统计,排序和保存大量的字符串(不仅限于字符串),经常被搜索引擎系统用于文本词频统计。

优点缺点

字典树是经典的空间换时间的数据结构,利用字符串的公共前缀来减少查询时间,最大限度的减少无谓的字符串比较,查询效率据说比哈希树高。

但缺点就很显然了,就是空间比较大……

举个栗子

什么不太了解,没事,让我们来结合栗子来分析一下!

我们首先读入四个字符串

ba

b

band

abc

在没有读入前,我们有一个空空的根节点;

接着我们插入单词ba;

接着插入单词b,由于根节点有连向b的子节点,所以只需路径上的s++就好了;

接着插入单词bank,ba之前就有,只需s++,而nk需要在ba后添加子节点完成存储;

最后插入单词abc;

如何构造字典树

我们来结合程序一步一步来构造这棵可爱的字典树吧!!

构造节点

我们需要运用struct来存储字典树上每个节点的信息:

struct node
{
int s,v[27],val;
node()
{
s=0;
memset(v,-1,sizeof(v));
}
}t[410000];

s是用来存储有多少个单词进过了这个节点,v是用来存储这个点从a到z的儿子节点分别在哪,而val则是存储这个节点的权值,至于权值代表什么,就要依照题目灵活变换了。

构造字典树

我们先抛出程序:

int bt(int root)
{
int len=strlen(a+1);int x=root;
for(int i=1;i<=len;i++)
{
int y=a[i]-'a'+1;//将a^z转化为1^26
if(t[x].v[y]==-1)t[x].v[y]=++tot;
x=t[x].v[y];t[x].s++;
}
}

首先我们先读入了一个字符串a,它的长度为len;

接着我们对于它的字符进行循环处理,当我们处理到这个字符串的第i个字符的时候,我们要进行分类讨论——

我们用x存储第i-1个字符在字典树中的位置;

当我的前一个字符没有指向我的字符的时候,我就tot++,在字典树中开创一个新的空间,我就把自己放在这个空间里;

如果我的前一个字符有指向我的字符的子节点时,我就放心地走到那个子节点就好了;最后记得更新x的值为当前处理的子节点的位置,并且s++,表示又多了一个单词进过了这个节点,以及完成val的修改之类的工作;

i++,进入下一重循环!

这样一棵完整的字典树就出来了!

模板&&模板题

【caioj 1463】统计前缀

题目描述

【题意】

给出很多个字符串(只有小写字母组成)和很多个提问串,统计出以某个提问串为前缀的字符串数量(单词本身也是自己的前缀).

【输入格式】

输入n,表示有n个字符串(n<=10000)

接下来n行,每行一个字符串,字符串度不超过10

输入m,表示有m个提问(m<=100)

第二部分是一连串的提问,每行一个提问,每个提问都是一个字符串.

【输出格式】

对于每个提问,给出以该提问为前缀的字符串的数量.

【样例输入】

5

banana

band

bee

absolute

acm

4

ba

b

band

abc

【样例输出】

2

3

1

0

就是一道裸题,查询时输出对应节点的s就好了;

附上代码:

#include<bits/stdc++.h>
using namespace std;
struct node
{
int s,v[27];
node()
{
s=0;
memset(v,-1,sizeof(v));
}
}t[410000];
char a[410000];
int i,j,k,m,n,tot,js,jl; int bt(int root)
{
int len=strlen(a+1);int x=root;
for(int i=1;i<=len;i++)
{
int y=a[i]-'a'+1;
if(t[x].v[y]==-1)t[x].v[y]=++tot;
x=t[x].v[y];t[x].s++;
}
} int solve(int root)
{
int len=strlen(a+1);int x=root;
for(int i=1;i<=len;i++)
{
int y=a[i]-'a'+1;
if(t[x].v[y]==-1)return 0;
x=t[x].v[y];
}
return(t[x].s);
} int main()
{
scanf("%d",&m);
for(int i=1;i<=m;i++)
{
scanf("%s",a+1);
bt(0);
} scanf("%d",&n);
for(int i=1;i<=n;i++)
{
scanf("%s",a+1);
printf("%d\n",solve(0));
}
}

结语

通过这篇BLOG相信你已经掌握了Trie树,那就向着AC自动机前进吧!希望你喜欢这篇BLOG!

字典树练习题:

HDU1251(本题原版)

HDU1075

HDU1800

参考

https://ethsonliu.com/2019/09/trie-tree.html

https://oi-wiki.org/string/trie/

【字符串算法】字典树(Trie树)的更多相关文章

  1. 字典树(Trie树)的实现及应用

    >>字典树的概念 Trie树,又称字典树,单词查找树或者前缀树,是一种用于快速检索的多叉树结构,如英文字母的字典树是一个26叉树,数字的字典树是一个10叉树.与二叉查找树不同,Trie树的 ...

  2. [POJ] #1002# 487-3279 : 桶排序/字典树(Trie树)/快速排序

    一. 题目 487-3279 Time Limit: 2000MS   Memory Limit: 65536K Total Submissions: 274040   Accepted: 48891 ...

  3. Atitit 常见的树形结构 红黑树  二叉树   B树 B+树  Trie树 attilax理解与总结

    Atitit 常见的树形结构 红黑树  二叉树   B树 B+树  Trie树 attilax理解与总结 1.1. 树形结构-- 一对多的关系1 1.2. 树的相关术语: 1 1.3. 常见的树形结构 ...

  4. 【HDU - 5790 】Prefix(主席树+Trie树)

    BUPT2017 wintertraining(15) #7C 题意 求[min((Z+L)%N,(Z+R)%N)+1,max((Z+L)%N,(Z+R)%N)+1]中不同前缀的个数,Z是上次询问的结 ...

  5. 洛谷$P4585\ [FJOI2015]$火星商店问题 线段树+$trie$树

    正解:线段树+$trie$树 解题报告: 传送门$QwQ$ $umm$题目有点儿长我先写下题目大意趴$QwQ$,就说有$n$个初始均为空的集合和$m$次操作,每次操作为向某个集合内加入一个数$x$,或 ...

  6. luoguP6623 [省选联考 2020 A 卷] 树(trie树)

    luoguP6623 [省选联考 2020 A 卷] 树(trie树) Luogu 题外话: ...想不出来啥好说的了. 我认识的人基本都切这道题了. 就我只会10分暴力. 我是傻逼. 题解时间 先不 ...

  7. [转载]字典树(trie树)、后缀树

    (1)字典树(Trie树) Trie是个简单但实用的数据结构,通常用于实现字典查询.我们做即时响应用户输入的AJAX搜索框时,就是Trie开始.本质上,Trie是一颗存储多个字符串的树.相邻节点间的边 ...

  8. 字典树(Trie树)实现与应用

    一.概述 1.基本概念 字典树,又称为单词查找树,Tire数,是一种树形结构,它是一种哈希树的变种. 2.基本性质 根节点不包含字符,除根节点外的每一个子节点都包含一个字符 从根节点到某一节点.路径上 ...

  9. 字典树 trie树 学习

    一字典树 字典树,又称单词查找树,Trie树,是一种树形结构,哈希表的一个变种   二.性质 根节点不包含字符,除根节点以外的每一个节点都只包含一个字符: 从根节点到某一节点,路径上经过的字符串连接起 ...

随机推荐

  1. js获取N天后的日期

    这个javascript函数是获取当前时间前后N天日期的方法,可以得到昨天,今天,明天,一月前,三月前,半年前,一年前的日期,只要修改参数就可以实现得到任何一个天数.具体用法如下: function  ...

  2. shader变体

    unity shader 变种(多重编译 multi_compile) https://www.jianshu.com/p/f34d896dde5d Unity Shader - Making mul ...

  3. ract-native常用命令

    1.新建项目:react-native init AwesomeProject 2.运动项目 cd AwesomeProject react-native run-ios 3.添加第三方插件: yar ...

  4. 【C#】Random类中构造方法、时间种子与随机数序列的关系

    Random类 构造函数 1) Random random = new Random(); // 无参数构造函数使用系统时钟生成其种子值 然而,系统时钟取值范围有限,因此在小规模计算中,可能无法使用不 ...

  5. Tomact的中文乱码设置

    在使用Tomact时,有时候使用中文时,窗口会把中文部分显示为乱码,这时需要修改相关配置,让其正常显示. 1.修改server.xml的配置,解决显示窗口的乱码 打开Tomcat下/bin/serve ...

  6. python之结合if条件判断和生成随机数的相关知识,完成石头剪刀布的游戏

    程序开始,显示下面提示信息: 请输入:剪刀(0).石头(1).布(2): 用户输入数字0-2中的一个数字,与系统随机生成的数字比较后给出结果信息. 例如:输入0后,显示如下 你的输入为:剪刀(0) 随 ...

  7. Mybatis如何执行Select语句,你真的知道吗?

    持续原创输出,点击上方蓝字关注我吧 作者:不才陈某 博客:https://chenjiabing666.github.io 前言 本篇文章是Myabtis源码分析的第三篇,前两篇分别介绍了Mybati ...

  8. 自然常数e的含义

    e是一个重要的常数,但是它的直观含义却不像 π 那么明了.我们都知道,圆的周长与直径之比是一个常数,这个常数被称为圆周率,记作 π = 3.14159......可是e代表什么呢? e是“指数”(ex ...

  9. vue-element-admin实战 | 第二篇: 最小改动接入后台实现根据权限动态加载菜单

    一. 前言 本篇基于 有来商城 youlai-mall微服务项目,通过对vue-element-admin的权限菜单模块理解个性定制其后台接口,实现对vue-element-admin工程几乎不做改动 ...

  10. 万字详解TDengine 2.0整体架构设计思路

    ​导读:涛思数据8月3日将TDengine 的集群功能开源,TDengine具有超强的性能和功能,为什么能做到?它到底有哪些技术创新?今将TDengine的整体设计文档分享出来. 1: 数据模型 物联 ...