字典树Trie Tree
又称单词查找树,Trie树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是:利用字符串的公共前缀来减少查询时间,最大限度地减少无谓的字符串比较,查询效率比哈希树高。

应用
- 串的快速检索
给出N个单词组成的熟词表,以及一篇全用小写英文书写的文章,请你按最早出现的顺序写出所有不在熟词表中的生词。 - 串的排序
给定N个互不相同的仅由一个单词构成的英文名,让你将他们按字典序从小到大输出。用字典树进行排序,采用数组的方式创建字典树,这棵树的每个结点的所有儿子很显然地按照其字母大小排序。对这棵树进行先序遍历即可。 - 最长公共前缀
对所有串建立字典树,对于两个串的最长公共前缀的长度即他们所在的结点的公共祖先个数,于是,问题就转化为当时公共祖先问题。
字典树通常用next指针数组指向子结点,构造整棵树;但是在比赛中为了避免使用指针出错可以使用数组模拟指针的存储方式。
结点的结构体:
struct trie{
int next[maxn];//maxn = 字符种类的个数
int v;//记录该字符出现次数
}t[maxm];//maxm = 结点个数
插入的过程就是建树的过程,如果当前当前前缀的子结点中已经出现此时读到的字符,将前缀移动到该子结点,并将这一前缀出现的次数加一;反之,在当前前缀后建立新的对应这一字符的子结点,并将前缀移动到该子结点,赋出现次数的初始值为1。
用根结点(trie[0])的v记录整棵树的结点个数,新增结点即++trie[0].v;
代码:
void insert_trie(char *s)
{
int len = strlen(s);
int now = ;
for(int i=;i<len;i++)
{
int key = s[i] - ''; //key的值由字符串字符类型决定
if(t[now].next[key] != -)
{
now = t[now].next[key];
t[now].v ++;
}
else
{
t[now].next[key] = ++t[].v;
now = t[now].next[key];
t[now].v = ;
memset(t[now].next, -, sizeof(t[now].next));
}
}
}
查找即在当前的书中查找公共前缀,代码:
int find_trie(char *s)
{
int len = strlen(s);
int now = ,ret = ;
for(int i=;i<len;i++)
{
int key = s[i] - '';
if(t[now].next[key] != -)
{
now = t[now].next[key];
ret = t[now].v;
}
else
return ;
}
return ret;
}
字典树的初始化,将所有trie[0].v个结点的v全都还原为0,next数组初始化为-1。
代码:
void init()
{
for(int i=;i<=t[].v;i++)
{
if(i) t[i].v = ;
memset(t[i].next, -, sizeof(t[i].next));
}
t[].v = ;
}
题
HDU 1251统计难题/一个裸的模版题/
#include <iostream>
#include <cstdio>
#include <cmath>
#include <cstring>
#include <algorithm>
#include <string>
#include <vector>
#include <queue>
#include <stack>
#include <set>
#include <map>
#define INF 0x3f3f3f3f
#define EPS 0.00000001
#define lowbit(x) (x&(-x))
using namespace std;
typedef long long ll; const int maxn = ;
typedef struct Trie Trie;
typedef struct Trie* ptr;
struct Trie
{
ptr next[maxn];
int v; //表示一个字典树到此有多少相同前缀的数目
};
ptr root; void init()
{
if(root == NULL)
{
root = (ptr) malloc (sizeof(Trie));
root -> v = ;
for(int j=;j<maxn;j++)
root -> next[j] = NULL;
}
} void Insert(char *s)
{
int len = strlen(s);
ptr now = root;
for(int i=;i<len;i++)
{
int key = s[i] - 'a';
if(now -> next[key] != NULL)
{
now -> next[key] -> v ++;
now = now -> next[key];
}
else
{
ptr tmp = (ptr) malloc (sizeof(Trie));
tmp -> v = ;
for(int j=;j<maxn;j++)
tmp -> next[j] = NULL;
now -> next[key] = tmp;
now = tmp;
}
}
} int findTrie(char *s)
{
int len = strlen(s), ret = ;
ptr now = root;
for(int i=;i<len;i++)
{
int key = s[i] - 'a';
if(now -> next[key] != NULL)
{
now = now -> next[key];
ret = now -> v;
}
else
{
return ;
}
}
return ret;
} int main()
{
init();
char s[];
int flag = ;
while(gets(s) != NULL)
{
if(strlen(s) == )
{
flag = ;
continue;
}
if(!flag) Insert(s);
else cout << findTrie(s) << endl;
}
}
HDU 1671Phone List/要加初始化/
#include <iostream>
#include <cstdio>
#include <cmath>
#include <cstring>
#include <algorithm>
#include <string>
#include <vector>
#include <queue>
#include <stack>
#include <set>
#include <map>
#define INF 0x3f3f3f3f
#define EPS 0.00000001
#define lowbit(x) (x&(-x))
using namespace std;
typedef long long ll; const int maxn = ;
const int maxm = ;
struct trie{
int next[maxn];
int v;
}t[maxm];
char s[maxm][]; void init()
{
for(int i=;i<=t[].v;i++)
{
if(i) t[i].v = ;
memset(t[i].next, -, sizeof(t[i].next));
}
t[].v = ;
} void ins(char *s)
{
int len = strlen(s);
int now = ;
for(int i=;i<len;i++)
{
int key = s[i] - '';
if(t[now].next[key] != -)
{
now = t[now].next[key];
t[now].v ++;
}
else
{
t[now].next[key] = ++t[].v;
now = t[now].next[key];
t[now].v = ;
memset(t[now].next, -, sizeof(t[now].next));
}
}
} int findtrie(char *s)
{
int len = strlen(s);
int now = ,ret = ;
for(int i=;i<len;i++)
{
int key = s[i] - '';
if(t[now].next[key] != -)
{
now = t[now].next[key];
ret = t[now].v;
}
else
return ;
}
return ret;
} int main()
{
int T;
scanf("%d",&T);
while(T--)
{
init();
int n;
scanf("%d",&n);
for(int i=;i<n;i++)
{
scanf("%s",s[i]);
ins(s[i]);
}
int flag = ;
for(int i=;i<n;i++)
if(findtrie(s[i]) > )
{
flag = ; break;
}
printf(flag ? "NO\n" : "YES\n");
}
}
字典树Trie Tree的更多相关文章
- 字典树(Trie Tree)
在图示中,键标注在节点中,值标注在节点之下.每一个完整的英文单词对应一个特定的整数.Trie 可以看作是一个确定有限状态自动机,尽管边上的符号一般是隐含在分支的顺序中的.键不需要被显式地保存在节点中. ...
- [POJ] #1002# 487-3279 : 桶排序/字典树(Trie树)/快速排序
一. 题目 487-3279 Time Limit: 2000MS Memory Limit: 65536K Total Submissions: 274040 Accepted: 48891 ...
- 字典树trie学习
字典树trie的思想就是利用节点来记录单词,这样重复的单词可以很快速统计,单词也可以快速的索引.缺点是内存消耗大 http://blog.csdn.net/chenleixing/article/de ...
- 『字典树 trie』
字典树 (trie) 字典树,又名\(trie\)树,是一种用于实现字符串快速检索的树形数据结构.核心思想为利用若干字符串的公共前缀来节约储存空间以及实现快速检索. \(trie\)树可以在\(O(( ...
- 字典树(Trie)详解
详解字典树(Trie) 本篇随笔简单讲解一下信息学奥林匹克竞赛中的较为常用的数据结构--字典树.字典树也叫Trie树.前缀树.顾名思义,它是一种针对字符串进行维护的数据结构.并且,它的用途超级广泛.建 ...
- 字典树(Trie树)实现与应用
一.概述 1.基本概念 字典树,又称为单词查找树,Tire数,是一种树形结构,它是一种哈希树的变种. 2.基本性质 根节点不包含字符,除根节点外的每一个子节点都包含一个字符 从根节点到某一节点.路径上 ...
- [转载]字典树(trie树)、后缀树
(1)字典树(Trie树) Trie是个简单但实用的数据结构,通常用于实现字典查询.我们做即时响应用户输入的AJAX搜索框时,就是Trie开始.本质上,Trie是一颗存储多个字符串的树.相邻节点间的边 ...
- Codevs 4189 字典(字典树Trie)
4189 字典 时间限制: 1 s 空间限制: 256000 KB 题目等级 : 大师 Master 传送门 题目描述 Description 最经,skyzhong得到了一本好厉害的字典,这个字典里 ...
- 字典树trie
字典树经常用于单词搜索,现在网络引擎中也应用了trie树: public class Trie{ private int SIZE = 26; private TrieNode root; Trie( ...
随机推荐
- UGUI实现打字的效果
创建打字特效控制的脚本,将该脚本挂载都含有Text组件的对象上面,通过该脚本控制Text文本框的文字,以打字的效果显示文字. 脚本 using UnityEngine; using System.Co ...
- C语言基础 (12) 文件的操作 FILE
课程回顾 结构体基本操作: 结构体类型的定义 // struct为关键字 Stu为自定义标识符 // struct Stu才是结构体类型 // 结构体成员不能在定义类型时赋值 struct Stu { ...
- selenium工作原理
在我们new一个webdriver过程中 selenium会检测本地浏览器组件是否存在,版本是否匹配,接着会启动一套webservice ,这套webservice使用的selenium定义的webw ...
- [洛谷P4887]第十四分块(前体)
题目大意: 给定一个长度为\(n\)的序列\(a\),\(k\),和\(m\)次询问. 每次询问给定区间\([l,r]\),求满足\(l\leqslant i< j\leqslant r\)且\ ...
- [tyvj-1391]走廊泼水节 最小生成树
做克鲁斯卡尔的时候维护一个并查集即可. #include <iostream> #include <cstdio> #include <cstring> #incl ...
- maven构建本地jar包到本地仓库
maven命令: mvn:install:install-file -DgroupId=com.oracle -DartifactId=ojdbc6 -Dversion=1.0 -Dpackaging ...
- 一次 Laravel 性能分析全程笔记
大家都知道 laravel 项目写起来是挺爽,但是在生产环境性能不高,我们来抽丝剥茧分析我自己项目的运行时间消耗: Bootstrap 耗时 步骤 耗时 Illuminate\Foundation\B ...
- Python - def 函数
1.def 函数 如果我们用代码实现了一个小功能,但想要在程序代码中重复使用,不能在代码中到处粘贴这些代码,因为这样做违反了软件工程中 DRY原则. Python 提供了 函数功能,可以将我们这部分功 ...
- 免费ftp服务器FileZilla Server配置
FileZilla Server下载安装完成后,必须启动软件进行设置,由于此软件是英文,本来就是一款陌生的软件,再加上英文,配置难度可想而知,小编从网上找到一篇非常详细的教程进行整理了一番,确保读到这 ...
- 【codeforces 807D】Dynamic Problem Scoring
[题目链接]:http://codeforces.com/contest/807/problem/D [题意] 给出n个人的比赛信息; 5道题 每道题,或是没被解决->用-1表示; 或者给出解题 ...