关于Trie的一些算法
最近学习了一下关于Trie的一些姿势,感觉很实用。
终于不用每次看到字符串判重等操作就只想到hash了
关于Trie的定义,来自百度百科
在计算机科学中,Trie,又称前缀树或字典树,是一种有序树状的数据结构,用于保存关联数组,其中的键通常是字符串。
说的有点高级,我们不要管它,可以看这样一张图:

这棵Trie中的单词共有:his,he,her,me,your
就是从根节点一直到某个有end(结尾)标记的点
可以发现,Tire其实就是把一些字符串的公用前缀字符存储了下来
Tire的实现更是简单:
建立一棵Trie,初始时只有一个空的根节点(编号为0)
每当插入或删除时,如果当前字符在之前的操作中已经建立,然后直接利用即可,否则新建立一个节点并让上一个节点连上它
当一个字符串结束时,给该节点做个记号,同时也可存储些其它的信息
具体的实现方法也有两种:邻接表和邻接矩阵
在Trie中,显然用邻接矩阵是很快的,但空间的开销可能较大,如果题目说明范围,那么空间允许的情况下可以使用
邻接表还是一样,比较省空间(毕竟要多少开多少)
这里用一道板子题来理解一下:
邻接矩阵CODE
#include<iostream>
#include<string>
using namespace std;
const int N=50005;
struct node
{
bool end;
int next[30];
}trie[N<<4];
string s;
int n,ans,cnt;
inline bool find(string s)
{
int now=0,len=s.size();
for (register int i=0;i<len;++i)
{
if (trie[now].next[s[i]-'a'+1]) now=trie[now].next[s[i]-'a'+1]; else return 0;
if (i==len-1) return trie[now].end;
}
}
inline void insert(string s)
{
int now=0,len=s.size();
for (register int i=0;i<len;++i)
{
if (trie[now].next[s[i]-'a'+1]) now=trie[now].next[s[i]-'a'+1]; else trie[now].next[s[i]-'a'+1]=++cnt,now=cnt;
if (i==len-1) trie[now].end=1;
}
}
int main()
{
register int i;
for (cin>>n,i=1;i<=n;++i)
{
cin>>s;
string rs(s.rbegin(),s.rend());
if (find(rs)) ++ans;
insert(s);
}
cout<<ans;
return 0;
}
邻接表CODE
#include<iostream>
#include<cstring>
#include<string>
using namespace std;
const int N=50005;
struct node
{
bool end;
char ch;
}trie[N<<4];
struct edge
{
int to,next;
}link[N<<4];
string s;
int head[N<<4],n,ans,cnt;
inline void add(int x,int y,char z)
{
link[y].to=y; trie[y].ch=z; link[y].next=head[x]; head[x]=y;
}
inline bool find(string s)
{
int now=0,len=s.size();
for (register int i=0;i<len;++i)
{
bool flag=0;
for (register int j=head[now];j!=-1;j=link[j].next)
if (trie[link[j].to].ch==s[i]) { flag=1; now=link[j].to; break; }
if (!flag) return 0;
if (i==len-1) return trie[now].end;
}
}
inline void insert(string s)
{
int now=0,len=s.size();
for (register int i=0;i<len;++i)
{
bool flag=0;
for (register int j=head[now];j!=-1;j=link[j].next)
if (trie[link[j].to].ch==s[i]) { flag=1; now=link[j].to; break; }
if (!flag) add(now,++cnt,s[i]),now=cnt;
if (i==len-1) trie[now].end=1;
}
}
int main()
{
register int i;
memset(link,-1,sizeof(link));
memset(head,-1,sizeof(head));
for (cin>>n,i=1;i<=n;++i)
{
cin>>s;
string rs(s.rbegin(),s.rend());
if (find(rs)) ++ans;
insert(s);
}
cout<<ans;
return 0;
}
关于Trie的一些算法的更多相关文章
- [算法]从Trie树(字典树)谈到后缀树
我是好文章的搬运工,原文来自博客园,博主July_,地址:http://www.cnblogs.com/v-July-v/archive/2011/10/22/2316412.html 从Trie树( ...
- Trie树的创建、插入、查询的实现
原文:http://blog.chinaunix.net/xmlrpc.php?r=blog/article&uid=28977986&id=3807947 1.什么是Trie树 Tr ...
- Aho-Corasick算法、多模正则匹配、Snort入门学习
希望解决的问题 . 在一些高流量.高IO的WAF中,是如何对规则库(POST.GET)中的字符串进行多正则匹配的,是单条轮询执行,还是多模式并发执行 . Snort是怎么组织.匹配高达上千条的正则规则 ...
- [转载]字典树(trie树)、后缀树
(1)字典树(Trie树) Trie是个简单但实用的数据结构,通常用于实现字典查询.我们做即时响应用户输入的AJAX搜索框时,就是Trie开始.本质上,Trie是一颗存储多个字符串的树.相邻节点间的边 ...
- trie树(前缀树)
问题描述: Trie树,即字典树,又称单词查找树或键树,是一种树形结构,是一种哈希树的变种.典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计.它的优 ...
- Trie树(字典树) 最热门的前N个搜索关键词
方法介绍 1.1.什么是Trie树 Trie树,即字典树,又称单词查找树或键树,是一种树形结构.典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计.它的优 ...
- 双数组trie树的基本构造及简单优化
一 基本构造 Trie树是搜索树的一种,来自英文单词"Retrieval"的简写,可以建立有效的数据检索组织结构,是中文匹配分词算法中词典的一种常见实现.它本质上是一个确定的有限状 ...
- 从Trie树(字典树)谈到后缀树
转:http://blog.csdn.net/v_july_v/article/details/6897097 引言 常关注本blog的读者朋友想必看过此篇文章:从B树.B+树.B*树谈到R 树,这次 ...
- Trie树 - 字典树
1.1.什么是Trie树 Trie树,即字典树,又称单词查找树或键树,是一种树形结构.典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计.它的优点是最大限 ...
随机推荐
- Python字符串和编码
在最早的时候只有127个字符被编码到计算机里,也就是大小写英文字母.数字和一些符号,这个编码被成为ASCII编码. 但是要处理中文显然一个字节是不够的,至少需要两个字节,而且还不能和ASCII编码冲突 ...
- centos6.5安装mysql
1.yum -install mysql mysql-server -y 2.修改mysql的root的密码 登录:mysql -uroot 修改密码: use ...
- 【SPL标准库专题(3)】 Classes
我把SPL分为四个部分:Iterator,Classes,Datastructures,Function:而其中classes是就是做一些类的介绍(Iterator与Datastructures相关的 ...
- JBoss EAP应用服务器部署方法和JBoss 开发JMS消息服务小例子
一.download JBoss-EAP-6.2.0GA: http://jbossas.jboss.org/downloads JBoss Enterprise Application Platfo ...
- centos 7 linux x64
1.修改软件源 sudo wget -O /etc/yum.repos.d/epel.repo http://mirrors.aliyun.com/repo/epel-7.repo yum updat ...
- 从PFX文件中获取私钥、公钥证书、公钥
https://blog.csdn.net/ZuoYanYouYan/article/details/77868584 该类具体功能:根据pfx证书得到私钥.根据私钥字节数组获取私钥对象.根据公钥字节 ...
- 【转】Java学习---内存溢出的排查经历
[原文]https://www.toutiao.com/i6595365358301872643/ 前言 OutOfMemoryError 问题相信很多朋友都遇到过,相对于常见的业务异常(数组越界.空 ...
- div中嵌套div水平居中,垂直居中
方法一: div(父):display:table; div(子):display:table_cell;margin:0 auto;vertical-align:middle; 方法二: div(父 ...
- HDFS核心设计
一.HDFS核心设计 数据块(block) 数据块是HDFS上最基本的存储单位 HDFS块默认大小为128M 对块进行抽象会带来的好处 一个小文件的大小可以大于网络中任意一个磁盘的容量 ...
- Mysql学习第三天
mysqldump -u root -p booksdb > C:/backup/booksdb_20180316.sql # 使用mysqldump命令备份数据库中的所有表 mysqldump ...