CODEVS 2542单词__fail树
2542 单词
2013年省队选拔赛天津市队选拔赛
小张最近在忙毕业,所以一直在读论文。一篇论文是由许多单词组成的。
但小张发现一个单词会在论文中出现很多次,他想知道每个单词分别在论文中出现了多少次。
第一行一个整数N,表示有N个单词,接下来N行,每行一个单词,每个单词都由小写字母组成(N<=200)
输出N个整数,第i行的数表示第i个单词在文章中出现了多少次。
3
a
aa
aaa
6
3
1
30%的数据 单词总长度不超过10^3
100%的数据 单词总长度不超过10^6
————————————————————————————————————————————————————————————————————————————————
一看是AC自动机是没有问题的,但是建完AC自动机后该如何做呢?
当然可以直接用AC自动机的fail指针向前跳,但是这样要枚举单词内的每个位置,严重超时。
这里要用到一个很有用的工具——fail树。
当AC自动机建完以后,我们发现每一个节点都只有一个失败指针(根节点的可以忽略),且沿着失败指针最终能走到根节点。
这样我们将失败指针反向就可以变成一棵树。
这棵树的有些重要的性质:
1、以x节点为根的子树中每个节点代表的字符串都以x点所代表的字符串为后缀。
2、节点x代表的字符串的最大后缀为父节点代表的字符串。
这样我们在插入字符串是把经过的每个节点的val值都加1,就相当于统计的对应前缀出现的次数。
然后通过dfs将val变为val加它所有子树的val和。也就是以(s)为前缀的字符串个数+以(*+s)为前缀的字符串的个数+以(**+s)为前缀的个数+。。。。。
这样s出现的次数就是s串尾对应的val值。
比较难想,但是fail树真的很有用。
————————————————————————————————————————————————————————————————————————————————
1 #include<bits/stdc++.h>
2 using namespace std;
3 const int maxn=1e6+3;
4 const int maxs=26;
5 struct edge{
6 int u,v,next;
7 }e[maxn];
8 int head[maxn],js=0;
9 void addage(int u,int v)
10 {
11 e[++js].u=u;e[js].v=v;
12 e[js].next=head[u];head[u]=js;
13 }
14 struct AC{
15 int ch[maxn][maxs];
16 int val[maxn],f[maxn];
17 int sz;
18 AC(){
19 memset(ch[0],0,sizeof(ch[0]));
20 val[0]=0;
21 sz=1;
22 }
23 int idx(char c){
24 return c-'a';
25 }
26 int insert(char *s){
27 int n=strlen(s),cur=0;
28 for(int i=0,c;i<n;i++){
29 c=idx(s[i]);
30 if(!ch[cur][c]){
31 memset(ch[sz],0,sizeof(sz));
32 val[sz]=0;
33 ch[cur][c]=sz++;
34 }
35 cur=ch[cur][c];
36 val[cur]++;
37 }
38 return cur;
39 }
40 void getfail(){
41 queue<int>q;
42 f[0]=0;
43 for(int c=0;c<maxs;c++){
44 int v=ch[0][c];
45 if(v){
46 f[v]=0;
47 q.push(v);
48 addage(0,v);
49 }
50 }
51 while(!q.empty()){
52 int u=q.front();q.pop();
53 for(int c=0;c<maxs;++c){
54 int v=ch[u][c];
55 if(v){
56 q.push(v);
57 int r=f[u];
58 while(r && !ch[r][c])r=f[r];
59 f[v]=ch[r][c];
60 addage(f[v],v);
61 }
62 }
63 }
64 }
65 }ac;
66 int n;
67 int wz[201];
68 char s[maxn];
69 void dfs(int u,int f)
70 {
71 for(int i=head[u];i;i=e[i].next){
72 int u=e[i].u,v=e[i].v;
73 if(v==f)continue;
74 dfs(v,u);
75 ac.val[u]+=ac.val[v];
76 }
77 }
78 int main()
79 {
80 scanf("%d",&n);
81 for(int i=0;i<n;++i){
82 scanf("%s",s);
83 wz[i]=ac.insert(s);
84 }
85 ac.getfail();
86 dfs(0,-1);
87 for(int i=0;i<n;i++)
88 printf("%d\n",ac.val[wz[i]]);
89 return 0;
90 }
CODEVS 2542单词__fail树的更多相关文章
- codevs 1729 单词查找树
二次联通门 : codevs 1729 单词查找树 /* codevs 1729 单词查找树 Trie树 统计节点个数 建一棵Trie树 插入单词时每新开一个节点就计数器加1 */ #include ...
- 【NOI2000】 单词查找树
问题描述 在进行文法分析的时候,通常需要检测一个单词是否在我们的单词列表里.为了提高查找和定位的速度,通常都画出与单词列表所对应的单词查找树,其特点如下: 根结点不包含字母,除根结点外每一个结点都仅包 ...
- K:单词查找树(Trie)
单词查找树,又称前缀树或字典树,是一种有序树,用于保存关联数组,其中的键通常是字符串.Trie可以看作是一个确定有限状态自动机(DFA).与二叉查找树不同,键不是直接保存在节点中,而是由节点在树中 ...
- COGS 293.[NOI2000] 单词查找树
★ 输入文件:trie.in 输出文件:trie.out 简单对比 时间限制:1 s 内存限制:128 MB 在进行文法分析的时候,通常需要检测一个单词是否在我们的单词列表里.为了提高 ...
- 1729 单词查找树 2000年NOI全国竞赛
1729 单词查找树 2000年NOI全国竞赛 时间限制: 2 s 空间限制: 128000 KB 题目等级 : 大师 Master 题目描述 Description 在进行文法分析的 ...
- Trie树,又称单词查找树、字典
在百度或淘宝搜索时,每输入字符都会出现搜索建议,比如输入“北京”,搜索框下面会以北京为前缀,展示“北京爱情故事”.“北京公交”.“北京医院”等等搜索词.实现这类技术后台所采用的数据结构是什么?[中国某 ...
- [NOI2000] 单词查找树
★★ 输入文件:trie.in 输出文件:trie.out 简单对比 时间限制:1 s 内存限制:128 MB 在进行文法分析的时候,通常需要检测一个单词是否在我们的单词列表里.为了提 ...
- 293. [NOI2000] 单词查找树——COGS
293. [NOI2000] 单词查找树 ★★ 输入文件:trie.in 输出文件:trie.out 简单对比时间限制:1 s 内存限制:128 MB 在进行文法分析的时候,通常需要检 ...
- cogs 293. [NOI 2000] 单词查找树 Trie树字典树
293. [NOI 2000] 单词查找树 ★★☆ 输入文件:trie.in 输出文件:trie.out 简单对比时间限制:1 s 内存限制:128 MB 在进行文法分析的时候,通常需 ...
随机推荐
- JAVA注解基础知识
定义-摘自JAVA编程思想 注解(元数据)为我们在代码中添加信息提供了一种形式化的方法,使我们在稍后某个时刻能非常方便的使用这些数据. 背景: 注解是JAVA5的一种新特性,是为应对C#等之类对JAV ...
- vue项目中的路由守卫
路由守卫的意义就相当于一个保安一样,作用很大,在实际的项目中运用也是不少,也就是当客户在登陆自己账号的时候,有可能存在客户有啥事的时候,自己后台或者pc的关闭全部浏览器,没有点击退出登录,或者在退出登 ...
- Logstash学习之路(五)使用Logstash抽取mysql数据到kakfa
一.Logstash对接kafka测通 说明: 由于我这里kafka是伪分布式,且kafka在伪分布式下,已经集成了zookeeper. 1.先将zk启动,如果是在伪分布式下,kafka已经集成了zk ...
- 雅虎(ycsb)测试hbase(压测)
一.下载ycsb 0.10包 https://github.com/brianfrankcooper/YCSB/releases/download/0.10.0/ycsb-0.10.0.tar.gz ...
- mysql The used table type doesn’t support FULLTEXT indexes 解决方案 (phpstudy 会出现),coten不会
mysql The used table type doesn't support FULLTEXT indexes 是不支持全文索引,解决方案: 1.停掉mysql服务2.打开my.ini,搜索de ...
- 意想不到,这个神奇的bug让我加班到深夜
给大家分享一个近期解决的线上问题,起因是这样的,近期参与公司的一个项目,工程量很大,代码编写测试过后终于到了紧张的上线时刻. 项目上线 上线前照例忐忑不安了一番,因为工程量比较大,预估可能不会很顺利, ...
- docker+mysql集群+读写分离+mycat管理+垂直分库+负载均衡
依然如此,只要大家跟着我的步骤一步步来,100%是可以测试成功的 centos6.8已不再维护,可能很多人的虚拟机中无法使用yum命令下载docker, 但是阿里源还是可以用的 因为他的centos- ...
- Laya 踩坑日记-人物模型穿模,模型显示不正常
最近做游戏,人物要跑到很远的位置,z轴距离大概有20000个单位,然后就发现一个bug,到远处人物模型穿了,而且没办法改,这就尴尬了 Z轴对应值 0 100000 100000 当距离零点 ...
- 【SpringBoot1.x】SpringBoot1.x 入门
SpringBoot1.x 入门 文章源码 简介 传统的 JavaEE 开发,十分笨重且配置繁琐,开发效率很低,而且有很复杂的部署流程,对于第三方技术的集成也很困难. Sring 全家桶时代则解决了上 ...
- 【C++】《C++ Primer 》第十九章
第十九章 特殊工具与技术 一.控制内存分配 1. 重载new和delete new表达式的工作机理: string *sp = new string("a value"); //分 ...