【BZOJ5496】[十二省联考2019]字符串问题(后缀树)
【BZOJ5496】[十二省联考2019]字符串问题(后缀树)
题面
题解
首先显然可以把具有支配关系的串从\(A\)到\(B\)连一条有向边,如果\(B_i\)是\(A_j\)的前缀,就从\(B\)连一条边到\(A\)。这样子问题就转化成了要求解这个二分图的最长路经,有环答案就是\(-1\)。
然后显然就是要找个什么东西出来优化连边是吧。。。
现在唯一要处理的东西就是要找到个啥玩意,来优化这个满足前缀条件的连边。
假装我们有一个所有后缀都被插进去的\(Trie\)树,那么对于每一个\(B\)只需要找到其对应的节点,然后它子树中的每一个\(A\)都会被他连过去,这样子似乎就达成了优化连边,即每一个\(B\)连向这个节点,然后这样节点连向在这个节点终止的\(A\)。
这个复杂度显然是爆炸的,所以我们可以直接建立后缀树,这样子节点数就被优化到了\(O(n)\)级别。
于是问题又出现了,在后缀树上的一个节点表示的长度是一段区间,假如一个节点上又挂了\(A\),又挂了\(B\)就会出锅。(虽然不管这个也有\(80\)分了)
那行啊,我们来拆个点,每个树上节点拆两个,一个\(u\)负责挂好所有儿子,另外一个\(v\)负责挂好所有在这个点的\(A\),然后所有的\(A\)按照长度从小往大挂成一条链。然后\(v\)指向\(u\),这样子任何一个\(B\)对应的一定是一段后缀\(A\),所以直接后缀优化连边连向这条链,然后再连向\(u\)表示指向所有的儿子。
这样子还是很麻烦,实际上有一个更加优秀的做法,就是对于一个点如果挂了多个串,那么就按照每个串长把这个点强行拆掉就行了(虽然本质上就是挂了一条链)。
于是只需要求解最长路就行了,而且还是树上的最长链,只需要按照拓扑序做就行了,即使有环也可以在这个过程中处理掉。
#include<iostream>
#include<cstdio>
#include<cstdlib>
#include<cstring>
#include<cmath>
#include<algorithm>
#include<vector>
#include<queue>
using namespace std;
#define ll long long
#define MAX 800800
#define pb push_back
inline int read()
{
int x=0;bool t=false;char ch=getchar();
while((ch<'0'||ch>'9')&&ch!='-')ch=getchar();
if(ch=='-')t=true,ch=getchar();
while(ch<='9'&&ch>='0')x=x*10+ch-48,ch=getchar();
return t?-x:x;
}
vector<int> E[MAX],W[MAX],str[MAX];
char ch[MAX];int Len;
int fa[20][MAX],pos[MAX],val[MAX];
struct Node{int son[26],len,ff;void clear(){memset(son,0,sizeof(son));len=ff=0;}}t[MAX];
int last=1,tot=1;
void extend(int c)
{
int p=last,np=++tot;last=np;
t[np].len=t[p].len+1;
while(p&&!t[p].son[c])t[p].son[c]=np,p=t[p].ff;
if(!p)t[np].ff=1;
else
{
int q=t[p].son[c];
if(t[q].len==t[p].len+1)t[np].ff=q;
else
{
int nq=++tot;
t[nq]=t[q];t[nq].len=t[p].len+1;
t[q].ff=t[np].ff=nq;
while(p&&t[p].son[c]==q)t[p].son[c]=nq,p=t[p].ff;
}
}
}
vector<int> ee[MAX];
void dfs(int u,int ff)
{
fa[0][u]=ff;
for(int i=1;i<20;++i)fa[i][u]=fa[i-1][fa[i-1][u]];
for(int i=0,l=ee[u].size();i<l;++i)dfs(ee[u][i],u);
}
void Work()
{
Len=strlen(ch+1);
for(int i=Len;i;--i)extend(ch[i]-97),pos[i]=last;
for(int i=1;i<=tot;++i)ee[t[i].ff].pb(i);
dfs(1,0);
}
int TOT,nd[MAX],IDA[MAX],IDB[MAX],Lim[MAX],lenA[MAX];
void Add(int u,int v,int w){if(u)E[u].pb(v),W[u].pb(w);}
bool cmp(int a,int b){return lenA[a]<lenA[b];}
void Build(int u,int ff)
{
int np=++TOT;nd[u]=np;Lim[np]=t[u].len;
if(ff)
{
int lst=ff;
for(int i=0,l=str[u].size();i<l;++i)
{
Add(lst,++TOT,0),val[TOT]=lenA[str[u][i]],fa[0][TOT]=lst,Lim[TOT]=lenA[str[u][i]],lst=TOT;
IDA[str[u][i]]=TOT;
}
Add(lst,np,0);fa[0][np]=lst;
}
for(int i=0,l=ee[u].size();i<l;++i)Build(ee[u][i],np);
}
int deg[MAX];ll dis[MAX],ans;
void Topsort()
{
for(int i=1;i<=TOT;++i)
for(int j=0,l=E[i].size();j<l;++j)
deg[E[i][j]]+=1;
queue<int> Q;int QwQ=0;
for(int i=1;i<=TOT;++i)if(!deg[i])Q.push(i);
while(!Q.empty())
{
int u=Q.front();Q.pop();QwQ+=1;
ans=max(ans,dis[u]+val[u]);
for(int i=0,l=E[u].size();i<l;++i)
{
int v=E[u][i];
dis[v]=max(dis[v],dis[u]+W[u][i]);
if(!--deg[v])Q.push(v);
}
}
if(QwQ<TOT)puts("-1");
else printf("%lld\n",ans);
}
int main()
{
int T=read();
while(T--)
{
scanf("%s",ch+1);
Work();
int A=read();
for(int i=1;i<=A;++i)
{
int l=read(),r=read(),len=r-l+1;
int u=pos[l];lenA[i]=len;
for(int i=19;~i;--i)
if(t[fa[i][u]].len>=len)u=fa[i][u];
str[u].pb(i);
}
for(int i=1;i<=tot;++i)sort(str[i].begin(),str[i].end(),cmp);
for(int i=0;i<=tot;++i)
for(int j=0;j<20;++j)fa[j][i]=0;
Build(1,0);
for(int j=1;j<20;++j)
for(int i=1;i<=TOT;++i)
fa[j][i]=fa[j-1][fa[j-1][i]];
int B=read();
for(int i=1;i<=B;++i)
{
int l=read(),r=read(),len=r-l+1;IDB[i]=++TOT;
int u=nd[pos[l]];
for(int j=19;~j;--j)
if(Lim[fa[j][u]]>=len)u=fa[j][u];
Add(IDB[i],u,0);
}
int C=read();
while(C--)
{
int x=read(),y=read();
Add(IDA[x],IDB[y],lenA[x]);
}
Topsort();
for(int i=0;i<=TOT;++i)
{
ee[i].clear();E[i].clear();t[i].clear();
str[i].clear();W[i].clear();
for(int j=0;j<20;++j)fa[j][i]=0;
IDA[i]=IDB[i]=Lim[i]=pos[i]=deg[i]=0;
dis[i]=ans=val[i]=lenA[i]=nd[i]=0;
}
last=tot=1;TOT=0;
}
return 0;
}
【BZOJ5496】[十二省联考2019]字符串问题(后缀树)的更多相关文章
- 洛谷P5284 [十二省联考2019]字符串问题 [后缀树]
传送门 思路 设\(dp_i\)表示以\(i\)结尾的\(A\)串,能达到的最长长度. 然后发现这显然可以\(i\)往自己控制的\(k\)连边,\(k\)往能匹配的\(j\)连边,就是个最长路,只要建 ...
- [十二省联考2019]字符串问题——后缀自动机+parent树优化建图+拓扑序DP+倍增
题目链接: [十二省联考2019]字符串问题 首先考虑最暴力的做法就是对于每个$B$串存一下它是哪些$A$串的前缀,然后按每组支配关系连边,做一遍拓扑序DP即可. 但即使忽略判断前缀的时间,光是连边的 ...
- 洛谷.5284.[十二省联考2019]字符串问题(后缀自动机 拓扑 DP)
LOJ BZOJ 洛谷 对这题无话可说,确实比较...裸... 像dls说的拿拓扑和parent树一套就能出出来了... 另外表示BZOJ Rank1 tql... 暴力的话,由每个\(A_i\)向它 ...
- [LOJ3049] [十二省联考 2019] 字符串问题
题目链接 LOJ:https://loj.ac/problem/3049 洛谷:https://www.luogu.org/problemnew/show/P5284 BZOJ:https://www ...
- P5284 [十二省联考2019]字符串问题
这是一道涵盖了字符串.图论.数据结构三个方面的综合大题. 把这道题放在D1T2的人应该拖出去打 前置芝士 首先,您至少要会topsort. 其次,如果您只想拿个暴力分,字符串Hash就足够了:如果您想 ...
- Luogu P5284 [十二省联考2019]字符串问题
好难写的字符串+数据结构问题,写+调了一下午的说 首先理解题意后我们对问题进行转化,对于每个字符串我们用一个点来代表它们,其中\(A\)类串的点权为它们的长度,\(B\)类串的权值为\(0\) 这样我 ...
- LOJ3049 [十二省联考2019] 字符串问题 【后缀自动机】【倍增】【拓扑排序】
题目分析: 建出后缀自动机,然后把A串用倍增定位到后缀自动机上,再把B串用倍增定位到后缀自动机上. SAM上每个点上的A串根据长度从小到大排序,建点,依次连边. 再对于SAM上面每个点,连到儿子的边, ...
- 【题解】Luogu P5284 [十二省联考2019]字符串问题
原题传送门 我用sa做的本题 (码量似乎有点大) 先对原串建sa 考虑如何建图: 从大到小枚举长度len 先将height中等于len的两个位置在并查集合并起来,将lst也合并(lst是链表) 再将长 ...
- Luogu5289 十二省联考2019字符串问题(后缀数组+拓扑排序+线段树/主席树/KDTree)
先考虑80分做法,即满足A串长度均不小于B串,容易发现每个B串对应的所有A串在后缀数组上都是一段连续区间,线段树优化连边然后判环求最长链即可.场上就写了这个. 100分也没有什么本质区别,没有A串长度 ...
随机推荐
- dns server 域名解析总结
1.客户有两种使用公网域名解析的方法,一种是,直接配置A记录,将域名直接解析到ip地址.第二种是,配置NS记录,将对这个域名的解析分配给另外一个域名服务器,这个域名服务器就是客户自己搭建的内部域名服务 ...
- python读取txt文件最后一行(文件大+文件小)
txt文件小 #coding:utf-8 ''' fname为所读xx.txt文件 输出为:文件第一行和最后一行 ''' fname = 'test.txt' with open(fname, 'r' ...
- git上传新项目到coding
1:coding.net注册账号,并创建项目.可以将readme.txt打上勾 2:cd到本机的项目文件夹下 在git中代表workspace 3:mac用户用ls -all ,linux用户用ll ...
- C#基础学习第一天
..net与C# .NET是一个框架.一种平台.一种技术 C#是一种编程语言,可以开发基于.NET平台的应用 .NET能干什么 Winform ASP.NET Wwb wphone Unity3D游戏 ...
- asp.net网页上获取其中表格中的数据(爬数据)
下面的方法获取页面中表格数据,每个页面不相同,获取的方式(主要是正则表达式)不一样,只是提供方法参考.大神勿喷,刚使用了,就记下来了. 其中数据怎么存,主要就看着怎么使用了.只是方便记录就都放在lis ...
- SQL语句更新时间字段的年份、月份、天数、时、分、秒
SQL语句更新时间字段的年份.月份.天数.时.分.秒 --修改d表日期字段的年份update dset birth=STUFF(convert(nvarchar(23),birth,120),1,4, ...
- c/c++ 多线程 绕过mutex的保护
多线程 绕过mutex的保护 mutex,能够解决线程安全的问题,但它不是万能的.下面的例子虽然使用了mutex,但是恶意注入了一个外部函数,导致把被mutex保护的双向链表,让一个外部的指针指向了, ...
- .NET CORE学习笔记系列(2)——依赖注入【3】依赖注入模式
原文:https://www.cnblogs.com/artech/p/net-core-di-03.html IoC主要体现了这样一种设计思想:通过将一组通用流程的控制权从应用转移到框架中以实现对流 ...
- Python爬虫【实战篇】bilibili视频弹幕提取
两个重要点 1.获取弹幕的url是以 .xml 结尾 2.弹幕url的所需参数在视频url响应的 javascript 中 先看代码 import requests from lxml import ...
- Python开发【第二篇】运算符
"+" 加号 __author__ = 'Tang' a = 8 b = 9 c = a + b a = 8.0 b = 9 c = a + b print(c) # 17.0 a ...