CF666E Forensic Examination——SAM+线段树合并+倍增
题目大意
给你一个串\(S\)以及一个字符串数组\(T[1...m]\),\(q\)次询问,每次问\(S\)的子串\(S[p_l...p_r]\)在\(T[l...r]\)中的哪个串里的出现次数最多,并输出出现次数。
如有多解输出最靠前的那一个。
思路
第一次见到在\(parent tree\)上线段树合并的题,感觉好妙
先对\(T\)建一个广义后缀自动机,考虑对\(SAM\)上的每一个结点建一颗线段树,值域为\([1,m]\),维护出现次数最多的串的位置和次数。又因为\(endpos\)集合(好像也叫\(right\)集合)有这么一个性质:一个结点的\(endpos\)集合即为其在\(parent\ tree\)上子结点的并集,所以我们在建树时只需要上一个线段树合并即可。
上面的那个思路貌似是个套路?
然后来处理询问,显然我们只需要在\(S[p_l...p_r]\)对应的结点的线段树上查\(l-r\)的最大值就行了,但如果直接拿\(S[p_l...p_r]\)在\(SAM\)上匹配,复杂度绝壁不对QwQ。于是我们考虑先把整个\(S\)在\(SAM\)上匹配,需要查哪个子串时通过跳\(suflink\)来找。具体一下,就是对于\(S\)的一个前缀\(S[1...j]\),如果它最后匹配到了结点\(u\),匹配的长度为\(len\),然后我们要查的子串是\(S[i...j]\),就从\(u\)开始跳\(suflink\)直到一个\(maxlen\)大于等于\(j-i+1\)且深度最小的结点,记其为\(v\),要查的就是\(v\)那棵线段树的答案
最后发现跳\(suflink\)的过程可以用倍增来优化,然后就没了
吐槽1.为什么我写离线的就会\(WA\),在线的就过了
吐槽2.下午三点多写完,然后\(CF\)

咕到了六点多,然后交了一发,\(WA\)了,我...
#include <algorithm>
#include <iostream>
#include <cstdlib>
#include <cstring>
#include <cstdio>
#include <string>
#include <vector>
#include <cmath>
#include <ctime>
#include <queue>
#include <map>
#include <set>
using namespace std;
#define ull unsigned long long
#define pii pair<int, int>
#define uint unsigned int
#define mii map<int, int>
#define lbd lower_bound
#define ubd upper_bound
#define INF 0x3f3f3f3f
#define IINF 0x3f3f3f3f3f3f3f3fLL
#define vi vector<int>
#define ll long long
#define mp make_pair
#define pb push_back
#define re register
#define il inline
#define MAXS 500000
#define M 50000
#define Q 500000
#define MAXT 100000
#define LIM 16
char S[MAXS+5], T[MAXT+5];
int n, m, q;
int nxt[26][2*MAXT+5], maxlen[2*MAXT+5], link[2*MAXT+5], in[2*MAXT+5], nid1, lst;
int nid2, root[2*MAXT+5], ch[2][160*MAXT+5];
vi G[2*MAXT+5];
int f[2*MAXT+5][LIM+1];
int tar[MAXS+5], ml[MAXS+5];
struct Data {
int w, pos;
friend Data operator + (Data lhs, Data rhs) {
if(lhs.w > rhs.w) return lhs;
else {
if(lhs.w == rhs.w && lhs.pos < rhs.pos) return lhs;
else return rhs;
}
}
bool operator < (const Data &rhs) const {
return w == rhs.w ? pos > rhs.pos : w < rhs.w;
}
}nodes[160*MAXT+5];
void init() {
nid1 = lst = 1;
nid2 = 0;
}
void pushup(int o) {
nodes[o] = nodes[ch[0][o]]+nodes[ch[1][o]];
}
void add(int &u, int l, int r, int x) {
if(!u) u = ++nid2;
if(l == r) {
nodes[u] = Data{++nodes[u].w, nodes[u].pos = l};
return ;
}
int mid = (l+r)>>1;
if(x <= mid) add(ch[0][u], l, mid, x);
else add(ch[1][u], mid+1, r, x);
pushup(u);
}
int merge(int x, int y, int l, int r) {
if(!x || !y) return x | y;
int now = ++nid2;
if(l == r) {
nodes[now] = Data{nodes[x].w+nodes[y].w, nodes[x].pos};
return now;
}
int mid = (l+r)>>1;
ch[0][now] = merge(ch[0][x], ch[0][y], l, mid);
ch[1][now] = merge(ch[1][x], ch[1][y], mid+1, r);
pushup(now);
return now;
}
Data query(int o, int l, int r, int L, int R) {
if(!o) return Data{0, 0};
if(L <= l && r <= R) return nodes[o];
int mid = (l+r)>>1;
Data ret{0, 0};
if(L <= mid) ret = ret+query(ch[0][o], l, mid, L, R);
if(R > mid) ret = ret+query(ch[1][o], mid+1, r, L, R);
return ret;
}
void extend(int c, int id) {
int cur = ++nid1;
maxlen[cur] = maxlen[lst]+1;
add(root[cur], 1, m, id);
while(lst && !nxt[c][lst]) nxt[c][lst] = cur, lst = link[lst];
if(!lst) link[cur] = 1;
else {
int p = lst, q = nxt[c][lst];
if(maxlen[q] == maxlen[p]+1) link[cur] = q;
else {
int clone = ++nid1;
maxlen[clone] = maxlen[p]+1;
link[clone] = link[q], link[q] = link[cur] = clone;
for(int i = 0; i < 26; ++i) nxt[i][clone] = nxt[i][q];
while(p && nxt[c][p] == q) nxt[c][p] = clone, p = link[p];
}
}
lst = cur;
}
void insert(int id) {
int t = strlen(T+1);
lst = 1;
for(int i = 1; i <= t; ++i) extend(T[i]-'a', id);
}
void build(int u, int fa) {
f[u][0] = fa;
for(int i = 1; i <= LIM; ++i) f[u][i] = f[f[u][i-1]][i-1];
for(int i = 0, v; i < G[u].size(); ++i) {
v = G[u][i];
build(v, u);
root[u] = merge(root[u], root[v], 1, m);
}
}
void pre() {
n = strlen(S+1);
int u = 1, len = 0;
for(int i = 1; i <= n; ++i) {
if(nxt[S[i]-'a'][u]) u = nxt[S[i]-'a'][u], len++;
else {
while(u && !nxt[S[i]-'a'][u]) u = link[u];
if(!u) u = 1, len = 0;
else len = maxlen[u]+1, u = nxt[S[i]-'a'][u];
}
tar[i] = u, ml[i] = len;
}
}
int main() {
scanf("%s%d", S+1, &m);
init();
for(int i = 1; i <= m; ++i) scanf("%s", T+1), insert(i);
for(int i = 2; i <= nid1; ++i) G[link[i]].pb(i);
build(1, 0);
pre();
scanf("%d", &q);
for(int i = 1, l, r, pl, pr, L; i <= q; ++i) {
scanf("%d%d%d%d", &l, &r, &pl, &pr);
L = pr-pl+1;
if(L > ml[pr]) printf("%d 0\n", l);
else {
int u = tar[pr];
for(int k = LIM; ~k; --k) if(maxlen[f[u][k]] >= L) u = f[u][k];
Data ret = query(root[u], 1, m, l, r);
if(ret.w == 0) ret.pos = l;
printf("%d %d\n", ret.pos, ret.w);
}
}
return 0;
}
CF666E Forensic Examination——SAM+线段树合并+倍增的更多相关文章
- CF666E Forensic Examination SAM+线段树合并+前缀树倍增
$ \color{#0066ff}{ 题目描述 }$ 给你一个串\(S\)以及一个字符串数组\(T[1..m]\),\(q\)次询问,每次问\(S\)的子串\(S[p_l..p_r]\)在\(T[l. ...
- loj#2059. 「TJOI / HEOI2016」字符串 sam+线段树合并+倍增
题意:给你一个子串,m次询问,每次给你abcd,问你子串sa-b的所有子串和子串sc-d的最长公共前缀是多长 题解:首先要求两个子串的最长公共前缀就是把反过来插入变成最长公共后缀,两个节点在paren ...
- CF666E Forensic Examination SAM+倍增,线段树和并
题面: 给你一个串S以及一个字符串数组T[1..m],q次询问,每次问S的子串S[p_l..p_r]在T[l..r]中的哪个串里的出现次数最多,并输出出现次数.如有多解输出最靠前的那一个. 分析: 第 ...
- CF666E-Forensic Examination【广义SAM,线段树合并】
正题 题目链接:https://www.luogu.com.cn/problem/CF666E 解题思路 给出一个串\(S\)和\(n\)个串\(T_i\).\(m\)次询问\(S_{a\sim b} ...
- 字符串(tjoi2016,heoi2016,bzoj4556)(sam(后缀自动机)+线段树合并+倍增+二分答案)
佳媛姐姐过生日的时候,她的小伙伴从某东上买了一个生日礼物.生日礼物放在一个神奇的箱子中.箱子外边写了 一个长为\(n\)的字符串\(s\),和\(m\)个问题.佳媛姐姐必须正确回答这\(m\)个问题, ...
- 2019.02.27 bzoj4556: [Tjoi2016&Heoi2016]字符串(二分答案+sam+线段树合并)
传送门 题意:给一个字符串SSS. 有mmm次询问,每次给四个参数a,b,c,da,b,c,da,b,c,d,问s[a...b]s[a...b]s[a...b]的所有子串和s[x...y]s[x... ...
- CF700E Cool Slogans——SAM+线段树合并
RemoteJudge 又是一道用线段树合并来维护\(endpos\)的题,还有一道见我的博客CF666E 思路 先把\(SAM\)建出来 如果两个相邻的串\(s_i\)和\(s_{i+1}\)要满足 ...
- 洛谷P4482 [BJWC2018]Border 的四种求法 字符串,SAM,线段树合并,线段树,树链剖分,DSU on Tree
原文链接https://www.cnblogs.com/zhouzhendong/p/LuoguP4482.html 题意 给定一个字符串 S,有 q 次询问,每次给定两个数 L,R ,求 S[L.. ...
- UOJ#395. 【NOI2018】你的名字 字符串,SAM,线段树合并
原文链接https://www.cnblogs.com/zhouzhendong/p/UOJ395.html 题解 记得同步赛的时候这题我爆0了,最暴力的暴力都没调出来. 首先我们看看 68 分怎么做 ...
随机推荐
- loback的介绍与配置-(通俗易通)
一.logback的配置介绍 Logback的配置分为三个内容:Logger.appender及layout Logger:作为日志的记录器,主要用于存放日志对象,也可以定义日志类型.级别. appe ...
- Oracle的查询-自连接概念和联系
查询出员工姓名,员工领导姓名 select e1.ename,e2.ename from emp e1,emp e2 where e1.mgr = e2.empno; 结果 自连接:站在不同角度把一张 ...
- 小白学PYTHON时最容易犯的6个错误
最近又在跟之前的同学一起学习python,一起进步,发现很多测试同学在初学python的时候很容易犯一些错误,特意总结了一下.其实这些错误不仅是在学python时会碰到,在学习其他语言的时候也同样会碰 ...
- re(模块正则表达式)
re模块(正则) 正则是用一些具有特殊含义的符号组合到一起(成为正则表达式)来描述字符或者字符串的方法,或者说正则就是用来描述一类事物的规则. import re #从字符串中全部查找内容,返回一 ...
- Django Rest Framework 安装
1. 环境要求 Python (3.5, 3.6, 3.7): 查看 python版本:python -V Django (1.11, 2.0, 2.1, 2.2) 查看django版本:pip li ...
- 第二章、http协议及嗅探抓包--http协议详解
初识http协议 hypertext trandfer protocol 超文本传输协议,是一种分布式,合作式,多媒体信息系统服务,面向应用层的协议.使用最广泛的应用层协议,基于传输层的TCP协 ...
- Prometheus Operator 的安装
Prometheus Operator 的安装 接下来我们用自定义的方式来对 Kubernetes 集群进行监控,但是还是有一些缺陷,比如 Prometheus.AlertManager 这些组件服务 ...
- 【转载】STM32 IAP 在线升级详解
(扩展-IAP主要用于产品出厂后应用程序的更新作用,考虑到出厂时要先烧写IAP 再烧写APP应用程序要烧写2次增加工人劳动力基础上写了“STM32 IAP+APP ==>双剑合一”链接稍后 ...
- 华为精益敏捷专家:DevOps转型中的那些坑
陈军--原腾讯高级项目经理.华为精益敏捷专家 DevOps是现在非常流行的一个词,很多人都在提DevOps,在往那个方向去转,但转的时候坑特别多. 现实是很理想的,大家都觉得做了DevOps之后就会非 ...
- Callable和Future的区别
Callable 在Java中,创建线程一般有两种方式,一种是继承Thread类,一种是实现Runnable接口.然而,这两种方式的缺点是在线程任务执行结束后,无法获取执行结果.我们一般只能采用共享变 ...