CF528D Fuzzy Search 和 BZOJ4259 残缺的字符串
Fuzzy Search
给你文本串 S 和模式串 T,求 S 的每个位置是否能模糊匹配上 T。
这里的模糊匹配指的是把 T 放到 S 相应位置上之后,T 中每个字符所在位置附近 k 个之内的位置上的 S 的字符至少有一个与之相同。
1 ≤ |T| ≤ |S| ≤ 200 000, 0 ≤ k ≤ 200 000。字符串是基因序列。
题解
由于字符集很小,所以对每种字符分别处理。
对 T 每个位置赋值为它是否等于这个字符。对 S 的每个位置前后找找有没有这种字符即可。
然后卷积看看匹配了多少个位置。每种字符的匹配位置数加起来等于 T 的长度的话,匹配就成功了。
时间复杂度 \(O(n \log n)\)。
struct node {LD x,y;};
IN node operator+(CO node&a,CO node&b){
return (node){a.x+b.x,a.y+b.y};
}
IN node operator-(CO node&a,CO node&b){
return (node){a.x-b.x,a.y-b.y};
}
IN node operator*(CO node&a,CO node&b){
return (node){a.x*b.x-a.y*b.y,a.x*b.y+a.y*b.x};
}
IN node operator/(CO node&a,LD k){
return (node){a.x/k,a.y/k};
}
CO int N=524288;
char s[N],t[N];
int cnt[100];
node sa[N],sg[N],sc[N],st[N];
node ta[N],tg[N],tc[N],tt[N];
node res[N];
bool ans[N];
CO LD pi=acos(-1),eps=1e-6;
int rev[N];
node omg[N];
void FFT(node a[],int lim){
for(int i=0;i<lim;++i)
if(i<rev[i]) swap(a[i],a[rev[i]]);
for(int i=1;i<lim;i<<=1)
for(int j=0;j<lim;j+=i<<1)
for(int k=0;k<i;++k){
node t=omg[lim/(i<<1)*k]*a[j+i+k];
a[j+i+k]=a[j+k]-t,a[j+k]=a[j+k]+t;
}
}
int main(){
int n=read<int>(),m=read<int>(),k=read<int>();
scanf("%s%s",s,t);
reverse(t,t+m);
for(int i=0;i<m;++i){
if(t[i]=='A') ta[i]=(node){1,0};
else if(t[i]=='G') tg[i]=(node){1,0};
else if(t[i]=='C') tc[i]=(node){1,0};
else tt[i]=(node){1,0};
}
for(int i=0;i<n;++i){
++cnt[s[i]];
if(cnt['A']) sa[i]=(node){1,0};
if(cnt['G']) sg[i]=(node){1,0};
if(cnt['C']) sc[i]=(node){1,0};
if(cnt['T']) st[i]=(node){1,0};
if(i>=k) --cnt[s[i-k]];
}
memset(cnt,0,sizeof cnt);
for(int i=n-1;i>=0;--i){
++cnt[s[i]];
if(cnt['A']) sa[i]=(node){1,0};
if(cnt['G']) sg[i]=(node){1,0};
if(cnt['C']) sc[i]=(node){1,0};
if(cnt['T']) st[i]=(node){1,0};
if(i+k<=n-1) --cnt[s[i+k]];
}
memset(cnt,0,sizeof cnt);
for(int i=0;i<m;++i) ++cnt[t[i]];
fill(ans+m-1,ans+n,1);
int len=ceil(log2(n)),lim=1<<len;
for(int i=0;i<lim;++i) rev[i]=rev[i>>1]>>1|(i&1)<<(len-1);
for(int i=0;i<lim;++i) omg[i]=(node){cos(i*2*pi/lim),sin(i*2*pi/lim)};
FFT(sa,lim),FFT(ta,lim);
for(int i=0;i<lim;++i) res[i]=sa[i]*ta[i];
for(int i=0;i<lim;++i) omg[i].y=-omg[i].y;
FFT(res,lim);
for(int i=0;i<lim;++i) res[i]=res[i]/lim;
for(int i=0;i<lim;++i) omg[i].y=-omg[i].y;
for(int i=m-1;i<n;++i)
if(fabs(res[i].x-cnt['A'])>eps) ans[i]=0;
FFT(sg,lim),FFT(tg,lim);
for(int i=0;i<lim;++i) res[i]=sg[i]*tg[i];
for(int i=0;i<lim;++i) omg[i].y=-omg[i].y;
FFT(res,lim);
for(int i=0;i<lim;++i) res[i]=res[i]/lim;
for(int i=0;i<lim;++i) omg[i].y=-omg[i].y;
for(int i=m-1;i<n;++i)
if(fabs(res[i].x-cnt['G'])>eps) ans[i]=0;
FFT(sc,lim),FFT(tc,lim);
for(int i=0;i<lim;++i) res[i]=sc[i]*tc[i];
for(int i=0;i<lim;++i) omg[i].y=-omg[i].y;
FFT(res,lim);
for(int i=0;i<lim;++i) res[i]=res[i]/lim;
for(int i=0;i<lim;++i) omg[i].y=-omg[i].y;
for(int i=m-1;i<n;++i)
if(fabs(res[i].x-cnt['C'])>eps) ans[i]=0;
FFT(st,lim),FFT(tt,lim);
for(int i=0;i<lim;++i) res[i]=st[i]*tt[i];
for(int i=0;i<lim;++i) omg[i].y=-omg[i].y;
FFT(res,lim);
for(int i=0;i<lim;++i) res[i]=res[i]/lim;
for(int i=0;i<lim;++i) omg[i].y=-omg[i].y;
for(int i=m-1;i<n;++i)
if(fabs(res[i].x-cnt['T'])>eps) ans[i]=0;
int sum=0;
for(int i=m-1;i<n;++i) sum+=ans[i];
printf("%d\n",sum);
return 0;
}
残缺的字符串
很久很久以前,在你刚刚学习字符串匹配的时候,有两个仅包含小写字母的字符串A和B,其中A串长度为m,B串长度为n。可当你现在再次碰到这两个串时,这两个串已经老化了,每个串都有不同程度的残缺。
你想对这两个串重新进行匹配,其中A为模板串,那么现在问题来了,请回答,对于B的每一个位置i,从这个位置开始连续m个字符形成的子串是否可能与A串完全匹配?
1<=m<=n<=300000
两个串均仅由小写字母和*号组成,其中*号表示相应位置已经残缺。
题解
这题跟上面那道几乎一样,只不过模糊匹配的方式更改了而已。
令通配符的位置的值为0,构造
\]
ansi=0时匹配成功。
这破题还是权限题。
CF528D Fuzzy Search 和 BZOJ4259 残缺的字符串的更多相关文章
- CF528D. Fuzzy Search [FFT]
CF528D. Fuzzy Search 题意:DNA序列,在母串s中匹配模式串t,对于s中每个位置i,只要s[i-k]到s[i+k]中有c就认为匹配了c.求有多少个位置匹配了t 预处理\(f[i][ ...
- CF528D Fuzzy Search 字符串匹配+FFT
题意: DNA序列,在母串s中匹配模式串t,对于s中每个位置i,只要s[i-k]到s[i+k]中有c就认为匹配了c.求有多少个位置匹配了t. 分析: 这个字符串匹配的方式,什么kmp,各种自动机都不灵 ...
- CF-528D Fuzzy Search(FFT字符串匹配)
Fuzzy Search 题意: 给定一个模式串和目标串按下图方式匹配,错开位置不多于k 解题思路: 总共只有\(A C G T\)四个字符,那么我们可以按照各个字符进行匹配,比如按照\(A\)进行匹 ...
- BZOJ4259残缺的字符串
题目描述 很久很久以前,在你刚刚学习字符串匹配的时候,有两个仅包含小写字母的字符串A和B,其中A串长度为m,B串长度为n.可当你现在再次碰到这两个串时,这两个串已经老化了,每个串都有不同程度的残缺. ...
- BZOJ4259 残缺的字符串(FFT)
两个串匹配时相匹配的位置位置差是相同的,那么翻转一个串就变成位置和相同,卷积的形式. 考虑如何使用卷积体现两个位置能否匹配.一个暴力的思路是每次只考虑一种字符,将其在一个串中设为1,并在另一个串中将不 ...
- BZOJ4259:残缺的字符串(FFT)
Description 很久很久以前,在你刚刚学习字符串匹配的时候,有两个仅包含小写字母的字符串A和B,其中A串长度为m,B串长度为n.可当你现在再次碰到这两个串时,这两个串已经老化了,每个串都有不同 ...
- BZOJ4259 残缺的字符串 【fft】
题目 很久很久以前,在你刚刚学习字符串匹配的时候,有两个仅包含小写字母的字符串A和B,其中A串长度为m,B串长度为n.可当你现在再次碰到这两个串时,这两个串已经老化了,每个串都有不同程度的残缺. 你想 ...
- BZOJ4259: 残缺的字符串 & BZOJ4503: 两个串
[传送门:BZOJ4259&BZOJ4503] 简要题意: 给出两个字符串,第一个串长度为m,第二个串长度为n,字符串中如果有*字符,则代表当前位置可以匹配任何字符 求出第一个字符串在第二个字 ...
- BZOJ4259 残缺的字符串 多项式 FFT
原文链接http://www.cnblogs.com/zhouzhendong/p/8798532.html 题目传送门 - BZOJ4259 题意 给你两个串,用其中一个来匹配另一个.问从母串的那些 ...
随机推荐
- python数据分析4之自动采集数据
1 数据采集的重要性 数据采集是数据挖掘的基础,没有数据,挖掘也没有意义.很多时候,我们拥有多少数据源,多少数据量,以及数据质量如何,将决定我们挖掘产出的成果会怎样 2 四类采集方式 3 如何使用开放 ...
- SGE部署安装
1.关闭防火墙 systemctl stop firewalld.service systemctl disable firewalld.service 2.安装SGE依赖包 # yum instal ...
- CentOS 7下JumpServer安装及配置
环境 系统 # cat /etc/redhat-release CentOS Linux release 7.4.1708 (Core) # uname -r 3.10.0-693.21.1.el7. ...
- Python time strptime() 函数根据指定的格式把一个时间字符串解析为时间元组
Python time strptime() 函数根据指定的格式把一个时间字符串解析为时间元组 import time dt=time.strptime('2019-08-08 11:32:23', ...
- 开源分布式数据库中间件 DBLE
DBLE 是企业级开源分布式中间件,江湖人送外号 “MyCat Plus”:以其简单稳定,持续维护,良好的社区环境和广大的群众基础得到了社区的大力支持: DBLE官方网站:https://openso ...
- (一)将mockjs集成到VUE中后,怎样根据接口入参返回mock结果
1)安装mockjs,这一步跳过 2)在项目中建立mock模块,笔者的目录结构如下 mock模块与接口模块一一对应,有一个接口,就有一个mock 3)编写登陆模块mock接口,代码如下: import ...
- SpringCloud面试题及答案
1. 什么是 spring cloud? spring cloud 是一系列框架的有序集合.它利用 spring boot 的开发便利性巧妙地简化了分布式系统基础设施的开发,如服务发现注册.配置中心. ...
- 关于注解sql和动态sql的写法
注解写sql一般写在mapper层,如果sql语句复杂建议不要写注解sql 拼接容易出错 二动态sql的话要在 main 下面创建一个resource ——mapper—— Mapper.xml 再在 ...
- 关于MVC与三层架构
详情 回答一: 当然啊,你要明白三层架构的MVC的区别和联系: 三层架构是最基本的项目分层结果,而MVC则是三层架构的一个变体,MVC是一种好的开发模式.首先你要明白MVC分别代表的是什么意思. M ...
- 类再生(合成、继承、final)
类再生 有两种方法达到代码复用的效果:合成.继承. 合成的语法 合成就是形成对象,把复用的代码置入对象句柄. 在类内字段使用基本数据会初始化为零,但对象句柄会初始化为null.在下面的程序中若没有ne ...