P4173 残缺的字符串

FFT在字符串匹配中的应用.

能解决大概这种问题:

给定长度为\(m\)的A串,长度为\(n\)的B串。问A串在B串中的匹配数

我们设一个函数(下标从\(0\)开始)

\(C(x,y) =A(x)- B(y)\),若为0,表示B串中以第\(y\)个字符结尾的字符可以与A串中以\(x\)节为结尾的字符可以匹配

\(P(x) = \sum_{i = 0}^{m - 1}C(i,x - m + i + 1)\)

但是很遗憾当\(P(x)\),等于零时,只能够说明上述子串的字符集相同.

为什么?因为负数的存在!

我们考虑怎么去掉负数,平方!

\(P(x) = \sum_{i = 0}^{m - 1}(A(i) - B[x - m + i + 1])^2\)

这时候,如果上式为\(0\),就能证明B串中\(x\)结尾的串可以与A匹配.

老样子设

\(f(i) = A(m - i - 1)\)

\(g(i) = B(i)\)

则有

\(P(x) = \sum_{i = 0}^{m - 1}f(m - i - 1)^2 -\sum_{i = 0}^{m - 1}2f(m - i - 1)g(x - m + i + 1) -\sum_{i = 0}^{m - 1}g(x - m + i + 1)^2\)

发现第一项和第三项是可以通过处理前缀和搞出来的!

而第二项是个卷积,我们只需要求\(P(x)\)是否为零就好了。

我们终于这到了题目上.

这道题目中含有通配符,上式很明显不再成立

但大体思路还是不变的

\(C(x)\)与\(P(x)\)的意义不变

我们设

\(P(x) = \sum_{i = 0}^{m - 1}(A(i) - B(x - m + i + 1))^2A(i)B(x - m + i + 1)\)

即当B串\(x\)的位置为通配符时,\(B(x) = 0\),A同理

这样我们就又能用\(P(x)\)表示能否匹配了

同理,设\(f(x)\)与\(g(x)\)意义同上

\(P(x) =\sum_{i = 0}^{m - 1}f(m - i - 1)^3g(x - m + i + 1) - \sum_{i = 0}^{m - 1}f(m - i - 1)^2g(x - m + i + 1)+\sum_{i = 0}^{m - 1}f(m - i - 1)g(x - m + i + 1)^3\)

然后发现

上式三项都是卷积!

所以我们跑7遍FFT就好了

#include<cstdio>
#include<iostream>
#include<cctype>
#include<algorithm>
#include<cstring>
#include<cmath>
#include<vector>
using namespace std;
const int N = 3e5 + 3;
const double Pi = acos(-1.0);
const double eps = 1e-12;
struct point{
double x,y;
point(double xx = 0,long double yy = 0){
x = xx,y = yy;
}
}a[N << 2],b[N << 2],c[N << 2];
char s1[N],s2[N];
int c1[N],c2[N];
int r[N << 2];
int n,m,limit = 1,l;
vector <int> G;
point operator + (point a,point b){return point(a.x + b.x,a.y + b.y);}
point operator - (point a,point b){return point(a.x - b.x,a.y - b.y);}
point operator * (point a,point b){return point(a.x * b.x - a.y * b.y,a.x * b.y + a.y * b.x);}
inline void fftle(point *A,int type){
for(int i = 0;i < limit;++i)
if(i < r[i]) swap(A[i],A[r[i]]);
for(int mid = 1;mid < limit;mid <<= 1){
point Wn = point(cos(Pi / mid),type * sin(Pi / mid));
for(int R = mid << 1,j = 0;j < limit;j += R){
point w(1,0);
for(int k = 0;k < mid;++k,w = w * Wn){
point x = A[j + k],y = A[j + mid + k] * w;
A[j + k] = x + y;
A[j + mid + k] = x - y;
}
}
}
if(type == -1) for(int i = 0;i < limit;++i) A[i].x = A[i].x / limit;
}
int main(){
scanf("%d%d",&m,&n);
scanf("%s%s",s1,s2);
point zero = point(0,0);
for(int i = 0;i < m;++i) c1[i] = s1[m - i - 1] == '*' ? 0 : s1[m - i - 1] - 'a' + 1;
for(int i = 0;i < n;++i) c2[i] = s2[i] == '*' ? 0 : s2[i] - 'a' + 1;
while(limit <= (n + m)) limit <<= 1,l++;
for(int i = 0;i < limit;++i) r[i] = (r[i >> 1] >> 1) | ((i & 1) << (l - 1));
for(int i = 0;i < m;++i) a[i].x = c1[i] * c1[i] * c1[i];
for(int i = 0;i < n;++i) b[i].x = c2[i];
fftle(a,1);fftle(b,1);
for(int i = 0;i < limit;++i) c[i] = c[i] + (a[i] * b[i]),a[i] = b[i] = zero;
for(int i = 0;i < m;++i) a[i].x = c1[i] * c1[i];
for(int i = 0;i < n;++i) b[i].x = c2[i] * c2[i];
fftle(a,1);fftle(b,1);
point w(2,0);
for(int i = 0;i < limit;++i) c[i] = c[i] - ((a[i] * b[i]) * w),a[i] = b[i] = zero;
for(int i = 0;i < m;++i) a[i].x = c1[i];
for(int i = 0;i < n;++i) b[i].x = c2[i] * c2[i] * c2[i];
fftle(a,1);fftle(b,1);
for(int i = 0;i < limit;++i) c[i] = c[i] + (a[i] * b[i]);
fftle(c,-1);
//for(int i = m - 1;i < n;++i) printf("%lf ",fabs(c[i].x / limit));puts("");
for(int i = m - 1;i < n;++i) if((fabs)(c[i].x) < 0.5) G.push_back(i + 2 - m);
printf("%d\n",(int)G.size());
for(int i = 0;i < (int)G.size();++i) printf("%d ",G[i]);
}

参考博客

Luogu P4173 残缺的字符串-FFT在字符串匹配中的应用的更多相关文章

  1. P4173 残缺的字符串(FFT字符串匹配)

    P4173 残缺的字符串(FFT字符串匹配) P4173 解题思路: 经典套路将模式串翻转,将*设为0,设以目标串的x位置匹配结束的匹配函数为\(P(x)=\sum^{m-1}_{i=0}[A(m-1 ...

  2. 洛谷 P4173 残缺的字符串 (FFT)

    题目链接:P4173 残缺的字符串 题意 给定长度为 \(m\) 的模式串和长度为 \(n\) 的目标串,两个串都带有通配符,求所有匹配的位置. 思路 FFT 带有通配符的字符串匹配问题. 设模式串为 ...

  3. P4173 残缺的字符串 fft

    题意:给你两个字符串,问你第一个在第二个中出现过多少次,并输出位置,匹配时是模糊匹配*可和任意一个字符匹配 题解:fft加速字符串匹配; 假设上面的串是s,s长度为m,下面的串是p,p长度为n,先考虑 ...

  4. [Luogu P4173]残缺的字符串 ( 数论 FFT)

    题面 传送门:洛咕 Solution 这题我写得脑壳疼,我好菜啊 好吧,我们来说正题. 这题.....emmmmmmm 显然KMP类的字符串神仙算法在这里没法用了. 那咋搞啊(或者说这题和数学有半毛钱 ...

  5. luogu P4173 残缺的字符串

    传送门 两种做法,一种是依次考虑每种字符,然后如果某个位置是该字符或者是\(*\)对应的值就是1,否则是0,然后把第一个串倒过来,fft卷积起来,最后看对应位置的值是否为m 然而上面那个做法在字符集大 ...

  6. luoguP4173 残缺的字符串 FFT

    luoguP4173 残缺的字符串 FFT 链接 luogu 思路 和昨天做的题几乎一样. 匹配等价于(其实我更喜欢fft从0开始) \(\sum\limits_{i=0}^{m-1}(S[i+j]- ...

  7. P4173 残缺的字符串

    题目链接 题意分析 啥 ? ? ? \(FFT\)做字符串匹配 可是就是这样 我们定义匹配函数 我们定义\(A\)是匹配串 \(B\)是被匹配串 我们当前到达\(B\)串的\(x\)位置 \[P(x) ...

  8. leetcode笔记 动态规划在字符串匹配中的应用

    目录 leetcode笔记 动态规划在字符串匹配中的应用 0 参考文献 1. [10. Regular Expression Matching] 1.1 题目 1.2 思路 && 解题 ...

  9. BZOJ4259:残缺的字符串(FFT与字符串匹配)

    很久很久以前,在你刚刚学习字符串匹配的时候,有两个仅包含小写字母的字符串A和B,其中A串长度为m,B串长度为n.可当你现在再次碰到这两个串时,这两个串已经老化了,每个串都有不同程度的残缺. 你想对这两 ...

随机推荐

  1. 在linux里如何建立一个快捷方式,连接到另一个目录

    用软链接 用法:ln -s 源目录 目标快捷方式, 比如你要在/etc下面建立一个叫LXBC553的快捷方式,指向/home/LXBC,那就是 ln -s /home/LXBC   /etc/LXBC ...

  2. 【JZOJ4859】【NOIP2016提高A组集训第7场11.4】连锁店

    题目描述 Dpstr开了个饮料连锁店,连锁店共有n家,出售的饮料种类相同.为了促销,Dpstr决定让每家连锁店开展赠送活动.具体来说,在第i家店,顾客可以用ai个饮料瓶兑换到bi瓶饮料和1个纪念币(注 ...

  3. Quick BI独创千人千面的行级权限管控机制

    摘要 就数据访问权限而言,阿里巴巴以“被动式授权”为主,你需要什么权限就申请什么权限.但是,在客户交流过程中,我们发现绝大多数企业都是集中式授权,尤其是面向个人的行级权限管控,管理复杂度往往呈几何增长 ...

  4. Kubernetes1.3新特性:新的资源回收控制器

    (一)  核心概念 在kubernetes1.3中新增了一个资源回收控制器GarbaseCollector,用这个控制器来替代kubernetes1.3中的资源回收控制器GC. 如下为kubernet ...

  5. Spring Security 4 使用@PreAuthorize,@PostAuthorize, @Secured, EL实现方法安全

    [相关已翻译的本系列其他文章,点击分类里面的spring security 4] 上一篇:Spring Security 4 整合Hibernate 实现持久化登录验证(带源码) 原文地址:http: ...

  6. qt painter多个点的曲线

    plot.h #ifndef PLOT_H #define PLOT_H #include<QTimer> #include <QWidget> class pathplot ...

  7. pytorch旧版安装

    https://pytorch.org/get-started/previous-versions 可以直接下载文件 用 pip 直接在下载目录安装就可以了

  8. Python深入:02浅拷贝深拷贝

    对象赋值实际上是简单的对象引用.也就是说当你创建一个对象,然后把它赋给另一个变量的时候,Python并没有拷贝这个对象,而只是拷贝了这个对象的引用. 假设想创建一对小夫妻的通用档案,名为person. ...

  9. hdu 1839 Delay Constrained Maximum Capacity Path(spfa+二分)

    Delay Constrained Maximum Capacity Path Time Limit: 10000/10000 MS (Java/Others)    Memory Limit: 65 ...

  10. 洛谷 2279 [HNOI2003]消防局的设立

    Description 2020年,人类在火星上建立了一个庞大的基地群,总共有n个基地.起初为了节约材料,人类只修建了n-1条道路来连接这些基地,并且每两个基地都能够通过道路到达,所以所有的基地形成了 ...