并不对劲的字符串专题（二）：kmp

据说这些并不对劲的内容是《信息学奥赛一本通提高篇》的配套练习。

先感叹一句《信息学奥赛一本通提高篇》上对kmp的解释和matrix67的博客相似度99%（还抄错了），莫非matrix67藏在编者之中？

但这不重要，因为并不对劲的人不会对kmp作出任何解释。

课后练习：

1.bzoj1355->

可以将题目中给出的字符串看成形如这样的串：

那么，对于其中的某一位：

它到当前前缀的第二个循环节的开始组成的子串和前缀相等：

所以，对于当前位置x，fail[x]就是它到当前前缀的第二个循环节的开始组成的子串的长度，x-fail[x]就相当于字符串的开始到当前前缀的第二个循环节的开始的长度，也就是一个循环节的长度：

但是，随着x增大，x-fail[x]不降，所以对于长度为n的串，答案就是n-fail[n]。

代码就是求fail指针就行了。

#include<bits/stdc++.h>

using namespace std;

#define maxn 1000010

int fa[maxn],n,ans;

char s[maxn];

int main()

{

    scanf("%d%s",&n,s+1);

    fa[0]=-1,fa[1]=0;ans=1;

    for(int i=2;i<=n;i++)

    {

        int u=i-1;

        while(u&&s[fa[u]+1]!=s[i])u=fa[u];

        if(u)fa[i]=fa[u]+1;

        else fa[i]=0;

    }

    printf("%d",n-fa[n]);

    return 0;

}

2.bzoj1511->

并不能读懂题面，求大佬帮助。

3.bzoj3620->

题目中要找形如A+B+A的子串，所以可以枚举左端点，再算出每个右端点是否可行。

首先，固定左端点后，求出fail指针。对于fail[x]*2<x的，肯定是没问题了（如图）：

对于fail[x]*2>=x的呢？会发现，1到fail[x]的子串和x-fail[x]+1到x的子串一样，1到fail[fail[x]]的子串和fail[x]-fail[fail[x]]+1到fail[x]的子串一样，所以1到fail[fail[x]]的子串和x-fail[fail[x]]+1到x的子串一样。那么就可以顺着fail指针往上找，直到长度*2<x且长度>=k。

不断顺着fail指针往上找的过程听上去很暴力，这题本来就很暴力了，就要避免这种暴力的。发现对于点x求出合法解为y后，对于x在fail树所有子孙，就都是合法的了。那么可以标记x，这样计算x在fail树所有子孙时，走到x就可以停了。

这个优化听上去很扯，它还是O(n²)的，但是15000的数据还是过了，是因为kmp常数小的缘故？

#include<algorithm>

#include<cmath>

#include<cstdio>

#include<cstdlib>

#include<cstring>

#include<iomanip>

#include<iostream>

#include<map>

#include<stack>

#include<set>

#include<queue>

#define maxn 15010

using namespace std;

int read()

{

    int x=0,f=1;

    char ch=getchar();

    while(!isdigit(ch)&&ch!='-')ch=getchar();

    if(ch=='-')f=-1,ch=getchar();

    while(isdigit(ch))x=(x<<3)+(x<<1)+ch-'0',ch=getchar();

    return x*f;

}

void write(int x)

{

    int f=0;char ch[20];

    if(x==0){putchar('0'),putchar('\n');return;}

    if(x<0){putchar('-'),x=-x;}

    while(x)ch[++f]=x%10+'0',x/=10;

    while(f)putchar(ch[f--]);

    putchar('\n');

}

int ans,k,fa[maxn],n,lst[maxn];

char s[maxn];

void rebuild()

{

    for(int i=1;i<n;i++)s[i]=s[i+1];

    n--;

}

int main()

{

    scanf("%s%d",s+1,&k);

    n=strlen(s+1);

    for(;n>=(k<<1|1);)

    {

        fa[1]=0,fa[0]=-1;lst[0]=lst[1]=-1;

        for(int i=2;i<=n;i++)

        {

            lst[i]=-1;

            int u=i-1;

            while(s[fa[u]+1]!=s[i]&&u)u=fa[u];

            if(!u)fa[i]=0;

            else fa[i]=fa[u]+1;

        }

        for(int i=1;i<=n;i++)

        {

            int u=fa[i];

            while((u<<1|1)>i&&fa[u]>=k){if(lst[u]!=-1)u=lst[u];else u=fa[u];}

            //cout<<u<<endl;

            if((u<<1|1)<=i&&u>=k) lst[i]=u,ans++;

            //cout<<lst[i]<<" ";

        }

        //cout<<"+++"<<endl;

        rebuild();

    }

    write(ans);

    return 0;

}

/*

aaaaa

1

*/

4.bzoj3942->

先想一个比较暴力的：让一个指针k从头往后扫S，每次判断长度为|T|的后缀是否等于T。

这个的时间复杂度是O(|S|*|T|)，发现判断长度为|T|的后缀是否等于T有点像kmp。

那么就可以再维护一个指针p，表示T中走到的位置。对于S的每一位，开一个数组记录k走到这里时p走到的位置。

每当p走到T的结尾时，k退回|T|前的位置，p变成之前记录的k走到该点时p的位置。

#include<algorithm>

#include<cmath>

#include<cstdio>

#include<cstdlib>

#include<cstring>

#include<iomanip>

#include<iostream>

#include<map>

#include<set>

#include<stack>

#include<queue>

#define maxn 1000010

using namespace std;

char s[maxn],t[maxn];

int fa[maxn],mat[maxn],top,ns,nt,ans[maxn];

void go(int & u,char c)

{

    while(t[u+1]!=c){u=fa[u];if(!u)break;}

    if(t[u+1]==c)u++;

    else u=0;

}

int main()

{

    //freopen("censor.in","r",stdin);

    //freopen("censor.out","w",stdout);

    scanf("%s%s",s+1,t+1);

    ns=strlen(s+1),nt=strlen(t+1);

    fa[1]=0;

    for(int i=2;i<=nt;i++)

    {

        int u=i-1;

        while(t[fa[u]+1]!=t[i]&&u)u=fa[u];

        if(!u)fa[i]=0;

        else fa[i]=fa[u]+1;

    }

    int u=0;

    for(int i=1;i<=ns;i++)

    {

        go(u,s[i]);

        mat[i]=u;

        ans[++top]=i;

        if(u==nt)

        {

            top-=nt;

            u=mat[ans[top]];

        }

    }

    //for(int i=1;i<=ns;i++)cout<<mat[i]<<" ";cout<<endl;

    for(int i=1;i<=top;i++)putchar(s[ans[i]]);

    return 0;

}

并不对劲的字符串专题（二）：kmp的更多相关文章

字符串专题之KMP算法
写点自己对KMP的理解,我们有两个字符串A和B,求A中B出现了多少次. 这种问题就可以用KMP来求解. 朴素的匹配最坏情况是O(n^2)的.KMP是个高效的算法,效率是O(n)的. KMP算法的思想是 ...
字符串专题：KMP POJ 3561
http://poj.org/problem?id=3461 KMP这里讲的不错next的求法值得借鉴 http://blog.sina.com.cn/s/blog_70bab9230101g0qv. ...
并不对劲的字符串专题（三）：Trie树
据说这些并不对劲的内容是<信息学奥赛一本通提高篇>的配套练习. 并不会讲Trie树. 1.poj1056-> 模板题. 2.bzoj1212-> 设dp[i]表示T长度为i的前 ...
LeetCode 字符串专题（一）
目录 LeetCode 字符串专题 <c++> \([5]\) Longest Palindromic Substring \([28]\) Implement strStr() [\(4 ...
「kuangbin带你飞」专题二十二区间DP
layout: post title: 「kuangbin带你飞」专题二十二区间DP author: "luowentaoaa" catalog: true tags: - ku ...
NOIP2018提高组金牌训练营——字符串专题
NOIP2018提高组金牌训练营——字符串专题 1154 回文串划分有一个字符串S,求S最少可以被划分为多少个回文串. 例如:abbaabaa,有多种划分方式. a|bb|aabaa - 3 个 ...
SQL语句复习【专题二】
SQL语句复习[专题二] 单行函数(日期.数学.字符串.通用函数.转换函数)多行函数.分组函数.多行数据计算一个结果.一共5个.sum(),avg(),max(),min(),count()分组函数 ...
【算法系列学习三】[kuangbin带你飞]专题二搜索进阶之 A-Eight 反向bfs打表和康拓展开
[kuangbin带你飞]专题二搜索进阶之 A-Eight 这是一道经典的八数码问题.首先,简单介绍一下八数码问题: 八数码问题也称为九宫问题.在3×3的棋盘,摆有八个棋子,每个棋子上标有1至8的 ...
数据结构学习之字符串匹配算法(BF||KMP)
数据结构学习之字符串匹配算法(BF||KMP) 0x1 实验目的通过实验深入了解字符串常用的匹配算法(BF暴力匹配.KMP.优化KMP算法)思想. 0x2 实验要求编写出BF暴力匹配.KM ...

随机推荐

[codeforces722D]Generating Sets
[codeforces722D]Generating Sets 试题描述 You are given a set Y of n distinct positive integers y1, y2, . ...
基于神经网络的embeddding来构建推荐系统
在之前的博客中,我主要介绍了embedding用于处理类别特征的应用,其实,在学术界和工业界上,embedding的应用还有很多,比如在推荐系统中的应用.本篇博客就介绍了如何利用embedding来构 ...
hdu 2181暴搜
#include<stdio.h> #include<string.h> #define N 30 int map[N][4],total; void dfs(int n,in ...
数字游戏（codevs 1085）
题目描述 Description 丁丁最近沉迷于一个数字游戏之中.这个游戏看似简单,但丁丁在研究了许多天之后却发觉原来在简单的规则下想要赢得这个游戏并不那么容易.游戏是这样的,在你面前有一圈整数(一共 ...
[Vijos] 河蟹王国
描述河蟹王国有一位河蟹国王,他的名字叫羊驼.河蟹王国富饶安定,人们和谐相处.有一天,羊驼国王心血来潮,想在一部分人中挑出最和谐的人.于是,羊驼国王将他的子民排成了一列(==!!b汗~好长呀).每个人 ...
less的配置和使用
less 的配置: 1.浏览器端的使用 <link rel="stylesheet/less" type="text/css" href="st ...
Flume+kakfa+sparkStream实时处理数据测试
flume:从数据源拉取数据 kafka:主要起到缓冲从flume拉取多了的数据 sparkStream:对数据进行处理一.flume拉取数据 1.源数据文件读取配置在flume目录的 ...
msp430项目编程11
msp430中项目---步进电机控制系统 1.步进电机工作原理 2.电路原理说明 3.代码(显示部分) 4.代码(功能实现) 5.项目总结 msp430项目编程 msp430入门学习
HDU 6395 分段矩阵快速幂 HDU 6386 建虚点+dij
http://acm.hdu.edu.cn/showproblem.php?pid=6395 Sequence Time Limit: 4000/2000 MS (Java/Others) Me ...
[Bzoj1297][Scoi2009 ]迷路（矩阵乘法 + 拆点）
1297: [SCOI2009]迷路 Time Limit: 10 Sec Memory Limit: 162 MBSubmit: 1385 Solved: 993[Submit][Status] ...

并不对劲的字符串专题（二）：kmp

并不对劲的字符串专题（二）：kmp的更多相关文章

随机推荐

热门专题