KMP算法在字符串中的应用

KMP算法是处理字符串匹配的一种高效算法

它首先用O(m)的时间对模板进行预处理，然后用O(n）的时间完成匹配。从渐进的意义上说，这样时间复杂度已经是最好的了，需要O(m+n)时间。对KMP的学习可以为AC-自动机做铺垫，学习KMP算法的核心是要理解失配函数，比如一条状态链，其中编号为i的节点表示已经匹配了i个字符，匹配开始的状态是0，成功匹配状态是1（表示多匹配了一个字符），而失配时沿着“失配边”走。为方便起见，这里的失配函数f[i]表示状态i失配时应转移到的新状态，特别需要注意f[0]=0;

有了失配函数以后，KMP算法不难写出：

void find(char *t,char *p,int *f)

{

    int n=strlen(t),m=strlen(p);

    getfail(p,f);

    int j=0;

    for(int i=0;i<n;i++)

    {

        while(j&&p[j]!=t[i])  j=f[j];

        if(p[j]==f[i])   j++;

        if(j==m)   printf("%d\n",i-m+1);

    }

}

总的时间复杂度为O(n)

状态转移图是构造KMP的关键也是最巧妙的地方，算法思想就是自己匹配自己，进行递推:

void getfaile(char *p,int *f)

 {

     int m=strlen(p);

     f[0]=0;

     f[1]=0;

     for(int i=1;i<m;i++)

     {

         int j=f[i];

         while(j&&p[i]!=p[j])  j=f[j];

         f[i+1]=p[i]==p[j] ? j+1 : 0;

     }

 }

求周期串类型（KMP模板题）

链接：https://icpcarchive.ecs.baylor.edu/index.php?option=com_onlinejudge&Itemid=8&page=show_problem&problem=1027

题解：

根据后缀函数的定义，“错位部分”长度为i-f[i]，如果这i个字符组成一个周期串，那么“错位”部分恰好是一个循环节，因此k(i-f[i])=i（注意k>1，因此i-f[i]不能等于i，必须有饭f[i]>0)

#include<iostream>

#include<cstdio>

#include<cstring>

#include<string>

using namespace std;

const int maxn=1000000+10;

int f[maxn];

string p;

int main()

{

    int n,cas=0;

    while(cin>>n)

    {

        if(n==0)   break;

        cin>>p;

        f[0]=0;

        f[1]=0;

        for(int i=1;i<n;i++)

        {

            int j=f[i];

            while(j&&p[i]!=p[j]) j=f[j];

            f[i+1]=p[i]==p[j] ? j+1 : 0;

        }

        printf("Test case #%d\n",++cas);

        for(int i=2;i<=n;i++)

            if(f[i]>0&&i%(i-f[i])==0)

            printf("%d %d\n",i,i/(i-f[i]));

            cout<<endl;

    }

    return 0;

}

KMP裸题（求子串重复的次数）（本人poj的第50题）

链接： http://poj.org/problem?id=3461

#include<iostream>

#include<cstdio>

#include<cstring>

using namespace std;

const int maxn=1000000+10;

int f[maxn];

char p[maxn],t[maxn];

int main()

{

    int k;

    cin>>k;

    while(k--)

    {

        cin>>p>>t;

        int n=strlen(t),m=strlen(p);

        memset(f,0,sizeof(f));

        f[0]=0;

        f[1]=0;

        for(int i=1;i<m;i++)

        {

            int j=f[i];

            while(j&&p[i]!=p[j])   j=f[j];

            f[i+1]=p[i]==p[j] ? j+1 : 0;

        }

        int j=0,tt=0;

        for(int i=0;i<n;i++)

        {

            while(j&&p[j]!=t[i])   j=f[j];

            if(p[j]==t[i])   j++;

            if(j==m)  ++tt;

        }

        cout<<tt<<endl;

    }

    return 0;

}

KMP找出第一次出现匹配的位置：

链接：http://acm.hdu.edu.cn/showproblem.php?pid=1711

#include<iostream>

#include<cstdio>

#include<cstring>

using namespace std;

const int maxn=1000000+10;

int p[maxn],t[maxn];

int f[maxn];

int main()

{

    int k;

    scanf("%d",&k);

    while(k--)

    {

        int n,m;

        scanf("%d%d",&n,&m);

        for(int i=0;i<n;i++)

            scanf("%d",&t[i]);

        for(int i=0;i<m;i++)

            scanf("%d",&p[i]);

        memset(f,0,sizeof(f));

        f[0]=0;

        f[1]=0;

        for(int i=1;i<m;i++)

        {

            int j=f[i];

            while(j&&p[i]!=p[j])  j=f[j];

            f[i+1]=p[i]==p[j] ? j+1 : 0;

        }

        int j=0,flag=0,tt;

        for(int i=0;i<n;i++)

        {

            while(j&&p[j]!=t[i]) j=f[j];

            if(p[j]==t[i])   j++;

            if(j==m)

            {

                flag=1;

                tt=i-m+2;

                break;

            }

        }

        if(flag==1)

            printf("%d\n",tt);

        else

            printf("-1\n");

    }

    return 0;

}

求最短的重复串出现的次数

链接：http://poj.org/problem?id=2406

思路：KMP，next表示模式串如果第i位(设str[0]为第0位)与文本串第j位不匹配则要回到第next[i]位继续与文本串第j位匹配。则模式串第1位到next[n]与模式串第n-next[n]位到n位是匹配的。所以思路和上面一样，如果n%（n-next[n]）==0,则存在重复连续子串，长度为n-next[n]。

例如：a b a b a b

next:-1 0 0 1 2 3 4

next[n]==4,代表着，前缀abab与后缀abab相等的最长长度，这说明，ab这两个字母为一个循环节，长度=n-next[n];

#include<iostream>

#include<cstdio>

#include<cstring>

using namespace std;

const int maxn=1000000+10;

char p[maxn];

int f[maxn];

int main()

{

    while(scanf("%s",p)!=EOF)

    {

        if(p[0]=='.')  break;

        int n=strlen(p);

        memset(f,0,sizeof(f));

        f[0]=0;

        f[1]=0;

        for(int i=1;i<n;i++)

        {

            int j=f[i];

            while(j&&p[i]!=p[j])  j=f[j];

            f[i+1]=p[i]==p[j] ? j+1 : 0;

        }

        if(n%(n-f[n])==0)

            cout<<n/(n-f[n])<<endl;

        else

            cout<<"1"<<endl;

    }

    return 0;

}

KMP算法在字符串中的应用的更多相关文章

51NOD 1292 1277（KMP算法，字符串中的有限状态自动机）
在前两天的CCPC网络赛中...被一发KMP题卡了住了...遂决定,哪里跌倒就在哪里爬起来...把个KMP恶补一发,连带着把AC自动机什么的也整上. 首先,介绍设定:KMP算法计划解决的基本问题是,两 ...
KMP算法 --- 在文本中寻找目标字符串
KMP算法 --- 在文本中寻找目标字符串很多时候,为了在大文本中寻找到自己需要的内容,往往需要搜索关键字.这其中就牵涉到字符串匹配的算法,通过接受文本和关键词参数来返回关键词在文本出现的位置.一般 ...
回朔法/KMP算法-查找字符串
回朔法:在字符串查找的时候最容易想到的是暴力查找,也就是回朔法.其思路是将要寻找的串的每个字符取出,然后按顺序在源串中查找,如果找到则返回true,否则源串索引向后移动一位,再重复查找,直到找到返回t ...
基于KMP算法的字符串模式匹配问题
基于KMP算法的字符匹配问题反正整个清明都在纠结这玩意...差点我以为下个清明要给自己过了. 至于大体的理解,我就不再多说了(还要画图多麻烦鸭),我参考了以下两个博客,写的真的不错,我放了超链接,点 ...
KMP算法（字符串的匹配）
视频参考对于正常的字符串模式匹配,主串长度为m,子串为n,时间复杂度会到达O(m*n),而如果用KMP算法,复杂度将会减少线型时间O(m+n). 设主串为ptr="ababaaababaa ...
利用Manacher算法寻找字符串中的最长回文序列（palindrome）
寻找字符串中的最长回文序列和所有回文序列(正向和反向一样的序列,如aba,abba等)算是挺早以前提出的算法问题了,最近再刷Leetcode算法题的时候遇到了一个(题目),所以就顺便写下. 如果用正反 ...
[算法]去掉字符串中连续出现的k个0子串
题目: 给定一个字符串str和一个整数k,如果str中正好有k个‘0’字符出现时,把k个连续的‘0’字符去除,返回处理后的字符串. 举例: str=”A00B”,k=2,返回“AB” str=”A00 ...
KMP算法查找字符串
假设长字符串为t,短字符串为p.为了进行KMP匹配,首先需要计算字符串p的next数组,后面实现了计算该数组的函数void KmpGenNext(char* p, int* next).对于”abca ...
FZU 2122 又见LKity【字符串/正难则反/KMP/把一个字符串中某个部分替换为另一个部分】
嗨!大家好,在TempleRun中大家都认识我了吧.我是又笨又穷的猫猫LKity.很高兴这次又与各位FZU的ACMer见面了.最近见到FZU的各位ACMer都在刻苦地集训,整天在日光浴中闲得发慌的我压 ...

随机推荐

Java调用K3Cloud的密码加密算法实现登录密码检验
背景: 最近要开始做K3Cloud移动,BOS平台的移动单据收费,就想单独做移动模块,搭建环境:后台SSH2,前端Android.在手机端登录时通过Ajax方式传递用户名和密码到后台校验,后台在去K3 ...
POJ 1724 【存在附加约束的最短路问题】【优先队列】
题意:给K个权值.给含有N个点,R条单向边的图. 每条边都有两个权值,其中一个路长,另外一个是附加权值. 要求路的附加权值之和不超过K的情况下求最短路. 思路: 自己的思路太狭隘,这题还是看了大牛的思 ...
解决idea中启动tomcat出现控制台乱码问题
尝试了很多方法,最后终于解决了,现在提供给大家一个我认为最简单也最有效的方案. 1.修改配置文件找到idea的安装目录,在bin文件夹下找到以下两个文件,用记事本或者其他软件打开: 然后两个文件中都 ...
转常见hash算法的原理
散列表,它是基于快速存取的角度设计的,也是一种典型的“空间换时间”的做法.顾名思义,该数据结构可以理解为一个线性表,但是其中的元素不是紧密排列的,而是可能存在空隙. 散列表(Hash table,也叫 ...
Exception: Could not bind to 0.0.0.0:8080 after trying for 30 seconds
swift@vincent-virtual-machine /etc/swift $ sudo swift-init main restart Signal proxy-server pid: sig ...
eclipse发布项目到tomcat部署目录
1.在eclipse下建立Dynamic Web Project工程zhgy,在使用eclipse中new一个tomcat,通过启动该tomcat来发布Dynamic Web Project的时候,其 ...
nexus-3本地下载jar的settipng.xml配置
打开maven安装目录下的setting.xml <servers> <server> <id>nexus</id> <username>a ...
微信小程序之 SideBar（侧栏分类）
项目目录: 模拟数据: utils / data.js function getSData() { var data = [ { "id": 1, "tree" ...
Web开发从零单排之一：在新浪云平台SAE上开发一个html5电子喜帖
需求描述: 本人大婚将至,女朋友说“现在都流行在微信上发电子请帖了,你不是技(cheng)术(xu)宅(yuan)嘛,不会连这个都搞不定吧” 本人嘴上说这等小事何足挂齿,但心里还是七上八下的,虽然自认 ...
API Copy Big FIles
public class ApiCopyFile { private const int FO_COPY = 0x0002; private const int FOF_ALLOWUNDO = 0x0 ...

KMP算法在字符串中的应用

KMP算法在字符串中的应用的更多相关文章

随机推荐

热门专题