KMP算法图解:

首先,字符串“BBC ABCDAB ABCDABCDABDE”的第一个字符与搜索词“ABCDABD”的第一个字符,进行比较。因为B与A不匹配,所以搜索词后移一位。

因为B与A不匹配,搜索词再往后移。

就这样,直到字符串有一个字符,与搜索词的第一个字符相同为止。

接着比较字符串和搜索词的下一个字符,还是相同。

直到字符串有一个字符,与搜索词对应的字符不相同为止。 
当空格与D不匹配时,你其实知道前面六个字符是“ABCDAB”。KMP算法的想法是,设法利用这个已知信息,不要把“搜索位置”移回已经比较过的位置,继续把它向后移,这样就提高了效率。

因为空格与C不匹配,搜索词还要继续往后移。

逐位比较,直到发现C与D不匹配。于是,继续将搜索词向后移动。

逐位比较,直到搜索词的最后一位,发现完全匹配,于是搜索完成。

详解

标号(j) 0 1 2 3 4 5 6
模式串(ch) A B C D A B D

(1) KMP算法的核心思想

——就是回溯到存在“对称”的地方。

  • 注意,这里的“对称”不是指ABCCBA,而是指例如“ABCABC”中队前队尾都分别有1个“ABC”,又例如“ABCCCCCAB”中队前队尾都分别有一个“AB”

(2) 看图说话

从图中可以分析得出,当扫描到模式串中某一位发现不匹配,总是回溯到在这一位之前的部分模式串存在重复的地方。

  • 例如图解⑤中找不到字母“D”(标号3),“D”之前串为“ABCDAB”,存在队前队尾重复“AB”(2个字符),因此退回到队首的“AB”后一位“C”(标号2)。
  • 例如图解⑥中找不到字母“C”(标号2),“C”之前串为“AB”,不存在重复的(0个字符),因此退回到队首最前面(标号0)。

所以,next(j)就是当模式串第j位不匹配时即将要退回到的字母标号

(3) next计算过程

不管第一位和第二位是什么,next(0)=-1,next(1)=0,这是固定的。

ps:模式串“ABCDABD”,下标从0开始哦!

  当j=1时,模式串ch[1]=“B”“B”之前有“A”,不存在重复(0位),所以next[1]=0;

  当j=2时,模式串ch[2]=“C”“C”之前有“AB”,不存在重复(0位),所以next[2]=0;

  当j=3时,模式串ch[3]=“D”“D”之前有“ABC”,不存在重复(0位),所以next[3]=0;

  当j=4时,模式串ch[4]=“A”“A”之前有“ABCD”,不存在重复(0位),所以next[4]=0;

  当j=5时,模式串ch[5]=“B”“B”之前有“ABCDA”,存在重复“A”(1位),所以next[5]=1;

  当j=6时,模式串ch[6]=“D”“D”之前有“ABCDAB”,存在重复“AB”(2位),所以next[6]=2;

(4) nextval对next数组的优化

观察第4位A,当它不匹配时,按照next[4]回溯到标号0也为字母“A”,这时再匹配“A”是徒劳的,因为已知“A”不匹配,所以就继续退回到标号0字母“A”的next[0]=-1。为了计算更加直接,就有了nextval对next数组的优化:

只看前面有重复字母的几位就可以。

  首先,nextval[0]默认为-1;

  当1≤j≤3时,“BCD”在此之前均无重复的字母,所以nextval[j]=next[j];

  当j=4时,模式串ch[4]=“A”,next[4]=0,ch[0]=“A”=ch[4],由于“A”=“A”,所以nextval[4]=nextval[0]=-1;

  当j=5时,模式串ch[5]=“B”,next[5]=1,ch[1]=“B”=ch[5],由于“B”=“B”,所以nextval[5]=nextval[1]=0;

  当j=6时,模式串ch[6]=“D”,next[6]=2,ch[2]=“C”=ch[6],由于“C”“D”,所以nextval[6]保持原样,即nextval[6]=next[6]=2;

(5) 代码实现:

功能1:返回模式串ch在主串str中首次出现的位置,未出现输出-1

功能2:返回模式串ch在主串str中出现的次数

#include<bits/stdc++.h>
#define MAX 1000005
using namespace std;
char str[MAX],ch[MAX];
int next[MAX],slen,clen;
void getnext()
{
int i=,j=-;
next[]=-;
while(i<clen)
{
if(j==-||ch[i]==ch[j])
next[++i]=++j;
else j=next[j];
}
}
//返回模式串ch在主串str中首次出现的位置
//返回的位置是从0开始的
int kmp()
{
getnext();
int i=,j=;
while(i<slen&&j<clen)
{
if(j==-||str[i]==ch[j])
{
i++;
j++;
}
else j=next[j];
}
if(j==clen)
return i-clen;
else return -;
} //返回模式串ch在主串s中出现的次数
int Count()
{
int i=,j=,sum=;
if(slen==&&clen==)
{
if(str[]==ch[])
return ;
else return ;
}
getnext();
for(i=;i<slen;i++)
{
while(j>&&str[i]!=ch[j])
j=next[j];
if(str[i]==ch[j])
j++;
if(j==clen)
{
sum++;
j=next[j];
}
}
return sum;
}
int main()
{
while(cin>>str>>ch)
{
slen=strlen(str);
clen=strlen(ch);
cout<<"模式串ch在主串s中首次出现的位置是:"<<kmp()<<endl;
cout<<"模式串ch在主串s中出现的次数:"<<Count()<<endl;
}
return ;

算法竞赛模板 KMP的更多相关文章

  1. 算法竞赛模板 AC自动机

    AC自动机基本操作 (1) 在AC自动机中,我们首先将每一个模式串插入到Trie树中去,建立一棵Trie树,然后构建fail指针. (2) fail指针,是穿插在Trie树中各个结点之间的指针,顾名思 ...

  2. 算法竞赛模板 动态规划之背包DP

    ① 01背包 有n件物品和一个容量为v的背包.第i件物品的价值是c[i],体积是w[i].求解将哪些物品装入背包可使价值总和最大. 这是最基础的背包问题,特点是:每种物品仅有一件,可以选择放或不放. ...

  3. KMP算法(——模板习题与总结)

    KMP算法是一种改进的模式匹配算法,相比于朴素的模式匹配算法效率更高.下面讲解KMP算法的基本思想与实现. 先来看一下朴素模式匹配算法的基本思想与实现. 朴素模式匹配算法的基本思想是匹配过程中如果该位 ...

  4. ACM-ICPC竞赛模板

    为了方便打印,不再将代码放到代码编辑器里,祝你好运. ACM-ICPC竞赛模板(1) 1. 几何 4 1.1 注意 4 1.2 几何公式 4 1.3 多边形 6 1.4 多边形切割 9 1.5 浮点函 ...

  5. Aho-Corasick automaton(AC自动机)解析及其在算法竞赛中的典型应用举例

    摘要: 本文主要讲述了AC自动机的基本思想和实现原理,如何构造AC自动机,着重讲解AC自动机在算法竞赛中的一些典型应用. 什么是AC自动机? 如何构造一个AC自动机? AC自动机在算法竞赛中的典型应用 ...

  6. 算法起步之kmp算法

    [作者Idlear  博客:http://blog.csdn.net/idlear/article/details/19555905]            这估计是算法连载文章的最后几篇了,马上就要 ...

  7. [C++]竞赛模板·数据统计与IO(重定向版与非重定向版)

      /* 数据统计与IO 重定向版模板 描述:本机测试用文件数据流重定向,一旦提交到比赛就自动“删除”重定向语句 */ # define LOCAL #include<stdio.h> # ...

  8. c++算法竞赛常用板子集合(持续更新)

    前言 本文主要包含算法竞赛一些常用的板子,码风可能不是太好,还请见谅. 后续会继续补充没有的板子.当然我太菜了有些可能写不出来T^T 稍微有些分类但不多,原谅我QwQ 建议 Ctrl + F 以快速查 ...

  9. Hihocoder 太阁最新面经算法竞赛18

    Hihocoder 太阁最新面经算法竞赛18 source: https://hihocoder.com/contest/hihointerview27/problems 题目1 : Big Plus ...

随机推荐

  1. Codeforces 497B Tennis Game( 枚举+ 二分)

    B. Tennis Game time limit per test 2 seconds memory limit per test 256 megabytes input standard inpu ...

  2. Xcode开发时碰到的问题

    1.打包成功后,发布到蒲公英上,显示"未签名,只能越狱手机可以安装". 出现这个问题,是因为打包的时候签名没有获取到.下面是配置签名的大概步骤. 打包的时候需要点击左上角选择这个设 ...

  3. js常用转义字符列表

    转义字符 含义 \n 换行 \t 制表符 \b 空格 \r 回车 \f 换页符 \ 反斜杠 ' 单引号 '' 双引号 \0nnn 八进制代码 nnn 表示的字符( n 是 0 到 7 中的一个八进制数 ...

  4. css行高的用法总结

    css没有提供一个直接设置行间距的方式,所以只能通过设置行高来间接的设置行间距,行高越大行间距就越大,用 line-height 来设置行高. .p1 { /* 设置行高 */ line-height ...

  5. redis 分布式锁的正确实现方式

    前言 分布式锁一般有三种实现方式:1. 数据库乐观锁:2. 基于Redis的分布式锁:3. 基于ZooKeeper的分布式锁.本篇博客将介绍第二种方式,基于Redis实现分布式锁.虽然网上已经有各种介 ...

  6. PHP 遍历数组for foreach while

    以下是使用foreach  while  for 三种循环展示遍历数组的概念 1:foreach( ) <?php $a = array('hank','mike','lucy'); forea ...

  7. Ubuntu14.04搭建Boa服务

    1. 下载 boa 源码 : https://sourceforge.net/projects/boa/ 版本:boa-0.94.13.tar.gz 2. 在Ubuntu 下解压进入 [boa-0.0 ...

  8. centos 升级python

    1.下载python3.6.1的包 wget https://www.python.org/ftp/python/3.6.1/Python-3.6.1.tgz 2.解压 tar -zxvf Pytho ...

  9. testNG 并发测试

     invocationCount是并发数,threadPoolSize是线程数,当线程是1的时候就是依次执行n次,当线程是并发次数时,就是同时执行n次    @Test public void abc ...

  10. 每天一个linux命令:mv(7)

    mv mv命令可以用来移动文件或者将文件改名(move (rename) files),是Linux系统下常用的命令,经常用来备份文件或者目录. 在跨文件系统移动文件时,mv先拷贝,再将原有文件删除, ...