KMP模板及总结

KMP是一种字符串匹配算法，它在时间复杂度上较暴力匹配算法由很大的优势。比如我要找字符串S中是否存在子串P，如果暴力匹配的话，则时间复杂度为O（n*m），而kmp算法时间复杂度为O（n+m）。

这里我们有一个辅助的数组next[]（先别管怎么求出来的），next[i]含义是模式串P中[0....i-1]这一段的长度小于这段字符串的长度的最长公共前缀(比如ababa，公共前缀就是aba)。

好，那我们接下来讲一下kmp算法的具体操作：

假设，我们开始有字符串S：ababaaba 模式串P：abaa

对应next[i](0=<i<=len(P))的值为：

next[0]=-1 (无)

next[1]=0 (a)

next[2]=0 (ab)

next[3]=1 (aba)

next[4]=1 (abaa)

好，有了next数组，我们接下来进行匹配，设i=0是S上的当前匹配位置，j=0是P上的当前匹配位置。

第一次匹配，一直到i=3，j=3时匹配失败，令j=nxet[j]继续匹配。（为什么可以令j=next[j]？简单来说P[0...0]等于P[2...2]，而通过第一次匹配，我们知道P[2..2]等于S[2...2]，所以可以跳过这一段不用重复匹配，具体原理接下来解释）

第二次匹配，从i=3,j=1开始，匹配成功，获得答案。

大概过程就是这样。

下面按我自己的理解，解释一下kmp的原理：

如下图所示（图很丑，我真的不知道怎么画图），S[0...i]和P[0...i]匹配上了，匹配到i+1时匹配失败。

好，我们仔细分析一下，设L=nxet[i+1]，则P[0...L]等于P[i-L...i]，又因为通过刚才的匹配，我们确定了S[0...i]等于P[0...i]，所以在S上也有一段对应的S[L-i...i]=P[L-i..i]=P[0...L]。

所以第二次匹配时，我们可以直接将P挪动，使P[0...L]对应S[L-i...i]，直接从i+1开始匹配(即上文中的j=next[j])，如下图所示:

P[0...L]=S[L-i..i]可以理解，但是为什么可以直接挪过来呢，忽略了可能出现的情况怎么办？比如说下图这样的情况：

是否会有一段这样的字符串S[k..k+m]被我们忽略呢？若有的话，那显然k的位置更优因为i-k>L更有利于我们减少重复匹配。

实际上是不存在的，很容易知道，若存在一段长度大于L的S[k...i]=P[0...i-k+1]那么因为P[0...i]=S[0...i]肯定会有一段P[k..i]=S[k..i]=P[0..i-k+1]，即P[0...i-k+1]和P[k..i]是一段公共前缀。

但是前面我们说了L=next[i+1]表示P[0...i]的最长公共前后缀，而上述的情况存在则说明有比L更长的公共前缀，这就矛盾了，所以S[k...k+m]这样的字符串是不存在的。

好了，这下kmp的原理我们知道了，接下来说next数组是如何构造的：

其实求next数组相当于模式串P自己跟自己做kmp，然后将最大的匹配结果记录在对应位置，所以实际上求next数组的代码跟kmp是几乎一样的。

模板代码：

 #include<iostream>

 #include<cstdio>

 #include<cstring>

 #include<algorithm>

 using namespace std;

 const int M=1e6+;

 int nxt[M];

 char s[M],p[M];

 //获得next数组

 void getnext(char *p,int len){

     int i,j;

     i=,j=nxt[]=-;

     while(i<len){

         while(j!=-&&p[i]!=p[j]) j=nxt[j];

         nxt[++i]=++j;

     }

 }

 //返回p在s中第一次出现的位置

 void kmp(char *s,char *p){

     int len1,len2,i,j;

     i=j=;

     len1=strlen(s);

     len2=strlen(p);

     getnext(p,len2);

     while(i<len1){

         while(j!=-&&s[i]!=p[j]) j=nxt[j];

         i++,j++;

         if(j==len2)

             return i-len2+;

     }

     return -;

 }

KMP常见题型：

一、字符串匹配，求出模式串P在S中是否存在，输出第一次出现的位置

HDU 1711

二、求模式串P在S中的出现次数（注意分可重和不可重的情况）

三、求所有公共前后缀(既是前缀又是后缀)

四、求字符串循环节

五、求所有S的前缀在S中出现次数之和

六、最大最小表示

KMP模板及总结的更多相关文章

hdu 1686 KMP模板
// hdu 1686 KMP模板 // 没啥好说的,KMP裸题,这里是MP模板 #include <cstdio> #include <iostream> #include ...
Oulipo HDU 1686 KMP模板
题目大意:求模式串在主串中的出现次数. 题目思路:KMP模板题 #include<iostream> #include<algorithm> #include<cstri ...
KMP模板(bin)
KMP模板主要是kuangbin的模板,之后加了一点我的习惯和理解. kmpN() 作用:构造next数组参数:模式串,模式串长度 kmpC() 作用:返回模式串在主串中出现的次数(可重复) 参数 ...
HDU 1711 - Number Sequence - [KMP模板题]
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=1711 Time Limit: 10000/5000 MS (Java/Others) Memory L ...
HDU 1711 Number Sequence（KMP模板）
http://acm.hdu.edu.cn/showproblem.php?pid=1711 这道题就是一个KMP模板. #include<iostream> #include<cs ...
剪花布条---hdu2087（kmp模板）
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=2087 kmp模板题: #include <cstdio> #include <cst ...
Oulipo----poj3461（kmp模板）
题目链接:http://poj.org/problem?id=3461 和减花布条的题对比一下: 求s2中s1的个数kmp模板: #include<stdio.h> #include& ...
kmp模板 && 扩展kmp模板
kmp模板: #include <bits/stdc++.h> #define PB push_back #define MP make_pair using namespace std; ...
kuangbin专题16B(kmp模板)
题目链接: https://vjudge.net/contest/70325#problem/B 题意: 输出模式串在主串中出现的次数思路: kmp模板在 kmp 函数中匹配成功计数加一, 再令 ...
[HDU1711]KMP模板
解题关键:1.直接套kmp模板即可,注意最后输出的位置,需要在索引的位置+1. 2.next用作数组名在oj中会编译错误, 3.选用g++,只有g++才会接受bits/stdc++.h OJ中g++和 ...

随机推荐

CH暑假欢乐赛 SRM 07 天才麻将少女KPM（DP+treap）
首先LIS有个$O(n^2)$的DP方法 $f(i,j)$表示前i个数,最后一个数<=j的LIS 如果$a_i!=0$则有如果$a_i=0$则有注意因为$f(i-1,j)\leq f(i-1 ...
PHP获取图片主题颜色
(1)工具类:pictureColor.php class pictureColor{ /** * 获取颜色使用库类型 */ public $type = 'gd'; ...
opncv视频资料
链接: http://pan.baidu.com/s/1i37nXSL 密码: 3xnd这一套opncv资料包括视频和pdf资料
Python【多线程与多进程】
import time,threading print("=======串行方式.并行两种方式调用run()函数=======")def run(): print('哈哈哈') # ...
Redis 3.2.8集群+Sentinel部署
Redis3.2.8集群搭建采用官方推荐的三主三从分片方案,本例中所有节点部署在一台主机上. 软件安装: tar zxvf redis-3.2.8.tar.gz cd redis-3.2.8 ma ...
NATS_07：NATS之top工具监控以及测量调优工具
概述你可以使用 nats-top 来实现类似于 linux 中 top 命令的实时监控 nats 服务: 可以使用 nats 提供的工具来进行针对性的调优. 安装nats-top $ go get ...
struct和typedef struct区别
分三块来讲述: 1 首先://注意在C和C++里不同在C中定义一个结构体类型要用typedef: typedef struct Student { int a; }Stu; 于是在声明变量的时候就可 ...
Linux查看服务器公网ip的方法
在解决网络问题时,需要查看本机的出口公网IP信息,有如下两个方法: curl ifconfig.me 在linux系统中输入上述的命令,可以查看到本机连接的公网信息: 如果该命令无效,可以使用下面一个 ...
Java并发编程原理与实战十：单例问题与线程安全性深入解析
单例模式我想这个设计模式大家都很熟悉,如果不熟悉的可以看我写的设计模式系列然后再来看本文.单例模式通常可以分为:饿汉式和懒汉式,那么分别和线程安全是否有关呢? 一.饿汉式先看代码: package ...
正则表达式 grep文本查询 sed流处理应用
一.正则表达: ^:以什么什么开头,^a:以a字符开头 $:以什么什么结尾,b$:以b字符结尾 *:左边字符0-无穷个 +:左边字符1-无穷个 .:代表单字符 ?:前导字符为零个或1个 {n}:左面字 ...

KMP模板及总结

KMP模板及总结的更多相关文章

随机推荐

热门专题