KMP入门
First.先上一份最原始的无任何优化的代码(暴力):
#include <iostream>
#include <cstring>
using namespace std;
char s[1000],p[1000]; inline int getans(char* s,char* p){
int sl=strlen(s),pl=strlen(p);
int i=0,j=0;
while(i<sl && j<pl){
if(s[i]==p[j])
i++,j++;
else{
i=i-j+1;
j=0;
}
}
if(j==pl) return i-j;
else return -1;
} int main(){
cin>>s>>p;
int ans=getans(s,p);
cout<<ans<<endl;
return 0;
}
对于文本串S和模拟串P,进行匹配。
i表示S串的位置,同理,j表示P串的位置;
若当前字符匹配,则进行下一个(i++,j++);
否则,将P归零,S回溯到上一次匹配的位置;
输出的是第一次匹配的位置。
Second.开始第一次优化(KMP):
在上述的暴力中,我们可以发现,每次失配时,i返回到了前面很远的地方,所以我们想搞这样一个东西;
它具备一个特殊性质:
在每次失配是,直接让P跳到这个位子上,大大减少复杂度。
在此,我们需要引入一个叫做next的数组;
但是,仍然有最坏的情况,就是需要重新匹配;
那么此时的next[i]=0或-1,表示重头在来;
若next[i]=k,则表示P跳过了k个字符。
简略代码:
inline int KMPsearch(char* s,char* p){
int sl=strlen(s),pl=strlen(p);
int i=0,j=0;
while(i<sl && j<pl){
if(s[i]==p[j]||j==-1)//j==-1表示匹配成功,进行后续的字符匹配
i++,j++;
else
j=nxt[j];//i不用变,j直接跳到预处理好的next[j]处
}
if(j==pl) return i-j;
else return -1;
}
1.
next数组记录的是长度最大且相等的前缀后缀;
举个例子:
P1: ABA
P2: ABAB
在P1中,他有长度为1的相同前缀后缀A
在P2中,他有长度为2的相同前缀后缀AB
(盗图勿喷)
2.
我们来求next数组;
将第一步中的长度稍作变形即可;
(同上)
整体右移一位,将第一位赋值为-1。
也可以这样理解:(与-1无关了就)
如果相等,则该位的next值就是前一位的next值加上1;
如果不等,向前继续寻找next值对应的内容来与前一位进行比较,直到找到某个位上内容的next值对应的内容与前一位相等为止,则这个位对应的值加上1即为需求的next值;如果找到第一位都没有找到与前一位相等的内容,那么需求的位上的next值即为1。
3.
代码求next数组;
inline void GetNext2(char *p,int nxt[]){
int pl=strlen(p);
nxt[0]=-1;
int k=-1;
int j=0;
while(j<pl-1){
if(k==-1 || p[j]==p[k]){
++j,++k;
if(p[j]!=p[k])
nxt[j]=k;
else nxt[j]=nxt[k];
}
else k=nxt[k];
}
}
Third.对于next数组的优化:
在上文所述中,有个小问题:
就是说,在j向后跳到了next[k]时,必然失配,
就是因为p[j]=p[next[j]];
那就要处理出所有这种情况,递归
next[j]=p[next[next[j]]]。
Finally.整体代码(可直接食用哦):
#include <iostream>
#include <cstdio>
#include <algorithm>
#include <cstring>
using namespace std; char s[100],p[100];
int nxt[100]; inline void GetNext2(char *p,int nxt[]){
int pl=strlen(p);
nxt[0]=-1;
int k=-1;
int j=0;
while(j<pl-1){
if(k==-1 || p[j]==p[k]){
++j,++k;
if(p[j]!=p[k])
nxt[j]=k;
else nxt[j]=nxt[k];
}
else k=nxt[k];
}
} inline int KMPsearch(char* s,char* p){
int sl=strlen(s),pl=strlen(p);
int i=0,j=0;
while(i<sl && j<pl){
if(s[i]==p[j]||j==-1)
i++,j++;
else
j=nxt[j];
}
if(j==pl) return i-j;
else return -1;
} int main(){
cin>>s>>p;
GetNext2(p,nxt);
int ans=KMPsearch(s,p);
cout<<ans<<'\n';
return 0;
}
嗯,真香
KMP入门的更多相关文章
- zstu.4194: 字符串匹配(kmp入门题&& 心得)
4194: 字符串匹配 Time Limit: 1 Sec Memory Limit: 128 MB Submit: 206 Solved: 78 Description 给你两个字符串A,B,请 ...
- 题解报告:hdu 2087 剪花布条(KMP入门)
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=2087 Problem Description 一块花布条,里面有些图案,另有一块直接可用的小饰条,里面 ...
- hdu 1358 Period(KMP入门题)
Period Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others)Total Subm ...
- KMP入门题目[不定期更新]
HDU 1711 Number Sequence(模板题) #include <cstdio> ; ; int N, M; int textS[MAXN]; int tarS[MAXL]; ...
- KMP入门(匹配)
Description Given two sequences of numbers : a[1], a[2], ...... , a[N], and b[1], b[2], ...... , b[M ...
- hdu 1358 period KMP入门
Period 题意:一个长为N (2 <= N <= 1 000 000) 的字符串,问前缀串长度为k(k > 1)是否是一个周期串,即k = A...A;若是则按k从小到大的顺序输 ...
- hdu 1686 & poj 2406 & poj 2752 (KMP入门三弹连发)
首先第一题 戳我穿越;http://acm.hdu.edu.cn/showproblem.php?pid=1686 题目大意好理解,每组输入一个子串和一个母串,问在母串中有多少个子串? 文明人不要暴力 ...
- HDU2203(KMP入门题)
亲和串 Time Limit: 3000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)Total Submiss ...
- HDU2087(KMP入门题)
剪花布条 Time Limit: 1000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)Total Submis ...
- HUD1686(KMP入门题)
Oulipo Time Limit: 3000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)Total Subm ...
随机推荐
- 数据结构&算法
20个最常用.最基础数据结构与算法: 10个数据结构:数组.链表.栈.队列.散列表.二叉树.堆.跳表.图.Trie 树. 10个 算法 :递归.排序.二分查找.搜索.哈希.贪心.分治.回溯. ...
- swagger--Failed to load API definition.
打开 http://localhost:5000/swagger/v1/swagger.json 提示错误 An unhandled exception occurred while processi ...
- vs2019离线下载安装包
官方的离线安装说明-->点击打开 1.下载 vs2019引导程序 ,选择你所需的版本下载,我选择了企业版 vs_enterprise__184447765.1558180718.exe 2.设置 ...
- 【Spring注解驱动开发】自定义TypeFilter指定@ComponentScan注解的过滤规则
写在前面 Spring的强大之处不仅仅是提供了IOC容器,能够通过过滤规则指定排除和只包含哪些组件,它还能够通过自定义TypeFilter来指定过滤规则.如果Spring内置的过滤规则不能够满足我们的 ...
- JS input输入框字数超出长度显示省略号.....
样式添加: overflow:hidden; white-space:nowrap; text-overflow:ellipsis;
- redis的5种数据结构和基本操作
1.字符串(string) 1.1设置值 set key value [ex seconds] [px milliseconds] [nx|xx] 例如: 127.0.0.1:6379> set ...
- 2019-02-09 python爬取mooc视频项目初级简单版
今天花了一下午时间来做这东西,之前没有自己写过代码,50几行的代码还是查了很多东西啊,果然学起来和自己动起手来完全是两码事. 方案:requests库+正则表达式提取视频下载链接+urlretriev ...
- iOS开发实践-OOM治理
概览 说起iOS的OOM问题大家第一想到的应该更多的是内存泄漏(Memory Leak),因为无论是从早期的MRC还是2011年Apple推出的ARC内存泄漏问题一直是iOS开发者比较重视的问题,比如 ...
- Linux下搭建mysql
[准备环境] Linux centos7 [mysql安装步骤] 1.首先确定centos版本 cat /etc/redhat-release 2.yum安装 yum -y install mar ...
- TestLoader源码解析
def loadTestsFromTestCase(self, testCaseClass) #看名称分析:从TestCase找测试集--那么就是把我们的def用例加载到testSuit里面 def ...