KMP算法 Next数组详解
题面
题目描述
如题,给出两个字符串s1和s2,其中s2为s1的子串,求出s2在s1中所有出现的位置。
为了减少骗分的情况,接下来还要输出子串的前缀数组next。如果你不知道这是什么意思也不要问,去百度搜[kmp算法]学习一下就知道了。
输入输出格式
输入格式:
第一行为一个字符串,即为s1(仅包含大写字母)
第二行为一个字符串,即为s2(仅包含大写字母)
输出格式:
若干行,每行包含一个整数,表示s2在s1中出现的位置
接下来1行,包括length(s2)个整数,表示前缀数组next[i]的值。
输入样例:
ABABABC
ABA
输出样例:
1
3
0 0 1
说明
时空限制:1000ms,128M
数据规模:
设s1长度为N,s2长度为M
对于30%的数据:N<=15,M<=5
对于70%的数据:N<=10000,M<=100
对于100%的数据:N<=1000000,M<=1000
题解
这是一道KMP裸题(模板题。。)
我就是拿着它学习一下KMP算法
其实原来我学过KMP算法
但是一直没有弄懂next(跳转)数组是如何求出来的。
最近花了一个下午自己研究了一下KMP算法
现在终于觉得KMP很简单了~
现在直接说next数组把
至于有什么作用,next数组是干什么的,请自行百度,有很多dalao总结的非常到位,看一看就会明白。
好,来说next数组
并不用在意这一坨黑的是什么东西,我们就假设他是我们要求next数组的字符串。
next数组求的东西就是从起始位置到当前位置最长的相等的前缀和后缀的长度。
(举个例子China的前缀有:C、Ch、Chi、Chin、China ; 后缀有a、na、ina、hina、China)
我们继续,如上图红色的是当前位置(设为j)前,所匹配上的最长前缀和后缀,蓝色的是当前要匹配的位置。
那么,我们就拿当前位置和原来匹配到的最长前缀的后一位相比较
如果两个位置相同,
显然,
可以和前面的红色连在一起,
此时就有next[j]=next[j-1]+1
如果两个位置不相同,
根据next数组的性质,
显然的,你的当前的相等的前缀和后缀只能够继续向前找,
也就是说,你当前的next数组一定会减小。
既然前面的红色部分存在一小块灰色,那么,后面的红色部分也必然存在灰色部分。
所以,判断当前位置和前面那一块灰色的前缀的后一位是否相等。
如果这两位相同的话,不就可以和前面的灰色部分连在一起了吗
此时,又回到一开始的那一步。
因此,求解某个位置的next值是一个循环过程。
不断检查 上一位的 最长前缀的 后一位(i位置)(这句子有点拗口)
如果相等next[j]=next[i]+1
否则令 i=next[i-1]+1,继续循环匹配
如果没有看懂就自己多看几遍,自己找几个字符串算一算
所以:求解next数组的代码:
inline void GetNext(string s)//获得字符串s的next数组
{
int l=s.length(),t;
Next[0]=-1;//如果在0位置失配则是向下移动一位
for(int i=1;i<l;++i)//依次求解后面的next数组
{
t=Next[i-1];
while(s[t+1]!=s[i]&&t>=0)//循环求解next值
t=Next[t];
if(s[t+1]==s[i])//如果是匹配上而退出循环
Next[i]=t+1;
else //否则则是匹配不上
Next[i]=-1; //指向头
}
}
代码很简洁的~
那么,接下来如何利用Next数组求解匹配
那就自己baidu吧(知道了next数组,KMP就很好理解了)
接下来贴上小蒟蒻的源码
#include<iostream>
#include<cstdio>
#include<cstdlib>
#include<cstring>
#include<cmath>
#include<vector>
#include<algorithm>
using namespace std;
const int MAX=1001;
int Next[MAX];
vector<int> Ans;
inline void GetNext(string s)//获得字符串s的next数组
{
int l=s.length(),t;
Next[0]=-1;//如果在0位置失配则是向下移动一位
for(int i=1;i<l;++i)//依次求解后面的next数组
{
t=Next[i-1];
while(s[t+1]!=s[i]&&t>=0)//循环求解next值
t=Next[t];
if(s[t+1]==s[i])//如果是匹配上而退出循环
Next[i]=t+1;
else //否则则是匹配不上
Next[i]=-1; //指向头
}
}
inline void KMP(string s1,string s2)
{
GetNext(s2);
int l1=s1.length();
int l2=s2.length();
int i=0,j=0;
while(j<l1)
{
if(s2[i]==s1[j])//当前位匹配成功,继续匹配下一位
{
++i;++j;
if(i==l2)//完全匹配
{
Ans.push_back(j-l2+1);//储存答案
i=Next[i-1]+1;//继续匹配
}
}
else
{
if(i==0)//在首位不匹配
j++;//直接向后挪一位
else
i=Next[i-1]+1;//跳转
}
}
}
int main()
{
string s1,s2;
int l;
cin>>s1>>s2;
l=s2.length();
KMP(s1,s2);
for(int i=0;i<Ans.size();++i)
cout<<Ans[i]<<endl;
for(int i=0;i<l;++i)
cout<<Next[i]+1<<' ';
cout<<endl;
return 0;
}
最后再说一句
如果需要加深理解KMP的过程
请去SYC的blog看看他的gif动图
你可能就会有更多了解
膜拜SYC大佬去
KMP算法 Next数组详解的更多相关文章
- 数据结构20:KMP算法(快速模式匹配算法)详解
通过上一节的介绍,学习了串的普通模式匹配算法,大体思路是:模式串从主串的第一个字符开始匹配,每匹配失败,主串中记录匹配进度的指针 i 都要进行 i-j+1 的回退操作(这个过程称为“指针回溯”),同时 ...
- 个人理解---KMP与Next数组详解
Kmp就是求子串在母串中的位置等相关问题:当然KMP最重要的是Next数组,也称失败数组,Next[i]代表的意思是子串 sub 从sub[0] 到 sub[i-1]的前缀和后缀的最大匹配.模拟KMP ...
- 【转载】KMP入门级别算法详解--终于解决了(next数组详解)
[转载]https://blog.csdn.net/LEE18254290736/article/details/77278769 对于正常的字符串模式匹配,主串长度为m,子串为n,时间复杂度会到达O ...
- 3.awk数组详解及企业实战案例
awk数组详解及企业实战案例 3.打印数组: [root@nfs-server test]# awk 'BEGIN{array[1]="zhurui";array[2]=" ...
- JavaScript进阶(十)Array 数组详解
JS array 数组详解 数组的声明方法 arrayObj = new Array(); 的数组 ,并且第一位是5 数组的运算(传地址) var t2=new Array(); t2[0]=1; t ...
- Java基础之 数组详解
前言:Java内功心法之数组详解,看完这篇你向Java大神的路上又迈出了一步(有什么问题或者需要资料可以联系我的扣扣:734999078) 数组概念 同一种类型数据的集合.其实数组就是一个容器. 数组 ...
- JVM垃圾回收算法及回收器详解
引言 本文主要讲述JVM中几种常见的垃圾回收算法和相关的垃圾回收器,以及常见的和GC相关的性能调优参数. GC Roots 我们先来了解一下在Java中是如何判断一个对象的生死的,有些语言比如Pyth ...
- “全栈2019”Java第三十一章:二维数组和多维数组详解
难度 初级 学习时间 10分钟 适合人群 零基础 开发语言 Java 开发环境 JDK v11 IntelliJ IDEA v2018.3 文章原文链接 "全栈2019"Java第 ...
- “全栈2019”Java第三十章:数组详解(下篇)
难度 初级 学习时间 10分钟 适合人群 零基础 开发语言 Java 开发环境 JDK v11 IntelliJ IDEA v2018.3 文章原文链接 "全栈2019"Java第 ...
随机推荐
- 读书共享 Primer Plus C-part 4
第四章 字符串和格式化输入输出 关于printf - 左对齐 #include<stdio.h> void main() { char str [100] = "liuchua ...
- php分布式redis实现session共享
方法一:找到配置文件php.ini,修改为下面内容,保存并重启服务 session.save_handler = redis session.save_path = "tcp://127.0 ...
- 归并排序Merge Sort
//C语言实现 void mergeSort(int array[],int first, int last) { if (first < last)//拆分数列中元素只剩下两个的时候,不再拆分 ...
- [NOIP]2016天天爱跑步
[NOIP]2016天天爱跑步 标签: LCA 树上差分 NOIP Description 小C同学认为跑步非常有趣,于是决定制作一款叫做<天天爱跑步>的游戏.<天天爱跑步>是 ...
- jquery toggle 方法被废除的替代方法
今天使用 toggle 方法的时候,该方法一直不能生效. 原来jquery 的引入文件是1.9,该方法在1.8以上已被废除. 那么简单的切换状态,我们可使用if 语句进行代替 如下: 记录一开始设置隐 ...
- scp的简单记忆方法
scp虽然只有把文见发送到远端和从远端copy文件俩功能,但是常常把俩功能的先写什么给计混了,所以我就用通俗的大白话给总结了下,十分容易记忆,这里给大家分享一下.scp 我们常用的两个功能: (1)把 ...
- SpringMvc笔记-对RESTFUL风格的配置
1.@RequestMapping注解可以使用如下参数: 1,params:例如params={'username',"age!=100"}表示需要usernmame并且age 属 ...
- maven使用jstl表达式和The absolute uri: http://java.sun.com/jsp/jstl/core cannot be resolved in either web.xml or the jar files deployed with this application解决
maven 中使用jstl表达式中出现如上错误.原因: 1.由于在maven中的web项目没有自动依赖jstl的jar 未在pom文件中添加jstl相关的jar <!--jstl表达式--> ...
- CodeForces - 796C Bank Hacking
思路:共有n-1条边连接n个点,即形成一棵树.一开始需要选择一个点hack--将这个点视为根结点,与它相邻的点防御值加1,与它相隔一个在线点的点的防御也加1.当根节点被hack,即这个点被删除,又变成 ...
- uva10603 倒水问题
状态搜索.类似八数码问题 AC代码 #include<cstdio> #include<queue> #include<cstring> #include<a ...