KMP算法 Next数组详解
题面
题目描述
如题,给出两个字符串s1和s2,其中s2为s1的子串,求出s2在s1中所有出现的位置。
为了减少骗分的情况,接下来还要输出子串的前缀数组next。如果你不知道这是什么意思也不要问,去百度搜[kmp算法]学习一下就知道了。
输入输出格式
输入格式:
第一行为一个字符串,即为s1(仅包含大写字母)
第二行为一个字符串,即为s2(仅包含大写字母)
输出格式:
若干行,每行包含一个整数,表示s2在s1中出现的位置
接下来1行,包括length(s2)个整数,表示前缀数组next[i]的值。
输入样例:
ABABABC
ABA
输出样例:
1
3
0 0 1
说明
时空限制:1000ms,128M
数据规模:
设s1长度为N,s2长度为M
对于30%的数据:N<=15,M<=5
对于70%的数据:N<=10000,M<=100
对于100%的数据:N<=1000000,M<=1000
题解
这是一道KMP裸题(模板题。。)
我就是拿着它学习一下KMP算法
其实原来我学过KMP算法
但是一直没有弄懂next(跳转)数组是如何求出来的。
最近花了一个下午自己研究了一下KMP算法
现在终于觉得KMP很简单了~
现在直接说next数组把
至于有什么作用,next数组是干什么的,请自行百度,有很多dalao总结的非常到位,看一看就会明白。
好,来说next数组
并不用在意这一坨黑的是什么东西,我们就假设他是我们要求next数组的字符串。
next数组求的东西就是从起始位置到当前位置最长的相等的前缀和后缀的长度。
(举个例子China的前缀有:C、Ch、Chi、Chin、China ; 后缀有a、na、ina、hina、China)
我们继续,如上图红色的是当前位置(设为j)前,所匹配上的最长前缀和后缀,蓝色的是当前要匹配的位置。
那么,我们就拿当前位置和原来匹配到的最长前缀的后一位相比较
如果两个位置相同,
显然,
可以和前面的红色连在一起,
此时就有next[j]=next[j-1]+1
如果两个位置不相同,
根据next数组的性质,
显然的,你的当前的相等的前缀和后缀只能够继续向前找,
也就是说,你当前的next数组一定会减小。
既然前面的红色部分存在一小块灰色,那么,后面的红色部分也必然存在灰色部分。
所以,判断当前位置和前面那一块灰色的前缀的后一位是否相等。
如果这两位相同的话,不就可以和前面的灰色部分连在一起了吗
此时,又回到一开始的那一步。
因此,求解某个位置的next值是一个循环过程。
不断检查 上一位的 最长前缀的 后一位(i位置)(这句子有点拗口)
如果相等next[j]=next[i]+1
否则令 i=next[i-1]+1,继续循环匹配
如果没有看懂就自己多看几遍,自己找几个字符串算一算
所以:求解next数组的代码:
inline void GetNext(string s)//获得字符串s的next数组
{
int l=s.length(),t;
Next[0]=-1;//如果在0位置失配则是向下移动一位
for(int i=1;i<l;++i)//依次求解后面的next数组
{
t=Next[i-1];
while(s[t+1]!=s[i]&&t>=0)//循环求解next值
t=Next[t];
if(s[t+1]==s[i])//如果是匹配上而退出循环
Next[i]=t+1;
else //否则则是匹配不上
Next[i]=-1; //指向头
}
}
代码很简洁的~
那么,接下来如何利用Next数组求解匹配
那就自己baidu吧(知道了next数组,KMP就很好理解了)
接下来贴上小蒟蒻的源码
#include<iostream>
#include<cstdio>
#include<cstdlib>
#include<cstring>
#include<cmath>
#include<vector>
#include<algorithm>
using namespace std;
const int MAX=1001;
int Next[MAX];
vector<int> Ans;
inline void GetNext(string s)//获得字符串s的next数组
{
int l=s.length(),t;
Next[0]=-1;//如果在0位置失配则是向下移动一位
for(int i=1;i<l;++i)//依次求解后面的next数组
{
t=Next[i-1];
while(s[t+1]!=s[i]&&t>=0)//循环求解next值
t=Next[t];
if(s[t+1]==s[i])//如果是匹配上而退出循环
Next[i]=t+1;
else //否则则是匹配不上
Next[i]=-1; //指向头
}
}
inline void KMP(string s1,string s2)
{
GetNext(s2);
int l1=s1.length();
int l2=s2.length();
int i=0,j=0;
while(j<l1)
{
if(s2[i]==s1[j])//当前位匹配成功,继续匹配下一位
{
++i;++j;
if(i==l2)//完全匹配
{
Ans.push_back(j-l2+1);//储存答案
i=Next[i-1]+1;//继续匹配
}
}
else
{
if(i==0)//在首位不匹配
j++;//直接向后挪一位
else
i=Next[i-1]+1;//跳转
}
}
}
int main()
{
string s1,s2;
int l;
cin>>s1>>s2;
l=s2.length();
KMP(s1,s2);
for(int i=0;i<Ans.size();++i)
cout<<Ans[i]<<endl;
for(int i=0;i<l;++i)
cout<<Next[i]+1<<' ';
cout<<endl;
return 0;
}
最后再说一句
如果需要加深理解KMP的过程
请去SYC的blog看看他的gif动图
你可能就会有更多了解
膜拜SYC大佬去
KMP算法 Next数组详解的更多相关文章
- 数据结构20:KMP算法(快速模式匹配算法)详解
通过上一节的介绍,学习了串的普通模式匹配算法,大体思路是:模式串从主串的第一个字符开始匹配,每匹配失败,主串中记录匹配进度的指针 i 都要进行 i-j+1 的回退操作(这个过程称为“指针回溯”),同时 ...
- 个人理解---KMP与Next数组详解
Kmp就是求子串在母串中的位置等相关问题:当然KMP最重要的是Next数组,也称失败数组,Next[i]代表的意思是子串 sub 从sub[0] 到 sub[i-1]的前缀和后缀的最大匹配.模拟KMP ...
- 【转载】KMP入门级别算法详解--终于解决了(next数组详解)
[转载]https://blog.csdn.net/LEE18254290736/article/details/77278769 对于正常的字符串模式匹配,主串长度为m,子串为n,时间复杂度会到达O ...
- 3.awk数组详解及企业实战案例
awk数组详解及企业实战案例 3.打印数组: [root@nfs-server test]# awk 'BEGIN{array[1]="zhurui";array[2]=" ...
- JavaScript进阶(十)Array 数组详解
JS array 数组详解 数组的声明方法 arrayObj = new Array(); 的数组 ,并且第一位是5 数组的运算(传地址) var t2=new Array(); t2[0]=1; t ...
- Java基础之 数组详解
前言:Java内功心法之数组详解,看完这篇你向Java大神的路上又迈出了一步(有什么问题或者需要资料可以联系我的扣扣:734999078) 数组概念 同一种类型数据的集合.其实数组就是一个容器. 数组 ...
- JVM垃圾回收算法及回收器详解
引言 本文主要讲述JVM中几种常见的垃圾回收算法和相关的垃圾回收器,以及常见的和GC相关的性能调优参数. GC Roots 我们先来了解一下在Java中是如何判断一个对象的生死的,有些语言比如Pyth ...
- “全栈2019”Java第三十一章:二维数组和多维数组详解
难度 初级 学习时间 10分钟 适合人群 零基础 开发语言 Java 开发环境 JDK v11 IntelliJ IDEA v2018.3 文章原文链接 "全栈2019"Java第 ...
- “全栈2019”Java第三十章:数组详解(下篇)
难度 初级 学习时间 10分钟 适合人群 零基础 开发语言 Java 开发环境 JDK v11 IntelliJ IDEA v2018.3 文章原文链接 "全栈2019"Java第 ...
随机推荐
- 安装RabbitMQ(一)
RabbitMQ简介 RabbitMQ 是由 LShift 提供的一个 Advanced Message Queuing Protocol (AMQP) 的开源实现,由以高性能.健壮以及可伸缩性出名的 ...
- 腾讯IVWEB前端工程化工具feflow思考与实践
本篇文章主要介绍腾讯IVWEB团队从0到1在工程化的思考和实践.feflow的全称是Front-end flow(前端工作流),致力于提升研发效率和规范的工程化解决方案.愿景是通过feflow,可以使 ...
- IDEA设置优化
默认会开很多的功能,但是有些功能暂时用不到,于是想屏蔽掉. Duplicated Code冗余代码提示功能 先找到设置路径Settings -> Editor -> Inspections ...
- GitHub入门与实践
基本命令 git status 工作区状态 git add git commint 暂存区 git push gitHub客户端 下载网址:https://desktop.github.com/ 解决 ...
- Linux下的压力测试工具:ab、http_load、webbench、siege
一.ab 1.1 介绍 ab是apache自带的一款功能强大的测试工具. 安装了apache一般就自带了. 1.2 下载 同apache. 1.3 安装 同apache. 1.4 安装结果 ...
- Freemarker的基本语法及入门基础
freemarker的基本语法及入门基础一.freemarker模板文件(*.ftl)的基本组成部分 1. 文本:直接输出的内容部分 2. 注释:不会输出的内容,格式为&l ...
- 在Ubuntu上安装PHPStudy组件
phpStudy for Linux (lnmp+lamp一键安装包) phpStudy Linux版&Win版同步上线 支持Apache/Nginx/Tengine/Lighttpd/IIS ...
- Nexus3将本地jar包添加到仓库
新建一个文件夹,将要上传的jar包放进去,然后创建一个pom文件,例如xx.jar,pom.xml 首先创建一个目录 方便执行上传的时候url参数 也可以不创建, 上传XML curl -v -u a ...
- uva 116 单向TSP
这题的状态很明显. 转移方程就是 d(i,j)=min(d(i+1,j+1),d(i,j+1),d(i-1,j+1)) //注意边界 我用了一个next数组方便打印结果,但是一直编译错误,原来是不能用 ...
- jmeter压力测试笔记- HTTP协议
一.目标 使用jmeter进行HTTP接口压力测试: 命令行方式运行,方便在linux环境运行: 二.面临的问题 支持多环境测试(开发.测试.生产环境) 支持用户数据.线程数.循环次数等配置在运行时自 ...