KMP算法next数组求解
关于KMP算法,许多教材用的是递推式求解,虽然代码简洁,但是有些不好理解,这里我介绍一种迭代求next数组的方法
KMP算法关键部分就是滑动模式串,我们可以每次滑动一个单位,直到出现可能匹配的情况,此时失配处next数组的值,就是失配处当前对应的元素下标
如下图,在X处失配,则向右滑动1个单位,可见这种情况是明显不可能匹配的,于是再滑,一直滑到可能出现匹配情况为止,“C”与“?”可能是匹配的,故应停止在此处,故失配处next数组的值就是“C”所在下标

基于上述思路的代码如下:
#include<stdio.h>
#include<string.h> void GetNext(char *str, int *arr); void main()
{
char str[] = "abaabacaba";
int next[]; GetNext(str, next);
//结果:-1 0 0 1 1 2 3 0 1 2
} void GetNext(char *str, int *arr)
{
int i, j, k, flag, len = strlen(str); //整体思路
//从失配处每次向右滑动一个单位,一直滑到可能匹配上的位置则停止
//即滑动串与失配处之前的串的相应部分再次一一匹配
for (i = , arr[] = -; i < len; i++)
{
//i表示next数组下标,即失配处序号
for (j = ; j <= i; j++)
{
//j表示模式串向右滑动次数
for (k = , flag = ; k < i - j; k++)
{
//k表示滑动后模式串的子串
if (str[k] != str[k + j])
{
flag = ;
break;
}
}
if (flag == || j == i)
{
arr[i] = i - j;
break;
}
}
}
}
这个方法虽然没有递推式那么高效,但是整体还是比较好理解的,而且模式串一般不会太长,这种方法也不会花费太多时间就能得出next数组。
另外用php实现完整的kmp算法,这次用已知的next[x](x < i)求未知的next[i],并且next[i]定义为从0~i都是匹配的,即在i+1处才失配:
<?php function getNext(string $pattern)
{
$next = [];
if (empty($pattern)) {
return $next;
} else {
$next[0] = -1;
for ($i = 1; $i < strlen($pattern) - 1; $i++) {
$k = $next[$i - 1];
if ($k == -1) {
$next[$i] = $pattern[$k + 1] == $pattern[$i] ? 0 : -1;
} else {
while ($k > -1) {
if ($pattern[$k + 1] == $pattern[$i]) {
$next[$i] = $k + 1;
break;
}
$k = $next[$k];
}
$next[$i] = -1;
}
}
}
return $next;
} function kmp(string $pattern, string $string)
{
$next = getNext($pattern);
if (empty($next)) {
return false;
}
for ($i = 0, $j = -1; $i < strlen($string);) {
if ($j + 1 == strlen($pattern)) {
return $i - $j - 1;
}
if ($string[$i] == $pattern[$j + 1]) {
$i++;
$j++;
} else {
if ($j != -1) {
$j = $next[$j];
} else {
$i++;
}
}
}
return false;
}
KMP算法next数组求解的更多相关文章
- 转载-KMP算法前缀数组优雅实现
转自:http://www.cnblogs.com/10jschen/archive/2012/08/21/2648451.html 我们在一个母字符串中查找一个子字符串有很多方法.KMP是一种最常见 ...
- KMP算法 Next数组详解
题面 题目描述 如题,给出两个字符串s1和s2,其中s2为s1的子串,求出s2在s1中所有出现的位置. 为了减少骗分的情况,接下来还要输出子串的前缀数组next.如果你不知道这是什么意思也不要问,去百 ...
- KMP算法-next函数求解
KMP函数求解:一种改进的字符串匹配算法,由D.E.Knuth,J.H.Morris和V.R.Pratt同时发现,因此人们称它为KMP算法.KMP算法的关键是利用匹配失败后的信息,尽量减少模式串与主串 ...
- 数据结构之KMP算法next数组
我们要找到一个短字符串(模式串)在另一个长字符串(原始串)中的起始位置,也就是模式匹配,最关键的是找到next数组.最简单的算法就是用双层循环来解决,但是这种算法效率低,kmp算法是针对模式串自身的特 ...
- KMP算法&next数组总结
http://www.cnblogs.com/yjiyjige/p/3263858.html KMP算法应该是每一本<数据结构>书都会讲的,算是知名度最高的算法之一了,但很可惜,我大二那年 ...
- 第4章学习小结_串(BF&KMP算法)、数组(三元组)
这一章学习之后,我想对串这个部分写一下我的总结体会. 串也有顺序和链式两种存储结构,但大多采用顺序存储结构比较方便.字符串定义可以用字符数组比如:char c[10];也可以用C++中定义一个字符串s ...
- 【文文殿下】浅谈KMP算法next数组与循环节的关系
KMP算法 KMP算法是一种字符串匹配算法,他可以在O(n+m)的时间内求出一个模式串在另一个模式串下出现的次数. KMP算法是利用next数组进行自匹配,然后来进行匹配的. Next数组 Next数 ...
- poj1961(kmp算法next数组应用)
题目链接:https://vjudge.net/problem/POJ-1961 题意:给定一个长为n的字符串(n<=1e6),对于下标i(2<=i<=n),如果子串s(1...i) ...
- POJ-2752(KMP算法+前缀数组的应用)
Seek the Name, Seek the Fame POJ-2752 本题使用的算法还是KMP 最主要的片段就是前缀数组pi的理解,这里要求解的纸盒pi[n-1]有关,但是还是需要使用一个循环来 ...
随机推荐
- Jmeter(六)Jmeter脚本包含要素及书写习惯
Jmeter有丰富的组件,逻辑控制器.配置原件.Sampler.定时器.前置处理器.后置处理器.断言.监听器:而编写脚本一定要养成个人习惯,让人看到Jmeter的脚本目录结构树能够一目了然:因此,首先 ...
- Glow 效果材质
转自:http://blog.csdn.net/panda1234lee/article/details/60960846 算法较简单,首先来看 Base color 部分: 就是将对事先准备好的三张 ...
- 运维人员word优化
- 关于Vue实例的生命周期created和mounted的区别
什么是生命周期 Vue实例有一个完整的生命周期,也就是从开始创建.初始化数据.编译模板.挂载Dom.渲染→更新→渲染.卸载等一系列过程,我们称这是Vue的生命周期.通俗说就是Vue实例从创建到销毁的过 ...
- PHP微信公众号开发之自动回复
先把源码类发出来 <?php /** 自己封装 微信 开发api */ header('Content-type: text/html; charset=utf-8');#设置头信息 class ...
- 基于pyQt5开发的股价显示器(原创)
#/usr/bin/env python # -*- coding: utf-8 -*- ''' @author="livermorium116" 为了绕开公司内网而开发的 股票实 ...
- lambda详解
1:lambda表示方法 auto lambda = [](){}; lambda(); sizeof(lambda) = 1; 等价于类 class lambda{ pulic operator() ...
- 文件IO-Linux
pcb:结构体 一个进程由一个文件描述符表:1024,前三个占用,文件描述符作用,需要磁盘文件. 1:open.close int open(const char* pathname,int flag ...
- 【接口测试】【SOAP】简单的接口测试学习
==================================================================================================== ...
- jQuery对象的属性操作
jquery的属性操作模块分为四个部分:html属性操作,dom属性操作,类样式操作和值操作 html属性操作:是对html文档中的属性进行读取,设置和移除操作.比如attr().removeAttr ...