关于KMP的next函数的原理分析
KMP是上学期学数据结构时候学的,当时就没学太明白,后来又自己琢磨了几次,但始终是一知半解。今天起床了又想起来KMP,以下是思考得到的一点东西。
首先学过kmp的都知道要写两个函数,一个计算next数组,一个kmp主体函数,那么next数组里存的到底是啥呢。首先答案是:next[i]存的是字符串[0,i]的前后缀最长公共长度减1的值。下面先解释下前后缀。
引用张别人的图:
也就是说只有一个元素时候前后缀都为空,即不能拿整个字符串作为前缀or后缀,注意这点即可。
我们把第i位对应的最大公共前后缀长度减1的值作为next[i]的值,这一点是为了之后计算的方便,后续会提到。
下面是next数组的计算函数
//创建NEXT数组
int create_next(int* address,int len,string str)
{
address[0]=-1;
for(int i=1;i<len;i++)
{
int k=address[i-1];
while(str[k+1]!=str[i]&&k>-1)
{
k=address[k];
}
if(str[k+1]==str[i])
{
++k;
}
address[i]=k;
}
}
首先address[0]=-1,原因上面说了。每次for循环里的i是代表字符串的游标,每次for循环干的事是计算出字符串[0,i]的最长公共前后缀元素个数,当然我们可以一个个数,先看str[0]=str[i]成立不成立,再看str[0]=str[i-1]&&str[1]=str[i]成立不成立,依次类推。但是这样重复考察了太多元素,故我们采用简便一点的方法,我画了个图。
如图,前后黑括号代表[0,i-1]的最长公共前后缀,但str[k+1]!=str[i],那么我们要找黑括号里的更小的蓝括号,让前后蓝括号相同。注意看图,找到满足上面条件蓝括号的时候,左边蓝括号就在左边黑括号的左端,右边蓝括号在右边黑括号的右端,这不就是求[0,k]或者[i-1-k,i-1]的最长公共前后缀长度么?再看下k=next[k],是不是这回懂为啥这么写了。从最开始的黑括号寻找蓝括号的部分就是next函数第一部分,也就是下面这个while循环做的事情,想一想是不是
int k=address[i-1];
while(str[k+1]!=str[i]&&k>-1)
{
k=address[k];
}
找到上面的一对蓝括号之后,就出去while循环了,接下来是:
if(str[k+1]==str[i])
{
++k;
}
address[i]=k;
这段意思是:此时k是蓝括号的长度-1,那么k+1就是蓝括号往右第一个元素,如果这个元素等于str[i],那么公共长度就加1,否则直接返回k。如果从while出来时候k等于-1,那表示找不到这样的蓝括号,那么只能考察str[0]和str[i]了,如果相等公共长度就为1,否则就为0。再看下函数开始,如果address[i-1]就等于-1的话,while循环直接就出来了,出来直接判断str[-1+1]==str[i]成立不成立,所以这里可以看出我们当时为什么要把长度-1作为next数组值。以上,不对的地方请指出,不懂的可以评论交流。
闲着没事又敲了个python的:
def create_next(next_list,str):
str_len=len(str)
next_list.clear()
next_list.append(-1)
k=-1
for i in range(str_len):
while k!=-1 and str[k+1]!=str[i]:
k=next_list[k]
if str[k+1]==str[i]: #若k为-1也成立
k+=1
next_list.append(k)
next_list=[]
def KMP(target,pattern):
#TARGET目标串,pattern模式串
create_next(next_list,pattern)
tar_len=len(target)
pat_len=len(pattern)
k=-1
for i in range(tar_len):
while k!=-1 and target[i]!=pattern[k+1]:
k=next_list[k]
if target[i]==pattern[k+1]:
k+=1
if k==pat_len-1: #模式串全部匹配,即匹配成功
return i-pat_len+1
x="bacbababadababacmbabacaddababacasdsd"
y="ababaca"
print(KMP(x,y))
关于KMP的next函数的原理分析的更多相关文章
- 【转载】Select函数实现原理分析
Select函数实现原理分析 <原文> select需要驱动程序的支持,驱动程序实现fops内的poll函数.select通过每个设备文件对应的poll函数提供的信息判断当前是否有资源可用 ...
- PHP 基础系列(三) 【转】PHP 函数实现原理及性能分析
作者:HDK (百度) 前言 在任何语言中,函数都是最基本的组成单元.对于PHP的函数,它具有哪些特点?函数调用是怎么实现的?php函数的性能如何,有什么使用建议?本文将从原理出发进行分析结合实际的性 ...
- Android中Input型输入设备驱动原理分析(一)
转自:http://blog.csdn.net/eilianlau/article/details/6969361 话说Android中Event输入设备驱动原理分析还不如说Linux输入子系统呢,反 ...
- 使用AsyncTask异步更新UI界面及原理分析
概述: AsyncTask是在Android SDK 1.5之后推出的一个方便编写后台线程与UI线程交互的辅助类.AsyncTask的内部实现是一个线程池,所有提交的异步任务都会在这个线程池中的工作线 ...
- (转)Android 系统 root 破解原理分析
现在Android系统的root破解基本上成为大家的必备技能!网上也有很多中一键破解的软件,使root破解越来越容易.但是你思考过root破解的 原理吗?root破解的本质是什么呢?难道是利用了Lin ...
- SPI协议及工作原理分析
说明.文章摘自:SPI协议及其工作原理分析 http://blog.csdn.net/skyflying2012/article/details/11710801 一.概述. SPI, Serial ...
- C语言可变参数函数实现原理
一.可变参数函数实现原理 C函数调用的栈结构: 可变参数函数的实现与函数调用的栈结构密切相关,正常情况下C的函数参数入栈规则为__stdcall, 它是从右到左的,即函数中的最右边的参数最先入栈. 本 ...
- web压测工具http_load原理分析
一.前言 http_load是一款测试web服务器性能的开源工具,从下面的网址可以下载到最新版本的http_load: http://www.acme.com/software/http_load/ ...
- memcache分布式部署的原理分析
下面本文章来给各位同学介绍memcache分布式部署的原理分析,希望此文章对你理解memcache分布式部署会有所帮助哦. 今天在封装memcache操作类库过程中,意识到一直以来对memcach ...
随机推荐
- 理解Android线程创建流程
copy from : http://gityuan.com/2016/09/24/android-thread/ 基于Android 6.0源码剖析,分析Android线程的创建过程 /androi ...
- K8S 概述
K8S------概述 K8S,就是基于容器的集群管理平台,它的全称,是kubernetes.Kubernetes 这个单词来自于希腊语,含义是舵手或领航员.K8S是它的缩写,用“8”字替代了“ube ...
- 案例-pyqt进度条案例
import sys from PyQt5.QtWidgets import * from PyQt5.QtGui import * from PyQt5.QtCore import * import ...
- docker镜像下载出现:received unexpected HTTP status: 500 Internal Server Error
1.镜像下载总是出现报错:received unexpected HTTP status: 500 Internal Server Error 2.尝试多种方法: ①阿里云docke加速器:注册之后, ...
- script标签的async和defer
兼容性 IE对于defer一直都支持,async属性IE6-9都没有支持,IE10及以上支持 相同点与不同点 带有async或defer的script都会立刻下载并不阻塞页面解析,而且都提供一个可选的 ...
- C# GZip Compress DeCompress
using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.T ...
- WPF 不支持从调度程序线程以外的线程对其 SourceCollection 进行的更改
该问题出现在WPF中的VM类中,ObservableCollection类型,该类型的 CollectionView 不支持从调度程序线程以外的线程对其 SourceCollection 进行的更改, ...
- cf 手机短信问题
题目链接:https://vjudge.net/contest/331120#problem/C 题目:你有一部手机,最多显示k个人发的信息,现在收到n条信息,有可能人是相同的人发的.最新的要顶置,当 ...
- Navicat Premium怎么设置字段的唯一性(UNIQUE)?
参考链接:https://blog.csdn.net/Song_JiangTao/article/details/82192189 1.打开你想要设计的表 这里写图片描述2.清楚你想要设计哪个字段为唯 ...
- eclipse配置tomcat,并部署一个Java web项目到tomcat上
引用链接:https://blog.csdn.net/cincoutcin/article/details/79408484 eclipse配置tomcat 1.windows——preference ...