对KMP算法通过代码生成next数组理解
本文是根据考研数据结构2019版天勤高分笔记理解编写的:
首先给出代码:
1 void getnext(Str substr,int next[]){
2 int i=0,j=0;
3 next[1]<=0;
4 while(i<substr.length){
5 if(j==0 || substr.ch[i]==substr.ch[j]){ //俩种情况会导致j==0。a,给串第一个元素的next[1]赋值时j默认为0 b,当模式串和主串不匹配时,j回溯到next[1]=0
//当前元素和已经匹配的串(正在延伸的前缀)的下一个元素进行比较,相等就继续延伸,否则j进行回溯,第10行(需要明白next的作用)
6 ++i;++j;
7 next[i]=j; //j表示0-j-1的前缀和后面一部分的子串已经匹配成功
8 }
9 else{
10 j=next[j]; //j回溯
11 }
12 }
13 }
数组pre和数组p一致,即next[j]代表已匹配前缀串pre的下标 如:j=5就代表已匹配的前缀ADAB的下标1,2,3,4
当j=5时,ch[11]!=ch[5],此时,退而其次,在已匹配的串"ADAB"中寻找能匹配D的元素。
而next数组的作用就是当模式串中第j个字符发生不匹配时,应从next[j]处的字符开始重新与主串比较。所以j回溯的时候用的是j=next[j];
只是:为什么next能起这样的作用呢?给个串对照一下:

这里我只把上面那部分的串的4位置和10位置的B改成了A,next数组只有next[5]由1变成了2.
现在讲讲我自己的理解:1,回退的过程中不仅2位置要和11位置想对应,2位置之前的所有位置(虽然这里只有一个元素)都必须和11位置前的响应元素一一对应,而next数组就代表前面有多个字符和前缀匹配成功。
2,正如前面所说的,数组pre和数组p一致,即next[j]代表已匹配前缀串pre的下标 ,,为什么改next【5】是2,对应了2(下标)位置的D,因为4位置的A和前缀A匹配。
=》保证俩个元素比较前,前缀和 j 位置前的对应长度的串是相等的(也就 是next的作用)
c和D不匹配ADAA这个前缀串的前缀是A,回溯到j=2,此时是保证了2(因为举例较简单,所以前缀只有一个元素,但我们可以把2位置发散成n位置)位置前所有的前缀(2-1 即n-1)个元素是和C元素前(2-1 即n-1)个元素匹配成功的;
而"ADAAC"和"ADAAD"中的"ADAA"的元素是匹配成功的,所以保证了ch【2-1】=ch【5-1】=ch【11-1】同样,这里的ch虽然只是一个字符,但也可以发散成一个串。
3,如果没有符合要求的子串,j必定回溯到1.
小编也是花了一整天根据自己对书本的理解,如果大家有什么不明白还请耐心点,kmp需要时间来理解!
对KMP算法通过代码生成next数组理解的更多相关文章
- KMP 算法中的 next 数组
KMP 算法中对 next 数组的理解 next 数组的意义 此处 next[j] = k:则有 k 前面的浅蓝色区域和 j 前面的浅蓝色区域相同: next[j] 表示当位置 j 的字符串与主串不匹 ...
- 字符串模式匹配之KMP算法图解与 next 数组原理和实现方案
之前说到,朴素的匹配,每趟比较,都要回溯主串的指针,费事.则 KMP 就是对朴素匹配的一种改进.正好复习一下. KMP 算法其改进思想在于: 每当一趟匹配过程中出现字符比较不相等时,不需要回溯主串的 ...
- KMP算法中next函数的理解
首先要感谢http://blog.csdn.net/v_july_v/article/details/7041827以及http://blog.chinaunix.net/uid-27164517-i ...
- (收藏)KMP算法的前缀next数组最通俗的解释
我们在一个母字符串中查找一个子字符串有很多方法.KMP是一种最常见的改进算法,它可以在匹配过程中失配的情况下,有效地多往后面跳几个字符,加快匹配速度. 当然我们可以看到这个算法针对的是子串有对称属性, ...
- KMP算法中求next数组的实质
在串匹配模式中,KMP算法较蛮力法是高效的算法,我觉得其中最重要的一点就是求next数组: 看了很多资料才弄明白求next数组是怎么求的,我发现我的忘性真的比记性大很多,每次看到KMP算法求next数 ...
- kmp算法中的next数组实例解释
假设求串′ababaaababaa′的next数组 模式串 a b a b a a a b a b a a 下标 1 2 3 4 5 6 7 8 9 10 11 12 1.前两位:next数组前两位一 ...
- KMP算法中的next数组求解示意图
- 数据结构KMP算法中手算next数组
总结一下今天的收获(以王道数据结构书上的为例子,虽然我没看它上面的...):其中竖着的一列值是模式串前缀和后缀最长公共前缀. 最后求得的结果符合书上的结果,如果是以-1开头的话就不需要再加1,如果是以 ...
- KMP算法中我对获取next数组的理解
之前在学KMP算法时一直理解不了获取next数组的函数是如何实现的,现在大概知道怎么一回事了,记录一下我对获取next数组的理解. KMP算法实现的原理就不再赘述了,先上KMP代码: 1 void g ...
随机推荐
- Python代码的编译
Python代码的编译 Python代码在解释执行之前,是会被编译成.pyc或者.pyo文件的,它们是中间字节码表示的文件,之后Python虚拟机才会去解释执行它们. 1.pyc文件 ======== ...
- ubuntu搭建定时任务管理器
一.安装golang 1.apt-get安装golang $ sudo apt-get update $ sudo apt-get install -y golang 2.创建Go语言的工作文件夹,并 ...
- libevent源码深度剖析十一
libevent源码深度剖析十一 ——时间管理 张亮 为了支持定时器,Libevent必须和系统时间打交道,这一部分的内容也比较简单,主要涉及到时间的加减辅助函数.时间缓存.时间校正和定时器堆的时间值 ...
- Extend volumn in ubuntu 14.04
运行环境: ubuntu 14.04, VMware12.5.7 1. VMware上点击 虚拟机->设置->硬盘(SCSI)->扩展选项,设置自己希望的ubuntu磁盘运行空间大小 ...
- Python pandas DataFrame操作
1. 从字典创建Dataframe >>> import pandas as pd >>> dict1 = {'col1':[1,2,5,7],'col2':['a ...
- Linux tmux
一.简介 Tmux是一个用于终端复用的软件,它允许一个用户在一个终端窗口或远程终端会话中使用多个不同的终端会话.在同一个命令行接口处理多个程序,以及将程序从已经开始运行另外的程序的Unix shell ...
- c# 二分查找法(2分钟算法)
using System;using System.Collections.Generic;using System.Linq;using System.Text;using System.Threa ...
- PROC程序设计
通过在过程化编程语言中嵌入SQL语句而开发出的应用程序称为Pro程序. 在C/C++语言中嵌入SQL语句而开发出的应用程序称为Pro*C/C++程序. –在通用编程语言中使用的SQL称为嵌入式SQL: ...
- 编写高质量代码改善C#程序的157个建议——建议12: 重写Equals时也要重写GetHashCode
建议12: 重写Equals时也要重写GetHashCode 除非考虑到自定义类型会被用作基于散列的集合的键值:否则,不建议重写Equals方法,因为这会带来一系列的问题. 如果编译上一个建议中的Pe ...
- WindowsService服务安装脚本
安装脚本%SystemRoot%\Microsoft.NET\Framework\v4.0.30319\InstallUtil.exe D:\liuyl\WeiXinService\WindowsSe ...
