今儿套KMP模板做了个题,敏敏找我讲next[]数组的时候把我问懵了。具体原理都记不清了光靠模板凑得了一时凑不了一世啊,所以再捋一捋顺一顺,这次印象要深刻一点了;

KMP与暴力匹配的优化区别就不再提了,O(m+n)的复杂度已经完胜了,直接进入正题...

以下言论均是总结自该同学的,是不是原创我不清楚,链接反正是给你们吧...

匹配串S,模式串T;

首先是KMP的精华所在,next[]数组

next[i]=k的意思为:T[i]前面有k个字符和字符串T的前k个字符相同,且T[i]不等于开始的k个字符之后的第k+1个字符,  1<=k<j;

所以从另一种解题层面上讲,next[len]的值表示字符串str[0...len-1]的后缀等于str[0...len-1]前缀的最长长度,例题运用:hdu 4763;

举个例子:

0 1 2 3 4 5 6 7 8

S: a b c  a b c a b d

T: a b  c a b d a b a

1<=k<j, 因为T[0...1] = T[3...4],且T[2] != T[5],则next[5] = k = 2;

若T[2] == T[5]时,next[5] = 0; --> 为什么呢?

理解这个首先要明白利用next[i]我们可以做什么
根据next[5] = 2,有T[3] == T[0],T[4] == T[1],又因为S[4] == T[4],S[3] == T[3],所以S[3] == T[0],S[4] == T[1](两对相当于间接比较过了)。
接下来比较S[5]和T[2]是否相等,如果按问题的假设,T[2] == T[5],那么必然对于模式串T匹配到S[5]的位置仍是不匹配的;故此时的next[5]=0,模式串从T[0]与S[5]开始匹配;

有一个问题来了:S[3]和T[0],S[4]和T[1]是根据next[5]=2间接比较相等,那S[1]和T[0],S[2]和T[0]之间又是怎么跳过比较的呢?
我们一步步来,S[0]=T[0],S[1]=T[1],S[2]=T[2],

      而T[0] != T[1], T[1] != T[2](这里只是针对具体例子,但只要next[i] = k,那么S[1]、S[2]和T[0]间总会间接比较的)

    ==> S[0] != S[1], S[1] != S[2],所以S[1] != T[0],S[2] != T[0]. 还是从理论上间接比较了。

下面重点来了,next[]怎样取值以及进行字符串匹配时next值又有什么存在意义呢?

next[]函数定义如下:
(1)next[0] = -1 意义:任何串的第一个字符的模式值规定为-1。
(2)next[j]  = -1 意义:情况①->模式串T中下标为j的字符与首字符相同,且j的前面的1~k个字符与开头的1~k个字符不相等(1≤k<j).

                情况②->下标为j的字符前面的1~k个字符与开头的1~k个字符相等T[k]==T[j],(1≤k<j)。 如:T="abCabCad",T[0...2] == T[3...5]但T[3]=T[6],则next[6]=-1;
(3)next[j]  = k  意义:模式串T中下标为j的字符,如果j前面的k个字符与开头的k个字符相等,且T[j] != T[k] (1≤k<j)。即T[0...k-1] == T[j-k ... j-1] 且T[j] != T[k];
(4)next[j]  = 0  意义:除(1)(2)(3)的其他情况。

对于不理解的可以看一下我给的链接里文章的例子,我就不再粘过来了。

那么在进行字符串匹配时next值又该怎么使用呢?
1. next[i]= -1 表示S[cur]和T[0]间接比较过了,不相等,下一次比较 S[cur+1] 和T[0]
2. next[i]=0 表示比较过程中产生了不相等,下一次比较 S[m] 和T[0]。
3. next[i]= k > 0 但k < n, 表示,S[cur]的前k个字符与T中的开始k个字符已经间接比较相等了,下一次比较S[cur]和T[k]相等;
4. 其他值,不可能。

基本KMP的知识就是这样了,今天先暂时到这里,日后会继续补充;

【KMP原理】【整理回顾】的更多相关文章

  1. 字符串系列——KMP模板整理

    KMP模板整理 KMP与扩展KMP: /*vs 2017/ vs code以外编译器,去掉windows.h头文件和system("pause");*/ #include<i ...

  2. 字符串匹配--kmp算法原理整理

    kmp算法原理:求出P0···Pi的最大相同前后缀长度k: 字符串匹配是计算机的基本任务之一.举例,字符串"BBC ABCDAB ABCDABCDABDE",里面是否包含另一个字符 ...

  3. KMP原理、分析及C语言实现

    (是在matrix67博客基础上整理而来,整理着:华科小涛@http://www.cnblogs.com/hust-ghtao/) 有些算法可以让人发疯,KMP算法就是一个.在网上找了很多资料讲的都让 ...

  4. [区块链|非对称加密] 对数字证书(CA认证)原理的回顾

    摘要:文中首先解释了加密解密的一些基础知识和概念,然后通过一个加密通信过程的例子说明了加密算法的作用,以及数字证书的出现所起的作用.接着对数字证书做一个详细的解释,并讨论一下windows中数字证书的 ...

  5. 3星|《结构思考力》:用金字塔原理整理PPT的思路,案例偏简单

    结构思考力 名义上全书是讲结构化思考,实际内容是用结构化思考的方法来整理PPT的思路,让PPT的逻辑更清晰.少部分提到如何修改标题更吸引人,如何做图表设计. 书中结构化思考的基本思路,重要的有两个:1 ...

  6. dynamic-load-apk插件原理整理

    因为当前项目功能越来越多,编译速度越来越慢(公司电脑配置也挺差的...),并且方法数已超出65535的限制了,虽然通过multidex暂时解决了,但是这并不是一个好的解决方式.所以通过插件来加快编译速 ...

  7. KMP算法简单回顾

    前言 虽从事企业应用的设计与开发,闲暇之时,还是偶尔涉猎数学和算法的东西,本篇根据个人角度来写一点关于KMP串匹配的东西,一方面向伟人致敬,另一方面也是练练手,头脑风暴.我在自娱自乐,路过的朋友别太认 ...

  8. Java的HashMap实现原理整理总结

    通过Debug 探寻Java-HashMap 实现原理: 一个简单的例子,代码如下, 测试方法 main: public static void main(String[] args) { KeyOb ...

  9. HDOJ4763(KMP原理理解)

    Theme Section Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others)Tot ...

随机推荐

  1. 现代程序设计 homework-08

    现代程序设计 homework-08 第八次作业. 理解C++变量的作用域和生命周期 作用域就是一个变量可以被引用的范围,如:全局作用域.文件作用域.局部作用域:而生命周期就是这个变量可以被引用的时间 ...

  2. CodeForces 689E Mike and Geometry Problem (离散化+组合数)

    Mike and Geometry Problem 题目链接: http://acm.hust.edu.cn/vjudge/contest/121333#problem/I Description M ...

  3. [iOS 多线程 & 网络 - 2.5] - 小文件上传

    A.文件上传 思路: 发送文件数据给服务器 使用post请求 必须手动设置请求头: 内容大小Content-Length & 内容类型 Content-Type 请求体:文件数据 文件上传的格 ...

  4. AVCaptureDevice的几个属性

    AVCaptureDevice.h,主要用来获取iphone一些关于相机设备的属性. AVCaptureDevice.h,必须要引入AVFoundation.framework包. 1. 前置和后置摄 ...

  5. 关于spring管理hibernate事物

    下面这篇文章对我帮助很大.http://blog.csdn.net/jianxin1009/article/details/9202907

  6. 令人惊奇的gdb和pstack

    pstack竟然是一个shell脚本,核心是调用gdb的thread apply all bt查看进程的所有线程的堆栈,之后用sed正则展示线程堆栈信息. /proc/pid/exe是一个指向可执行文 ...

  7. Django搭建博客后台

    转载自:http://sanwen8.cn/p/1cboypN.html 首先创建项目和blog应用: 在cmd命令行下,输入: django-admin.py startproject myblog ...

  8. [cocos2d-x3.0]Xcode 升级到5.1后,cocos2d-x3.0 编译64bit出错解决方案

    转自:http://blog.csdn.net/blucenong/article/details/21198089 把Architectures --->Other 改成 $(ARCHS_ST ...

  9. 设计模式奠基石——UML关系转化为代码

    1.继承关系(泛化关系) [说明]:继承关系是子类(派生类)继承父类(基类),或者子接口继承父接口的关系.即子类对象"is a" 父类对象,比方鸟是动物. [UML图]: 图解:A ...

  10. Web APP 随笔

    自Iphone和Android这两个牛逼的手机操作系统发布以来,在互联网界从此就多了一个新的名词-WebApp(意为基于WEB形式的应用程序,运行在高端的移动终端设备). 开发者们都知道在高端智能手机 ...