【KMP原理】【整理回顾】
今儿套KMP模板做了个题,敏敏找我讲next[]数组的时候把我问懵了。具体原理都记不清了光靠模板凑得了一时凑不了一世啊,所以再捋一捋顺一顺,这次印象要深刻一点了;
KMP与暴力匹配的优化区别就不再提了,O(m+n)的复杂度已经完胜了,直接进入正题...
以下言论均是总结自该同学的,是不是原创我不清楚,链接反正是给你们吧...
匹配串S,模式串T;
首先是KMP的精华所在,next[]数组
next[i]=k的意思为:T[i]前面有k个字符和字符串T的前k个字符相同,且T[i]不等于开始的k个字符之后的第k+1个字符, 1<=k<j;
所以从另一种解题层面上讲,next[len]的值表示字符串str[0...len-1]的后缀等于str[0...len-1]前缀的最长长度,例题运用:hdu 4763;
举个例子:
0 1 2 3 4 5 6 7 8
S: a b c a b c a b d
T: a b c a b d a b a
1<=k<j, 因为T[0...1] = T[3...4],且T[2] != T[5],则next[5] = k = 2;
若T[2] == T[5]时,next[5] = 0; --> 为什么呢?
理解这个首先要明白利用next[i]我们可以做什么
根据next[5] = 2,有T[3] == T[0],T[4] == T[1],又因为S[4] == T[4],S[3] == T[3],所以S[3] == T[0],S[4] == T[1](两对相当于间接比较过了)。
接下来比较S[5]和T[2]是否相等,如果按问题的假设,T[2] == T[5],那么必然对于模式串T匹配到S[5]的位置仍是不匹配的;故此时的next[5]=0,模式串从T[0]与S[5]开始匹配;
有一个问题来了:S[3]和T[0],S[4]和T[1]是根据next[5]=2间接比较相等,那S[1]和T[0],S[2]和T[0]之间又是怎么跳过比较的呢?
我们一步步来,S[0]=T[0],S[1]=T[1],S[2]=T[2],
而T[0] != T[1], T[1] != T[2](这里只是针对具体例子,但只要next[i] = k,那么S[1]、S[2]和T[0]间总会间接比较的)
==> S[0] != S[1], S[1] != S[2],所以S[1] != T[0],S[2] != T[0]. 还是从理论上间接比较了。
下面重点来了,next[]怎样取值以及进行字符串匹配时next值又有什么存在意义呢?
next[]函数定义如下:
(1)next[0] = -1 意义:任何串的第一个字符的模式值规定为-1。
(2)next[j] = -1 意义:情况①->模式串T中下标为j的字符与首字符相同,且j的前面的1~k个字符与开头的1~k个字符不相等(1≤k<j).
情况②->下标为j的字符前面的1~k个字符与开头的1~k个字符相等但T[k]==T[j],(1≤k<j)。 如:T="abCabCad",T[0...2] == T[3...5]但T[3]=T[6],则next[6]=-1;
(3)next[j] = k 意义:模式串T中下标为j的字符,如果j前面的k个字符与开头的k个字符相等,且T[j] != T[k] (1≤k<j)。即T[0...k-1] == T[j-k ... j-1] 且T[j] != T[k];
(4)next[j] = 0 意义:除(1)(2)(3)的其他情况。
对于不理解的可以看一下我给的链接里文章的例子,我就不再粘过来了。
那么在进行字符串匹配时next值又该怎么使用呢?
1. next[i]= -1 表示S[cur]和T[0]间接比较过了,不相等,下一次比较 S[cur+1] 和T[0]
2. next[i]=0 表示比较过程中产生了不相等,下一次比较 S[m] 和T[0]。
3. next[i]= k > 0 但k < n, 表示,S[cur]的前k个字符与T中的开始k个字符已经间接比较相等了,下一次比较S[cur]和T[k]相等;
4. 其他值,不可能。
基本KMP的知识就是这样了,今天先暂时到这里,日后会继续补充;
【KMP原理】【整理回顾】的更多相关文章
- 字符串系列——KMP模板整理
KMP模板整理 KMP与扩展KMP: /*vs 2017/ vs code以外编译器,去掉windows.h头文件和system("pause");*/ #include<i ...
- 字符串匹配--kmp算法原理整理
kmp算法原理:求出P0···Pi的最大相同前后缀长度k: 字符串匹配是计算机的基本任务之一.举例,字符串"BBC ABCDAB ABCDABCDABDE",里面是否包含另一个字符 ...
- KMP原理、分析及C语言实现
(是在matrix67博客基础上整理而来,整理着:华科小涛@http://www.cnblogs.com/hust-ghtao/) 有些算法可以让人发疯,KMP算法就是一个.在网上找了很多资料讲的都让 ...
- [区块链|非对称加密] 对数字证书(CA认证)原理的回顾
摘要:文中首先解释了加密解密的一些基础知识和概念,然后通过一个加密通信过程的例子说明了加密算法的作用,以及数字证书的出现所起的作用.接着对数字证书做一个详细的解释,并讨论一下windows中数字证书的 ...
- 3星|《结构思考力》:用金字塔原理整理PPT的思路,案例偏简单
结构思考力 名义上全书是讲结构化思考,实际内容是用结构化思考的方法来整理PPT的思路,让PPT的逻辑更清晰.少部分提到如何修改标题更吸引人,如何做图表设计. 书中结构化思考的基本思路,重要的有两个:1 ...
- dynamic-load-apk插件原理整理
因为当前项目功能越来越多,编译速度越来越慢(公司电脑配置也挺差的...),并且方法数已超出65535的限制了,虽然通过multidex暂时解决了,但是这并不是一个好的解决方式.所以通过插件来加快编译速 ...
- KMP算法简单回顾
前言 虽从事企业应用的设计与开发,闲暇之时,还是偶尔涉猎数学和算法的东西,本篇根据个人角度来写一点关于KMP串匹配的东西,一方面向伟人致敬,另一方面也是练练手,头脑风暴.我在自娱自乐,路过的朋友别太认 ...
- Java的HashMap实现原理整理总结
通过Debug 探寻Java-HashMap 实现原理: 一个简单的例子,代码如下, 测试方法 main: public static void main(String[] args) { KeyOb ...
- HDOJ4763(KMP原理理解)
Theme Section Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)Tot ...
随机推荐
- 给 TTreeView 添加复选框
//1.引用单元 uses Commctrl ; //2.定义私有过程 procedure tvToggleCheckbox(TreeView: TTreeView;Node: TTreeNode;i ...
- CodeForces 567A Gerald is into Art
http://codeforces.com/problemset/problem/567/A A. Lineland Mail time limit per test 3 seconds memory ...
- 转载 C#结构体(struct)和类(class)的区别
转载原地址: http://dotnet.9sssd.com/csbase/art/8 C#结构体和类的区别问题:在C#编程语言中,类属于引用类型的数据类型,结构体属于值类型的数据类型,这两种数据类型 ...
- Mysql知识要点总结
1.安装 要点:记得更改字符集 2.数据类型 常用数据类型:INT VARCHAR BLOG 3.操作数据库 SHOW DATABASES; CREATE DATABASE 名称; DROP DATA ...
- 计算两个日期相隔的天数(jodd)
public static void main(String[] args) throws ParseException { System.out.println(TimeUtil.dayOfYear ...
- C++中动态申请二维数组并释放方法
C/C++中动态开辟一维.二维数组是非常常用的,以前没记住,做题时怎么也想不起来,现在好好整理一下. C++中有三种方法来动态申请多维数组 (1)C中的malloc/free (2)C++中的new/ ...
- 使用 EPPlus,NPOI,操作EXCEL
NPOI, 读取xls文件(Excel2003及之前的版本) (NPOI.dll+Ionic.Zip.dll) http://npoi.codeplex.com/ EPPlus ...
- android ipc通信机制之二序列化接口和Binder
IPC的一些基本概念,Serializable接口,Parcelable接口,以及Binder.此核心为最后的IBookManager.java类!!! Serializable接口,Parcelab ...
- C#fixed关键字
fixed 语句禁止垃圾回收器重定位可移动的变量. fixed 语句只在 不安全的上下文中是允许的. Fixed 还可用于创建 固定大小缓冲区. fixed 语句设置指向托管变量的指针,并在执行该语句 ...
- 算法代码[置顶] 机器学习实战之KNN算法详解
改章节笔者在深圳喝咖啡的时候突然想到的...之前就有想写几篇关于算法代码的文章,所以回家到以后就奋笔疾书的写出来发表了 前一段时间介绍了Kmeans聚类,而KNN这个算法刚好是聚类以后经常使用的匹配技 ...