例题

以字符串 ABABACA 为例

a

前缀:

后缀:

结果为0

ab

前缀:a

后缀: b

结果为0

aba

前缀:a ab

后缀: ba a

结果为1,此时 i=2,j=1

abab

前缀:a ab aba

后缀: bab ab b

结果为2,此时 i=3,j=2

ababa

前缀:a ab aba abab

后缀: baba aba ba a

结果为3,此时 i=4,j=3

ababac

前缀:a ab aba abab ababac

后缀: babac abac bac ac c

结果为0,此时 i=5,j=3,1,0

ababaca

前缀:a ab aba abab ababac ababaca

后缀: babaca abaca baca bac ac c

结果为1,此时 i=6,j=0

next数组结果:

0 0 0 1 2 3 0 1

总结

以i为尾,往前数对应值,即是相等的,前提是相等的情况下(废话!);

前缀:要第一个字母,不要最后一个字母;

后缀:不要第一个字母,要最后一个字母;

至于i+1,因为计算的是前缀和后缀的重合的值的长度,所以还需要加上1;

最重要的是

j = next[i - 1],比如说现在在 i 位置上不匹配,为了避免重复匹配,不想浪费之前 0 到 i-1 的匹配长度,也就是说要找以 0 开头,i-1 结尾的匹配的子串,就是说找字符串上 i-1 位置的重合长度,因为next数组存储的是前缀和后缀的重合长度,所以还需要 i-1-1,也就是找next[i-1-1]的值,此时我们再比较字符串上 i 和 j 位置的字符是否相等;

如果相等 j 就尽管移动,代表重合的长度,也就是说到了该位置不匹配,只需要向前移动next数组中对应的长度。



贴上代码:

#include <iostream>
#include <string>
#include <vector>
using namespace std; vector<int> getNext(string str) {
int len = str.size();
int j = 0; vector<int>next(len + 1);
next[0] = next[1] = 0; // j表明相同的个数
for (int i = 1; i < len; i++) {
while (j > 0 && str[i] != str[j]) {
j = next[j];
}
// 相同的个数
if (str[i] == str[j]) {
j++;
}
next[i+1] = j;
} return next;
} // 另一种写法
// vector<int> getNext2(string str) {
// int j = 0;
// int i = 1;
//
// vector<int> next(str.size());
// next[0] = 0; // 必须是0
//
// while (i < str.size()) {
// if (str[i] == str[j]) {
// j++;
// next[i] = j;
// i++;
// }
// else {
// if (j != 0) {
// j = next[j - 1];
// }
// else { // j 为 0
// next[i] = 0;
// i++;
// }
// }
// }
//
// return next;
//
// } int search(string original, string find, vector<int> next) {
int i = 0, j = 0;
for (i = 0; i < original.length(); ++i) {
while (j > 0 && original[i] != find[j]) {
j = next[j];
}
if (original[i] == find[j])
++j;
if (j == find.size()) {
return i - j + 1;
}
} return -1;
} int main(int argc, const char * argv[]) {
string o = "ABABACAAC";
string f = "ABABACA"; vector<int> next = getNext(f);
// next
int i = 1;
while (i < next.size()) {
cout << "next " << next[i] << endl;
i++;
} //search
int result = search(o, f, next);
cout << "result " << result << endl; return 0;
}

KMP 理解的更多相关文章

  1. POJ3450【KMP理解】

    题意: 求多个字符串的最长公共子串 思路: 4000个串,200长度. 一种暴力,对于一个串最多有200*200=40000级别个子串,然后我要再处理一下next数组200,8e6复杂度: 然后我要和 ...

  2. 【poj 3167】Cow Patterns(字符串--KMP匹配+数据结构--树状数组)

    题意:给2个数字序列 a 和 b ,问按从小到达排序后,a中的哪些子串与b的名次匹配. a 的长度 N≤100,000,b的长度 M≤25,000,数字的大小 K≤25. 解法:[思考]1.X 暴力. ...

  3. KMP高质量代码实现详解

    KMP算法 对于KMP算法我分为两个部分说明,第一部分是算法部分,介绍KMP算法的算法思想:第二部分是实现部分,介绍一种厉害的实现代码以及代码注释.当然了由于本文主要介绍怎么实现故而先分析实现,对KM ...

  4. BZOJ 3670 NOI2014 动物园 KMP+dp

    题目链接:http://www.lydsy.com/JudgeOnline/problem.php?id=3670 题意概述:令num[i]表示字符串由1~i的字符形成的前缀中不相重叠的相同前后缀的数 ...

  5. 算法之美--3.2.3 KMP算法

    不知道看了几遍的kmp,反正到现在都没有弄清楚next[j]的计算和kmp的代码实现,温故而知新,经常回来看看,相信慢慢的就回了 从头到尾彻底理解KMP 理解KMP /*! * \file KMP_算 ...

  6. 初涉KMP算法

    久仰字符串系列理论 KMP 讲解(引用自bzoj3670动物园) 某天,园长给动物们讲解KMP算法. 园长:“对于一个字符串S,它的长度为L.我们可以在O(L)的时间内,求出一个名为next的数组.有 ...

  7. 【BZOJ】【1009】 【HNOI2008】GT考试

    DP/KMP/矩阵乘法 好神的题啊……跪了跪了 $n\leq 10^9$是什么鬼……我们还是先不要考虑这个鬼畜的玩意了>_> 用类似数位DP的思路,我们可以想到一个DP方程:$f[i][j ...

  8. 从头到尾彻底理解KMP

    从头到尾彻底理解KMP 作者:July 时间:最初写于2011年12月,2014年7月21日晚10点 全部删除重写成此文,随后的半个多月不断反复改进. 1. 引言 本KMP原文最初写于2年多前的201 ...

  9. 深入理解kmp中的next数组

    next数组 1. 如果对于值k,已有p0 p1, ..., pk-1 = pj-k pj-k+1, ..., pj-1,相当于next[j] = k. 此意味着什么呢?究其本质,next[j] = ...

随机推荐

  1. 【codeforces】【比赛题解】#915 Educational CF Round 36

    虽然最近打了很多场CF,也涨了很多分,但是好久没写CF的题解了. 前几次刚刚紫名的CF,太伤感情了,一下子就掉下来了,不懂你们Div.1. 珂学的那场我只做了第一题……悲伤. 这次的Education ...

  2. java四舍五入BigDecimal和js保留小数点两位

    java四舍五入BigDecimal保留两位小数的实现方法: // 四舍五入保留两位小数System.out.println("四舍五入取整:(3.856)="      + ne ...

  3. 去除TFS版本控制

    对于曾经做过TFS版本控制的项目,在版本控制服务不可用的时候,依然会在每次打开项目的时候都提示:当前项目是版本控制的项目,但是当前版本控制不可用,balabala的信息,如果是需要进行版本控制的项目在 ...

  4. C# 浅谈 接口(Interface)的作用

    继承"基类"跟继承"接口"都能实现某些相同的功能,但有些接口能够完成的功能是只用基类无法实现的 1.接口用于描述一组类的公共方法/公共属性. 它不实现任何的方法 ...

  5. Shell编程学习2--命令大全

    Linux中有很多的命令,这些命令可分分为10类(具体参见[1]): 1) 文件管理; 2) 文档编辑; 3) 文件传输; 4) 磁盘管理; 5) 磁盘维护; 6) 网络通讯; 7) 系统管理; 8) ...

  6. git —— Feature分支

    添加新功能时,新建feature分支 分支上开发完成后,再进行合并.最后删除feature分支 $ git checkout -b feature-vulcan 开发完毕后,切换回添加的分支,进行合并 ...

  7. require和import的区别

    require:是一种common协议,大家按照这个约定书写自己的代码,实现模块化. import:是ES6的模块语法实现.是语言自身的模块实现.

  8. Centos中查询目录中内容命名ls

    首先解释下这块, root代表当前登录用户,localhost代表主机名, ~代表当前主机目录,  #代表用户权限   #表示超级用户,$表示普通用户: 查询目录中内容命令 ls  (list缩写) ...

  9. 20165333 学习基础和C语言学习基础

    说实话,我并没有什么技能比90%以上的人更好,非要拿一个出来的话,篮球勉强好一点吧.最初接触篮球是小学的时候跟着哥哥看他打球,哥哥的球技在同龄人中算是好的,每次看他各种突破过人,我都觉得特别潇洒帅气, ...

  10. mongo体系架构学习

    MongoDB是一个可移植的数据库,它在流行的每一个平台上都可以使用,即所谓的跨平台性,在不同的操作系统上虽然略有差别,但是从整体架构上来看,MongoDB在不同的平台上是一样的,如数据逻辑结构和数据 ...