【初识】KMP算法入门

举个例子

模式串S：a s d a s d a s d f a s d

匹配串T：a s d a s d f

如果使用朴素匹配算法——

1 2 3 4 5 6 8 9

a s d a s d a s d f a s d

a s d a s d f

1 2 3 4 5 6

此时，匹配到了S7和T7了，S7为a而T7为f，不匹配那么朴素的匹配算法会这么做——

1 3 4 5 6 7 8 9

a s d a s d a s d f a s d

a s d a s d f

1 2 3 4 5 6 7

这时，我们会发现，模式串回溯到了S2，而匹配串回溯到了T1。

很明显，这会极大的降低算法的效率，在最坏情况下，我们需要将模式串几乎每个元素都查询一次，而每次查询都从匹配串的串首走到接近串尾，这样的时间复杂度为n*m，其中n和m分别为模式串和匹配串的长度。

那么我们是否有可能降低时间复杂度呢？答案是肯定的——很明显我们只需要想办法减少回溯，就可以达到效果。Kmp算法就是使用这种方法节省时间的。

1 2 3 4 5 6 8 9

a s d a s d a s d f a s d

a s d a s d f

1 2 3 4 5 6 7

这个东西很熟悉吧？刚刚出现过一次。

那么，kmp算法会怎么执行下一步呢？答案如下——

1 2 3 4 5 6 8 9

a s d a s d a s d f a s d

a s d a s d f

1 2 3 5 6 7

注意这一步！这里的模式串根本没有回溯，只是将匹配串向后移动了若干步。这样，最坏情况只是将模式串走一遍，然后将匹配串走一遍，当然了，匹配串里面的部分元素会走多次，但是，很明显这种算法会将n*m降低到n+k，这个k和m内部部分元素的重复次数有关，最大不会超过n（当然这是我自己证明得到的，不一定正确，以后我还会继续证明的）。

好了，方法知道了，那么怎么实现呢？

换句话说，怎么实现迅速的移动匹配串呢？答案是——添加一个Next数组，标记匹配串中的特性。

这个Next数组的特性很明显

Next[0] = -1，即这是第一个元素，前面没有可以替换它的。
Next[j] = k ; { k | T[0] = T[j-k], T[1] = T[j-k+1],... , T[k-1] = T[j-1]}。
Next[j] = 0; 其他情况。

举例：

匹配串T: a s d a s d f

Next: -1 0 0 0 1 2 3

具体见代码——

 #include <iostream>

 #include <cstdio>

 #include <cstring>

 #include <cmath>

 #include <algorithm>

 using namespace std;

 const int N = ;

 char s[N], t[N];

 int Next[N];

 int lenS, lenT;

 void kmpNext(char* T)                                           //计算Next数组

 {

     int i = ;

     Next[] = -;                                               //Next[0] = -1

     while(i < lenT)

     {

         int j = ;

         while(T[j] == T[i])                                     //Next[i] = j; { j | T[0] = T[i-j], T[1] = T[i-j+1],... , T[j-1] = T[i-1]}

         {

             Next[i] = j;

             i++;

             j++;

         }

         Next[i] = j;                                            //同上，或等于0

         i++;

     }

 }

 bool kmp(char* S, char* T)                                      //kmp

 {

     lenS = strlen(S);

     lenT = strlen(T);

     kmpNext(T);

     int i = , j = ;

     while(i < lenS && j < lenT)                                 //当模式串或匹配串走完时退出

     {

         if(j == -)

         {

             i++;

             j = ;

         }

         else if(S[i] == T[j])

         {

             i++;

             j++;

         }

         else j = Next[j];

     }

     if(j == lenT) return ;                                     //如果匹配串走完，表示匹配串是模式串的子串

     return ;

 }

 int main()

 {

     //freopen("test.in", "r", stdin);

     while(~scanf("%s%s", s, t))

     {

         if(kmp(s, t)) printf("Yes\n");

         else printf("No\n");

     }

     return ;

 }

【初识】KMP算法入门的更多相关文章

【初识】KMP算法入门（转）
感觉写的很好,尤其是底下的公式,易懂,链接:http://www.cnblogs.com/mypride/p/4950245.html 举个例子模式串S:a s d a s d a s d f a ...
【面向打野编程】——KMP算法入门
一.问题咱们先不管什么KMP,来看看怎么匹配两个字符串. 问题:给定两个字符串,求第二个字符串是否包含于第一个字符串中. 为了具体化,我们以 ABCAXABCABCABX 与 ABCABCABX为例 ...
KMP算法入门讲解
字符串匹配问题.假设文本是一个长度为$n$的字符串$T$,模板是一个长度为$m$的字符串$P$,且$m\leq n$.需要求出模板在文本中的所有匹配点$i$,即满足$T[i]=P[0],T[I+1]= ...
HDU_1711_初识KMP算法
Number Sequence Time Limit: 10000/5000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others) ...
KMP算法入门
学一把看毛片算法我觉得自己才能变得更加出色明明昨天的题我都知道怎么模拟了,但是还是不会改KMP,是我学丑了 KMP是Knuth-Morris-Pratt三人设计的线性时间字符串匹配算法 nxt数组的 ...
KMP算法——从入门到懵逼到了解
本博文參考http://blog.csdn.net/v_july_v/article/details/7041827 关于其它字符串匹配算法见http://blog.csdn.net/WINCOL/a ...
KMP算法之从懵逼到入门
写本文的目的: 1.加深自己的理解,以便自己日后复习 2.给看到此文的人一点启发 KMP算法看懂了就觉得特别简单,思路也好理解,但是看不懂之前,查各种资料看大佬的博客,都很懵逼...... 1. 算 ...
萌新笔记——用KMP算法与Trie字典树实现屏蔽敏感词（UTF-8编码）
前几天写好了字典,又刚好重温了KMP算法,恰逢遇到朋友吐槽最近被和谐的词越来越多了,于是突发奇想,想要自己实现一下敏感词屏蔽. 基本敏感词的屏蔽说起来很简单,只要把字符串中的敏感词替换成"* ...
KMP算法的Next数组详解
转载请注明来源,并包含相关链接. 网上有很多讲解KMP算法的博客,我就不浪费时间再写一份了.直接推荐一个当初我入门时看的博客吧:http://www.cnblogs.com/yjiyjige/p/32 ...

随机推荐

Linux路径名和文件名最大长度限制
UNIX标准对路径名和文件名最大长度限制做出了说明,但其上限值在实际应用长过小,Linux在具体实现时提升了该上限,该限制在Linux的 /usr/include/linux/limits.h 中做出 ...
Floyd_Warshall算法
Floyd_Warshall算法主要用于求解所有节点对的最短路径,代码如下: #include<iostream> using namespace std; #define Inf 655 ...
flask基础之app初始化(四)
前言 flask的核心对象是Flask,它定义了flask框架对于http请求的整个处理逻辑.随着服务器被启动,app被创建并初始化,那么具体的过程是这样的呢? 系列文章 flask基础之安装和使用入 ...
Tslib移植与分析【转】
转自:http://blog.csdn.net/water_cow/article/details/7215308 目标平台:LOONGSON-1B开发板(mips32指令集)编译平台:x86PC-- ...
gnuplot生成MySQL QPS图形
1.建立MySQL QPS执行脚本 #!/bin/bash mysqladmin -uroot -p' extended-status -i1|awk \ 'BEGIN{flag=0; print & ...
vue项目中遇到的一些问题
或访问:https://github.com/littleHiuman/experiences-about-vue 欢迎补充! vuex 状态 vue-cli 命令行 vue vue vue-rou ...
Java 并发--线程创建
随着处理器的多核化,为提高处理器的资源利用率应用程序的并发变应运而生了.现在的操作系统是多任务操作系统,多线程是实现多任务的一种方式. 进程是指一个内存中运行的应用程序,每个进程都有自己独立的内存空间 ...
一篇文章读懂开源web引擎Crosswalk-《转载》
前言 Web技术的优势早已被广大应用开发者熟知,比如可与云服务轻松集成,基于响应式UI设计的精美布局,高度的开放性,跨平台能力, 高效的分发与部署等等.伴随着移动互联网的快速发展与HTML5技术的逐步 ...
IntelliJ IDEA + Tomcat ；On Upate Action 与 On Frame Deactivation
On Upate Action 与 On Frame Deactivation 这两个选项的设置,依赖于项目的部署方式是war包还是 exploded ,看下面的gif: 这里实在是太灵活了, ...
POJ 2195 Going Home（KM算法模板）
题目链接:http://poj.org/problem?id=2195 题目大意: 给定一个N*M的地图,地图上有若干个man和house,且man与house的数量一致. man每移动一格需花费$1 ...

【初识】KMP算法入门

【初识】KMP算法入门的更多相关文章

随机推荐

热门专题