【初识】KMP算法入门（转）

感觉写的很好，尤其是底下的公式，易懂，链接：http://www.cnblogs.com/mypride/p/4950245.html

举个例子

模式串S：a s d a s d a s d f a s d

匹配串T：a s d a s d f

如果使用朴素匹配算法——

1 2 3 4 5 6 7 8 9

a s d a s d a s d f a s d

a s d a s d f

1 2 3 4 5 6

此时，匹配到了S7和T7了，S7为a而T7为f，不匹配那么朴素的匹配算法会这么做——

1 2 3 4 5 6 7 8 9

a s d a s d a s d f a s d

a s d a s d f

1 2 3 4 5 6 7

这时，我们会发现，模式串回溯到了S2，而匹配串回溯到了T1。

很明显，这会极大的降低算法的效率，在最坏情况下，我们需要将模式串几乎每个元素都查询一次，而每次查询都从匹配串的串首走到接近串尾，这样的时间复杂度为n*m，其中n和m分别为模式串和匹配串的长度。

那么我们是否有可能降低时间复杂度呢？答案是肯定的——很明显我们只需要想办法减少回溯，就可以达到效果。Kmp算法就是使用这种方法节省时间的。

1 2 3 4 5 6 7 8 9

a s d a s d a s d f a s d

a s d a s d f

1 2 3 4 5 6 7

这个东西很熟悉吧？刚刚出现过一次。

那么，kmp算法会怎么执行下一步呢？答案如下——

1 2 3 4 5 6 7 8 9

a s d a s d a s d f a s d

a s d a s d f

1 2 3 4 5 6 7

注意这一步！这里的模式串根本没有回溯，只是将匹配串向后移动了若干步。这样，最坏情况只是将模式串走一遍，然后将匹配串走一遍，当然了，匹配串里面的部分元素会走多次，但是，很明显这种算法会将n*m降低到n+k，这个k和m内部部分元素的重复次数有关，最大不会超过n（当然这是我自己证明得到的，不一定正确，以后我还会继续证明的）。

好了，方法知道了，那么怎么实现呢？

换句话说，怎么实现迅速的移动匹配串呢？答案是——添加一个Next数组，标记匹配串中的特性。

这个Next数组的特性很明显

Next[0] = -1，即这是第一个元素，前面没有可以替换它的。
Next[j] = k ; { k | T[0] = T[j-k], T[1] = T[j-k+1],... , T[k-1] = T[j-1]}。
Next[j] = 0; 其他情况。

举例：

匹配串T: a s d a s d f

Next: -1 0 0 0 1 2 3

具体见代码——

#include <iostream>
#include <cstdio>
#include <cstring>
#include <cmath>
#include <algorithm>
using namespace std;

;

char s[N], t[N];
int Next[N];
int lenS, lenT;

void kmpNext(char* T)                                           //计算Next数组
{
    ;
    Next[] = -;                                               //Next[0] = -1
    while(i < lenT)
    {
        ;
        while(T[j] == T[i])                                     //Next[i] = j; { j | T[0] = T[i-j], T[1] = T[i-j+1],... , T[j-1] = T[i-1]}
        {
            Next[i] = j;
            i++;
            j++;
        }
        Next[i] = j;                                            //同上，或等于0
        i++;
    }
}

bool kmp(char* S, char* T)                                      //kmp
{
    lenS = strlen(S);
    lenT = strlen(T);
    kmpNext(T);
    , j = ;
    while(i < lenS && j < lenT)                                 //当模式串或匹配串走完时退出
    {
        )
        {
            i++;
            j = ;
        }
        else if(S[i] == T[j])
        {
            i++;
            j++;
        }
        else j = Next[j];
    }
    ;                                     //如果匹配串走完，表示匹配串是模式串的子串
    ;
}

int main()
{
    //freopen("test.in", "r", stdin);
    while(~scanf("%s%s", s, t))
    {
        if(kmp(s, t)) printf("Yes\n");
        else printf("No\n");
    }
    ;
}

【初识】KMP算法入门（转）的更多相关文章

【初识】KMP算法入门
举个例子模式串S:a s d a s d a s d f a s d 匹配串T:a s d a s d f 如果使用朴素匹配算法—— 1 2 3 4 5 6 8 9 a s d a s d a s ...
【面向打野编程】——KMP算法入门
一.问题咱们先不管什么KMP,来看看怎么匹配两个字符串. 问题:给定两个字符串,求第二个字符串是否包含于第一个字符串中. 为了具体化,我们以 ABCAXABCABCABX 与 ABCABCABX为例 ...
KMP算法入门讲解
字符串匹配问题.假设文本是一个长度为$n$的字符串$T$,模板是一个长度为$m$的字符串$P$,且$m\leq n$.需要求出模板在文本中的所有匹配点$i$,即满足$T[i]=P[0],T[I+1]= ...
HDU_1711_初识KMP算法
Number Sequence Time Limit: 10000/5000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others) ...
KMP算法入门
学一把看毛片算法我觉得自己才能变得更加出色明明昨天的题我都知道怎么模拟了,但是还是不会改KMP,是我学丑了 KMP是Knuth-Morris-Pratt三人设计的线性时间字符串匹配算法 nxt数组的 ...
KMP算法——从入门到懵逼到了解
本博文參考http://blog.csdn.net/v_july_v/article/details/7041827 关于其它字符串匹配算法见http://blog.csdn.net/WINCOL/a ...
KMP算法之从懵逼到入门
写本文的目的: 1.加深自己的理解,以便自己日后复习 2.给看到此文的人一点启发 KMP算法看懂了就觉得特别简单,思路也好理解,但是看不懂之前,查各种资料看大佬的博客,都很懵逼...... 1. 算 ...
萌新笔记——用KMP算法与Trie字典树实现屏蔽敏感词（UTF-8编码）
前几天写好了字典,又刚好重温了KMP算法,恰逢遇到朋友吐槽最近被和谐的词越来越多了,于是突发奇想,想要自己实现一下敏感词屏蔽. 基本敏感词的屏蔽说起来很简单,只要把字符串中的敏感词替换成"* ...
KMP算法的Next数组详解
转载请注明来源,并包含相关链接. 网上有很多讲解KMP算法的博客,我就不浪费时间再写一份了.直接推荐一个当初我入门时看的博客吧:http://www.cnblogs.com/yjiyjige/p/32 ...

随机推荐

scala言语基础学习七
一.将函数赋值给变量二.匿名函数三.高阶函数高阶函数好像调用不打印是看不到赋值和普通函数区别高阶函数的类型推断 reduce操作相当于1*2*3*4*5*6*7*8*9 def getNa ...
meta是什么意思？
META标签,是HTML语言head区的一个辅助性标签.在几乎所有的page里,我们都可以看到类似下面这段html代码: -------------------------------------- ...
sed详解
1. Sed简介 sed 是一种在线编辑器,它一次处理一行内容.处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”(pattern space),接着用sed命令处理缓冲区中的内容,处理完成后 ...
套接字I/O模型-select
共有6种类型套接字I/O模型.blocking(阻塞),select(选择),WSAAsyncSelect(异步选择),WSAEventSelect(事件选择),overlapped(重叠),comp ...
Linux下PHP+MySQL+CoreSeek中文检索引擎配置
说明: 操作系统:CentOS 5.X 服务器IP地址:192.168.21.127 Web环境:Nginx+PHP+MySQL 站点根目录:/usr/local/nginx/html 目的:安装co ...
linux包之包管理命令rpm-yum
背景 YUM(Yellow dog Updater, Modified)为多个Linux发行版的前端软件包管理器,例如 Redhat RHEL, CentOS & Fedora. YUM通过调 ...
asp.net 程序，单击按钮时同时实现打开页面并处理值
来源:http://blog.csdn.net/nvhaixx/article/details/12430757 1)在网页中添加用于处理的客户端事件: <script language=&qu ...
.net framework4与其client profile版本的区别
简而言之,client profile版本是完整版本的一个子集.包含大多数最常用的功能并减小了体积,以便更容易的安装和发布,同时还有微软所声称的一些好处,比如因为减少了某些库,所以使其更加安全等等. ...
js中的各种宽高以及位置总结
在javascript中操作dom节点让其运动的时候,常常会涉及到各种宽高以及位置坐标等概念,如果不能很好地理解这些属性所代表的意义,就不能理解js的运动原理,同时,由于这些属性概念较多,加上浏览器之 ...
Hadoop数据传输工具：Sqoop
Apache Sqoop(SQL-to-Hadoop) 项目旨在协助 RDBMS 与 Hadoop 之间进行高效的大数据交流.用户可以在 Sqoop 的帮助下,轻松地把关系型数据库的数据导入到 Had ...

【初识】KMP算法入门（转）

【初识】KMP算法入门（转）的更多相关文章

随机推荐

热门专题