KMP算法不同写法之间区别

网上之所以有这么多版本的KMP算法，是因为有的人写的是最大长度串版本的，有的人写的是next数组版本的（具体区别看下面博文），有的人写的是next优化版的，有的人写的是未优化的，不同人写的循环方法不同，这些写法间的效率是有一定区别的

KMP算法具体讲解看这篇博客，讲的非常非常详细：

https://blog.csdn.net/v_july_v/article/details/7041827#

重点应该在理解Next数组和Next数组的优化

我试着再写一下我理解的优化过程：

比如这张图：

设上面的串为A[]，下面的串为B[]，下标从0开始

根据最大长度串数组C的定义：

当前子串字符之前的字符串中，有多大长度的相同前缀后缀。例如如果C [j] = k，代表j 之前的字符串中有最大长度为k 的相同前缀后缀。

对于abab这个子串来说，最大长度串数组C就是0 0 1 2，那么next数组（未优化版）就是最大长度值整体向右移动一位，然后初始值赋为-1，即-1 0 0 1。

我们会发现当发生A[3]c与B[3]b失配后，左移两位（3-next[3]）后，会A[3]c会再次与B[1]b失配，事实上这是必然发生的，

回看next数组的定义（其实也就是最大长度串数组）：j 之前的字符串中有最大长度为k 的相同前缀后缀。既然后缀的这个字符已经失配了，那么前缀相同地方的字符也一定会失配，所以要避免这个情况发生，也就是若：B[j] = B[ next[j] ]就要让B[j] = B[ next[j] ]。

总结一下这个过程：

先求出最大长度串数组，整体左移一位，若B[j] = B[ next[j] ]即B[j] = B[ next[j] ]

最后给出一个nenxt优化版本的代码

 int a[];

 int b[];

 int len1, len2;

 int Next[];

 void getNext()

 {

     int k = -, j = ;

     Next[] = -;

     while(j < len2)

     {

         if(k == - || b[j] == b[k])

         {

             k++;

             j++;

             if(b[j] != b[k])

                 Next[j] = k;

             else//如果这一步失败 那么同值的也会失败

                 Next[j] = Next[k];

         }

         else

             k = Next[k];

     }

 }

 int kmp()

 {

     getNext();

     int i = , j = ;

     while(i < len1)

     {

         if(j == - || a[i] == b[j])

         {

             i++;

             j++;

         }

         else

             j = Next[j];

         if(j == len2)

             return i+-len2;

         //返回的是匹配到的index，如果是求次数或对错的话需要修改

     }

     return -;

 }

KMP算法不同写法之间区别的更多相关文章

Python 细聊从暴力（BF）字符串匹配算法到 KMP 算法之间的精妙变化
1. 字符串匹配算法所谓字符串匹配算法,简单地说就是在一个目标字符串中查找是否存在另一个模式字符串.如在字符串 "ABCDEFG" 中查找是否存在 "EF" ...
KMP算法的一次理解
1. 引言在一个大的字符串中对一个小的子串进行定位称为字符串的模式匹配,这应该算是字符串中最重要的一个操作之一了.KMP本身不复杂,但网上绝大部分的文章把它讲混乱了.下面,咱们从暴力匹配算法讲起,随 ...
字符串模式匹配KMP算法
一篇不错的博客:http://www.cnblogs.com/dolphin0520/archive/2011/08/24/2151846.html KMP字符串模式匹配通俗点说就是一种在一个字符串中 ...
KMP算法深入解析
本文主要介绍KMP算法原理.KMP算法是一种高效的字符串匹配算法,通过对源串进行一次遍历即可完成对字符串的匹配. 1.基础知识的铺垫字符串T的前k(0 =< k <=tlen)个连续的字 ...
字符串匹配KMP算法详解
1. 引言以前看过很多次KMP算法,一直觉得很有用,但都没有搞明白,一方面是网上很少有比较详细的通俗易懂的讲解,另一方面也怪自己没有沉下心来研究.最近在leetcode上又遇见字符串匹配的题目,以此 ...
KMP算法详细分解
1. 引言给定一个主串(以 S 代替)和模式串(以 P 代替),要求找出 P 在 S 中出现的位置,此即串的模式匹配问题. Knuth-Morris-Pratt 算法(简称 KMP)是解决这一问题的 ...
算法 kmp算法
kmp算法是改进后的字符匹配算法,它与bf算法的区别是,每次从串与主串匹配失败后,从串与主串匹配的位置不同. 下面具体说下这两种算法的区别: 主串:BABCDABABCDABCED 从串:ABCDAB ...
KMP算法的next函数求解和分析过程
转自 wang0606120221:http://blog.csdn.net/wang0606120221/article/details/7402688 假设KMP算法中的模式串为P,主串为S,那么 ...
从头到尾测地理解KMP算法【转】
本文转载自:http://blog.csdn.net/v_july_v/article/details/7041827 1. 引言本KMP原文最初写于2年多前的2011年12月,因当时初次接触KMP ...

随机推荐

Azure的CentOS上安装LIS (Linux Integration Service)
Azure上虚拟化技术都是采用的Hyper-v,每台Linux虚拟机都安装了LIS(Linux Integration Service).LIS的功能是为VM提供各种虚拟设备的驱动.所以LIS直接影响 ...
ABP 学习系列 - 目录
一.ABP 学习系列 - 入门介绍之单表 http://www.cnblogs.com/yabu007/p/8067694.html 二.ABP 学习系列 - 入门介绍之多表 http://www.c ...
【转】 Pro Android学习笔记（八九）：了解Handler（3）：延迟执行小例子
目录(?)[-] 小例子 Handler的处理 Activity的代码片段后台线程和UI的互动文章转载只能用于非商业性质,且不能带有虚拟货币.积分.注册等附加条件.转载须注明出处:http://b ...
四川第七届 I Travel（bfs）
Travel The country frog lives in has nn towns which are conveniently numbered by 1,2,…,n1,2,…,n. Amo ...
Python数据库(二)-Mysql数据库插入数据
通过python连接mysql数据库,并插入数据 # -*- coding:utf-8 -*- __author__ = "MuT6 Sch01aR" import pymysql ...
2015.4.21 SetWindowPos函数用法
定义:[DllImport("user32.dll")] public static extern bool SetWindowPos(IntPtr hWnd, int hWndl ...
Recovery of DISKGROUP in VXVM (ZT)
http://gurkulindia.com/main/2012/03/recovery-of-diskgroup-in-vxvm-veritas-volume-manager/# Since lon ...
Tiny4412 u-boot分析（1）u-boot配置流程分析
参考Friendlyarm的文档,编译uboot的流程为 make tiny4412_config make 这个过程主要涉及到两个文件,顶层的Makefile文件和mkconfig文件,makeco ...
Java开源中文分词类库
IKAnalyzer IKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包.从2006年12月推出1.0版开始,IKAnalyzer已经推出了3个大版本.最初,它是以开 ...
UWP蓝牙的例子
https://answers.microsoft.com/zh-hans/windows/forum/windows_10-networking/%e5%9c%a8win10%e7%8e%af%e5 ...

KMP算法不同写法之间区别

KMP算法不同写法之间区别的更多相关文章

随机推荐

热门专题