KMP匹配算法

先来说一下回溯法匹配字符串：

对于主字符串有一个target_index，以target_index（不动）为起点，匹配字符串pattern的长度+target_index为终点，逐个进行比较，当发现不符合时，将target_index加1，进行下一轮比较，也就是说最坏的情况需要遍历target中length(target)-length(pattern)个元素。

这种回溯法没有很有效的利用已经得到的信息：当比较到了target_index+j个元素，发现都一样，但是第target_index+j+1个元素不一样时，我们直接就从target_index+1开始重新比较，没有很好的利用target_index+j已经之前的元素一样的信息了。

KMP算法在一定的程度上用到了该信息。

已经知道（target_index，target_index+j）这中间的元素是一样的了，那么target_index该移动多少距离才是效率更高的呢。

比如说target：{"a","n","n","a","c","d","a","n","a","c","a","d","s","a","n","n","a","n","n","a","c","a","n","n","a"}

pattern：{"a","n","n","a","b","a","n","n","a"}

在target_index=0，j=3,的情况下，target=pattern，当j=4时，开始不匹配了

现在将已经匹配的"a","n","n","a"分为数组A和B，即A={"a","n","n","a"}；B={"a","n","n","a"}；

B从后面与A开始比较

A："a","n","n","a"

B： "a","n","n","a"

有一个字符是一样的,统计这种一样字符的个数，设为count（本例中count为0（有一个元素），如果没有这样的个数，则count为-1）

于是target_index移动target_index+length(A)-count

可以这么移动而不是逐个逐个移动的原因在于：在本例中A自我覆盖的个数count为0，如果在target中找到了pattern，也必然是以count中元素开头的，所以length(A)-count不可能是pattern的开头，所以这些元素可以直接略过去。

public class KMPalgorithm {



   public static void main(String[] args) {
       String []word = {"a","n","n","a","c","a","n","n","a"};
       String []target = {"a","n","n","b","c","d","a","n","a","c","a","d","s","a","n","n","a","n","n","a","c","a","n","n","a"};
       //String []word = {"a","b","a"};
       System.out.print(kmp_find(target,word));
   }

   public static int overlayFunction(String[]word){
       int length = word.length;
       for(int i = 1;i<length;i++){
           boolean flag = true;
           String[] newWord = new String[length-i];
           int count = -1;
           for(int j = 0;j<length-i;j++){
               newWord[j] = word[j+i];
               if(word[j+i]!=word[j]){
                   flag = false;
                   break;
               }
               count = j;
           }
           if(flag == true){
               return count;
           }
       }
       return -1;
   }


   public static int kmp_find(String[]target,String []word){
       int lengthT = target.length;
       int lengthW = word.length;
       for(int i = 0;i<lengthT-lengthW+1;){
           boolean flag = true;
           int j1 = 0;
           for(int j = 0;j<lengthW;j++){
               if(target[i+j]!=word[j]){
                   flag = false;
                   j1 = j;
                   break;
               }

           }
           if(!flag&&j1 == 0){
               i = i+1;
           }else if(flag==true){
               return i;
           }else{
               String[]pattern2 = new String[j1];
               for(int k = 0;k<j1;k++){
                   pattern2[k] = word[k];
               }
               i = i+j1-1-overlayFunction(pattern2);

           }
           System.out.println("查找的target的index"+i);
       }
       return -1;
   }
}

KMP匹配算法的更多相关文章

搞定KMP匹配算法
KMP算法介绍及实现——轻松搞定KMP匹配算法本文介绍了字符串匹配算法中的BF算法和KMP算法.本文中KMP算法介绍部分是关于KMP算法相关文章中最简洁的一篇文章之一.下一篇将继续介绍Horspoo ...
4-4-串的KMP匹配算法-串-第4章-《数据结构》课本源码-严蔚敏吴伟民版
课本源码部分第4章串 - KMP匹配算法 ——<数据结构>-严蔚敏.吴伟民版源码使用说明链接☛☛☛ <数据结构-C语言版>(严蔚敏,吴伟民版)课本源码 ...
数据结构——串的朴素模式和KMP匹配算法
一.朴素模式假设我们要从主串S="goodgoogle"中找到子串T="google"的位置,步骤如下: i表示主串的当前位置下标,j表示子串的当前位置下标, ...
c语言KMP匹配算法与字符串替换算法
一.字符串匹配算法 (1)传统匹配算法BF int Index_BF(char* S, char* T){ int i=1,j=1; while(i<=strlen(S) && ...
KMP匹配算法 - Number Sequence
Given two sequences of numbers : a[1], a[2], ...... , a[N], and b[1], b[2], ...... , b[M] (1 <= M ...
一眼看懂KMP匹配算法
KMP算法——快速从字符串M(母串)中找出与字符串Z(子串)匹配的子串例1: 0 1 2 3 4 5 M:a b c a b d Z: a b d BF算法(最一般的算法,也叫“蛮力算法”): 将 ...
字符串匹配算法 - KMP
前几日在微博上看到一则微博是说面试的时候让面试者写一个很简单的字符串匹配都写不出来,于是我就自己去试了一把.结果写出来的是一个最简单粗暴的算法.这里重新学习了一下几个经典的字符串匹配算法,写篇文章以巩 ...
KMP字符串匹配算法理解(转)
一.引言主串(被扫描的串):S='s0s1...sn-1',i 为主串下标指针,指示每回合匹配过程中主串的当前被比较字符: 模式串(需要在主串中寻找的串):P='p0p1...pm-1',j 为模式 ...
字符串匹配算法KMP算法
数据结构中讲到关于字符串匹配算法时,提到朴素匹配算法,和KMP匹配算法. 朴素匹配算法就是简单的一个一个匹配字符,如果遇到不匹配字符那么就在源字符串中迭代下一个位置一个一个的匹配,这样计算起来会有很多 ...

随机推荐

关于handler
1. 一个Handler只有一个队列;2. 在调用Handler.post(Runnable runnable)方法时,会将runnable封装成一个Message; 3. 在队列执行时,会判断当前的 ...
pthon在Notepad++中执行方式
使用 Notepad++ 编辑运行 Python 程序 Notepad++是一个开源的文本编辑器,功能强大而且使用方便.编辑和调试 Python 程序使用什么编辑器或者 IDE不同人有 ...
搭建fedora开发环境 common lisp, c++, go
第三方软件库: http://download1.rpmfusion.org/free/fedora/releases/25/Everything/x86_64/os/repoview/index.h ...
win2008下安装SQL SERVER 2005出现IIS功能要求警告解决方案
原因: 出现此问题的原因取决于 SQL Server 的不是所有 IIS 7.0 组件都安装在计算机上.下表列出了受影响的组件. 收起该表格展开该表格组件文件夹静态内容常见的 HTTP 功 ...
SSH Tunneling
把本地端口 local_port 转发到服务器 server2 的 remote_port 端口上, server1 和 server2可以是同一ip或者不同ip. ssh user@server1 ...
Ninject之旅之十一：Ninject动态工厂(附程序下载)
摘要如果我们已经知道了一个类所有的依赖项,在我们只需要依赖项的一个实例的场景中,在类的构造函数中引入一系列的依赖项是容易的.但是有些情况,我们需要在一个类里创建依赖项的多个实例,这时候Ninject ...
在VS中操作Mysql数据库
1.实现mysql数据库与VS的连接,需要安装两个插件,作者装的是mysql-connector-net-6.9.9.msi和 mysql-for-visualstudio-1.2.6.msi. 2. ...
第六百一十二、三、四、五天 how can I 坚持
上火了啊..已经2017了,真快,人生只是一瞬间,到头来都是一场空. 2016年最后一天,很悲催,没赶上火车.还不能改签,哪能哪次都这么幸运,长记性了,下午到济南,看了看弟弟的房子,到挺不错,就是装修 ...
python基础知识---操作文件
一.打开文件 open()函数 open函数返回一个文件对象. 用法:open('文件名','模式') 打开文件的模式有: r,只读模式(默认). w,只写模式.[不可读:不存在则创建:存在则删除内 ...
ASP.NET 常用状态（信息）保存方式
服务器端:Session(会话)/ Application/ Caching(缓存)/DataBase(数据库) Session: Session: 常用于保存登录用户ID.验证码不同的浏览器不能共 ...

KMP匹配算法

KMP匹配算法的更多相关文章

随机推荐

热门专题