简单介绍一下问题

给定source字符串,找出target字符串出现的首位

例如

source   为“abddabddabc”

target  为 “abddabc”

从第一位开始比较 |a b d d a b|d d a b c

         |a b d d a b|c   不匹配

从第二位继续比较 a|b d d a b d d a b c

           |a       不匹配

。。。

。。。

从第五位继续比较 a b d d|a b d d a b c

             a b d d a b c  匹配成功

再给出kmp算法

从第一位开始比较 a b d d a b|d d a b c

         a b d d a b|c  不匹配

————————————————————————————————

观察失配处前两位ab与target的前两位ab一致,

而整个target不再出现ab,所以即使出现匹配,也只能出现在最后两位

也就是ab之后,所以我们可以直接跳过中间所有位

直接把target的前两位与source当前ab对齐,继续匹配

————————————————————————————————

第二次匹配        a b d d| a b|| d d a b c 

                   | a b||d d a b c 

其中单斜杠处即为所求 双斜杠处为第二次匹配起始位

在上个例子 两条长横线中的内容就是kmp的核心思路:

不需要每一次失配都只从下一位继续,

只需要对比首位的重合部分,移动target,使其首尾重合部分对其,即可继续对比

再举一个极端的例子,便于理解

target 为 abcdefgh

如果source存在匹配部分,那这部分必由a起始

所以在匹配的过程中,发生了失配,即可全部跳过,对比下一位是否为a

而对于首尾有重合部分,则需要从重合部分下一位开始,而重合部分的起始位即为所求

重新用自然语言描述一下我们要做的事:

1  开始匹配 如果完成匹配 返回重合的起始位

2  发生失配 从当前失配位 观察target的首尾重合部分

3     调整target到重合部分首位 从失配位继续匹配

而失配位前target的首尾重合部分的长度由target自身决定,举例说明

  a b d d a b d d a b c

  0 1 2 3 4 5 6 7 8 9 10

  0 0 0 0 1 2 3 4 1 2 0

比如当source为

  a b d d a b d d c c c c c c c c c

  0 1 2 3 4 5 6 7 8 9 10

  0 0 0 0 1 2 3 4 1 2 0

a b d d a b d d a b c

我们在第八位发生失配,那么在0+8-4位为起始,从target的4 位继续匹配即可

下面给出java代码实现:

package cn.baqn.selfstudy;
public class Solution {
 public static void main(String[] args) {
  String source="abddabkdabc";
  String target="abddabc";
  int a=Solution.strStr(source, target);
  System.out.println(a);
 }
 public static int strStr(String source, String target) {
  if(target=="") {
   return 0;
  }
  if(source.length()<target.length()) {
   return -1;
  }
  int[] next=nextKmp(target);
  int j=0;
  int i=0;
  while(true){
   while(j<target.length()&&(i+j)<source.length()&&source.charAt(i+j)==target.charAt(0+j)) {
    //System.out.println(source.charAt(i+j));
    j++;
   }
   if(j==target.length()) {
    System.out.println("!");
    return i;
   }
   if((i+j)==source.length()) {
    return -1;
   }
   if(j==0) {
    i++;
    continue;
   }
   i=i+j-next[j-1];
   j=next[j-1];
   
   
  }
    }
 public static int[] nextKmp(String str) {
  if(str.equals("")) {
   return null;
  }
  int[] next=new int[str.length()];
  for (int i = 0; i < next.length; i++) {
   next[i]=0;
  }
  for (int i = 1; i < str.length(); ) {
   int j=0;
   while((i+j)<str.length()&&str.charAt(i+j)==str.charAt(0+j)) {
    next[i+j]=j+1;
    j++;
   }
   if(j==0) {
    i++;
   }else {
    i+=j; 
   }
  }
  return next;
 }
}

    

一个简易的kmp教学并给出java实现的更多相关文章

  1. Java实践:一个简易的http server和client的java源码学习和总结。

    一.基本思路: 1.服务器端通过socket(), 监听在TCP 8080端口,等待客户端来连接. 2.服务器端解析客户端的HTTP请求中的URI值,把本地的目录下指定文件通过java的读取文件的方式 ...

  2. .NET Core的文件系统[5]:扩展文件系统构建一个简易版“云盘”

    FileProvider构建了一个抽象文件系统,作为它的两个具体实现,PhysicalFileProvider和EmbeddedFileProvider则分别为我们构建了一个物理文件系统和程序集内嵌文 ...

  3. 自己来实现一个简易的OCR

    来做个简易的字符识别 ,既然是简易的 那么我们就不能用任何的第三方库 .啥谷歌的 tesseract-ocr, opencv 之类的 那些玩意是叼 至少图像处理 机器视觉这类课题对我这种高中没毕业的人 ...

  4. 探秘Tomcat——一个简易的Servlet容器

    即便再简陋的服务器也是服务器,今天就来循着书本的第二章来看看如何实现一个servlet容器. 背景知识 既然说到servlet容器这个名词,我们首先要了解它到底是什么. servlet 相比你或多或少 ...

  5. ENode 2.0 - 第一个真实案例剖析-一个简易论坛(Forum)

    前言 经过不断的坚持和努力,ENode 2.0的第一个真实案例终于出来了.这个案例是一个简易的论坛,开发这个论坛的初衷是为了验证用ENode框架来开发一个真实项目的可行性.目前这个论坛在UI上是使用了 ...

  6. 使用MVVM框架avalon.js实现一个简易日历

    最近在做公司内部的运营管理系统,因为与日历密切相关,同时无需触发条件直接显示在页面上,所以针对这样的功能场景,我就用avalon快速实现了一个简易日历,毕竟也是第一次造日历这种轮子,所以这里记录下我当 ...

  7. C 实现一个简易的Http服务器

    引言 做一个老实人挺好的,至少还觉得自己挺老实的. 再分享一首 自己喜欢的诗人的一首 情景诗. 每个人总会有问题,至少喜欢就好, 本文 参照 http 协议   http://www.cnblogs. ...

  8. avalon.js实现一个简易日历

    使用MVVM框架avalon.js实现一个简易日历   最近在做公司内部的运营管理系统,因为与日历密切相关,同时无需触发条件直接显示在页面上,所以针对这样的功能场景,我就用avalon快速实现了一个简 ...

  9. Tinychatserver: 一个简易的命令行群聊程序

    这是学习网络编程后写的一个练手的小程序,可以帮助复习socket,I/O复用,非阻塞I/O等知识点. 通过回顾写的过程中遇到的问题的形式记录程序的关键点,最后给出完整程序代码. 0. 功能 编写一个简 ...

随机推荐

  1. Ubuntu安装apache+Yii2

    1.下载Yii2 https://www.yiichina.com/download 2.将解压后的文件放在指定的位置,这里是/home/www/yii/ 3.安装apache2 sudo apt-g ...

  2. SQL Server 创建跨库查詢、修改、增加、删除

    一.通过SQL语句访问远程数据库   --OPENROWSET函数 使用OPENROWSET()是个不错的选择,也可以用做跨库查询包括增.删.改.查 下面就来介绍一下OPENROWSET函数的运用 包 ...

  3. Windows Server 2016-批量设置用户下次登陆须更改密码

    Powershell设置某OU下所有用户下次登陆必须更改密码: Get-ADUser -Filter * -SearchBase "ou=syncall,dc=azureyun,dc=com ...

  4. Java中char,short,int,long占几个字节和多少位

    1.字节:byte:用来计量存储容量的一种计量单位:位:bit 2.一个字节等于8位  1byte = 8bit char占用的是2个字节 16位,所以一个char类型的可以存储一个汉字. 整型: b ...

  5. ReactNative之从HelloWorld中看环境搭建、组件封装、Props及State

    开篇呢,先给大家问个好,今天是中秋节,祝大家中秋节快乐!!虽然是中秋节,但是木有回家还是总结一下知识点写写博客吧,想着昨天总结一下的,但是昨天和几个同学小聚了一下,酒逢知己总是千杯少呢,喝的微醺不适合 ...

  6. @SuppressWarnings("rawtypes") 是什么含义

    简介:java.lang.SuppressWarnings是J2SE 5.0中标准的Annotation之一.可以标注在类.字段.方法.参数.构造方法,以及局部变量上.作用:告诉编译器忽略指定的警告, ...

  7. 【自然语言处理篇】--以NLTK为基础讲解自然语⾔处理的原理和基础知识

    一.前述 Python上著名的⾃然语⾔处理库⾃带语料库,词性分类库⾃带分类,分词,等等功能强⼤的社区⽀持,还有N多的简单版wrapper. 二.文本预处理 1.安装nltk pip install - ...

  8. Spring之旅第六篇-事务管理

    一.什么是事务 什么是事务(Transaction)?事务是数据库中的概念,是指访问并可能更新数据库中各种数据项的一个程序执行单元(unit). 有个非常经典的转账问题:A向B转款1000元,A转出成 ...

  9. 微服务实战(三):落地微服务架构到直销系统(构建基于RabbitMq的消息总线)

    从前面文章可以看出,消息总线是EDA(事件驱动架构)与微服务架构的核心部件,没有消息总线,就无法很好的实现微服务之间的解耦与通讯.通常我们可以利用现有成熟的消息代理产品或云平台提供的消息服务来构建自己 ...

  10. 【hashMap】详谈

    官方文档地说明 几个关键的信息:基于Map接口实现.允许null键/值.非同步.不保证有序(比如插入的顺序).也不保证序不随时间变化. 一.概述 HashMap 是一个散列表,它存储的内容是键值对(k ...