简单介绍一下问题

给定source字符串,找出target字符串出现的首位

例如

source   为“abddabddabc”

target  为 “abddabc”

从第一位开始比较 |a b d d a b|d d a b c

         |a b d d a b|c   不匹配

从第二位继续比较 a|b d d a b d d a b c

           |a       不匹配

。。。

。。。

从第五位继续比较 a b d d|a b d d a b c

             a b d d a b c  匹配成功

再给出kmp算法

从第一位开始比较 a b d d a b|d d a b c

         a b d d a b|c  不匹配

————————————————————————————————

观察失配处前两位ab与target的前两位ab一致,

而整个target不再出现ab,所以即使出现匹配,也只能出现在最后两位

也就是ab之后,所以我们可以直接跳过中间所有位

直接把target的前两位与source当前ab对齐,继续匹配

————————————————————————————————

第二次匹配        a b d d| a b|| d d a b c 

                   | a b||d d a b c 

其中单斜杠处即为所求 双斜杠处为第二次匹配起始位

在上个例子 两条长横线中的内容就是kmp的核心思路:

不需要每一次失配都只从下一位继续,

只需要对比首位的重合部分,移动target,使其首尾重合部分对其,即可继续对比

再举一个极端的例子,便于理解

target 为 abcdefgh

如果source存在匹配部分,那这部分必由a起始

所以在匹配的过程中,发生了失配,即可全部跳过,对比下一位是否为a

而对于首尾有重合部分,则需要从重合部分下一位开始,而重合部分的起始位即为所求

重新用自然语言描述一下我们要做的事:

1  开始匹配 如果完成匹配 返回重合的起始位

2  发生失配 从当前失配位 观察target的首尾重合部分

3     调整target到重合部分首位 从失配位继续匹配

而失配位前target的首尾重合部分的长度由target自身决定,举例说明

  a b d d a b d d a b c

  0 1 2 3 4 5 6 7 8 9 10

  0 0 0 0 1 2 3 4 1 2 0

比如当source为

  a b d d a b d d c c c c c c c c c

  0 1 2 3 4 5 6 7 8 9 10

  0 0 0 0 1 2 3 4 1 2 0

a b d d a b d d a b c

我们在第八位发生失配,那么在0+8-4位为起始,从target的4 位继续匹配即可

下面给出java代码实现:

package cn.baqn.selfstudy;
public class Solution {
 public static void main(String[] args) {
  String source="abddabkdabc";
  String target="abddabc";
  int a=Solution.strStr(source, target);
  System.out.println(a);
 }
 public static int strStr(String source, String target) {
  if(target=="") {
   return 0;
  }
  if(source.length()<target.length()) {
   return -1;
  }
  int[] next=nextKmp(target);
  int j=0;
  int i=0;
  while(true){
   while(j<target.length()&&(i+j)<source.length()&&source.charAt(i+j)==target.charAt(0+j)) {
    //System.out.println(source.charAt(i+j));
    j++;
   }
   if(j==target.length()) {
    System.out.println("!");
    return i;
   }
   if((i+j)==source.length()) {
    return -1;
   }
   if(j==0) {
    i++;
    continue;
   }
   i=i+j-next[j-1];
   j=next[j-1];
   
   
  }
    }
 public static int[] nextKmp(String str) {
  if(str.equals("")) {
   return null;
  }
  int[] next=new int[str.length()];
  for (int i = 0; i < next.length; i++) {
   next[i]=0;
  }
  for (int i = 1; i < str.length(); ) {
   int j=0;
   while((i+j)<str.length()&&str.charAt(i+j)==str.charAt(0+j)) {
    next[i+j]=j+1;
    j++;
   }
   if(j==0) {
    i++;
   }else {
    i+=j; 
   }
  }
  return next;
 }
}

    

一个简易的kmp教学并给出java实现的更多相关文章

  1. Java实践:一个简易的http server和client的java源码学习和总结。

    一.基本思路: 1.服务器端通过socket(), 监听在TCP 8080端口,等待客户端来连接. 2.服务器端解析客户端的HTTP请求中的URI值,把本地的目录下指定文件通过java的读取文件的方式 ...

  2. .NET Core的文件系统[5]:扩展文件系统构建一个简易版“云盘”

    FileProvider构建了一个抽象文件系统,作为它的两个具体实现,PhysicalFileProvider和EmbeddedFileProvider则分别为我们构建了一个物理文件系统和程序集内嵌文 ...

  3. 自己来实现一个简易的OCR

    来做个简易的字符识别 ,既然是简易的 那么我们就不能用任何的第三方库 .啥谷歌的 tesseract-ocr, opencv 之类的 那些玩意是叼 至少图像处理 机器视觉这类课题对我这种高中没毕业的人 ...

  4. 探秘Tomcat——一个简易的Servlet容器

    即便再简陋的服务器也是服务器,今天就来循着书本的第二章来看看如何实现一个servlet容器. 背景知识 既然说到servlet容器这个名词,我们首先要了解它到底是什么. servlet 相比你或多或少 ...

  5. ENode 2.0 - 第一个真实案例剖析-一个简易论坛(Forum)

    前言 经过不断的坚持和努力,ENode 2.0的第一个真实案例终于出来了.这个案例是一个简易的论坛,开发这个论坛的初衷是为了验证用ENode框架来开发一个真实项目的可行性.目前这个论坛在UI上是使用了 ...

  6. 使用MVVM框架avalon.js实现一个简易日历

    最近在做公司内部的运营管理系统,因为与日历密切相关,同时无需触发条件直接显示在页面上,所以针对这样的功能场景,我就用avalon快速实现了一个简易日历,毕竟也是第一次造日历这种轮子,所以这里记录下我当 ...

  7. C 实现一个简易的Http服务器

    引言 做一个老实人挺好的,至少还觉得自己挺老实的. 再分享一首 自己喜欢的诗人的一首 情景诗. 每个人总会有问题,至少喜欢就好, 本文 参照 http 协议   http://www.cnblogs. ...

  8. avalon.js实现一个简易日历

    使用MVVM框架avalon.js实现一个简易日历   最近在做公司内部的运营管理系统,因为与日历密切相关,同时无需触发条件直接显示在页面上,所以针对这样的功能场景,我就用avalon快速实现了一个简 ...

  9. Tinychatserver: 一个简易的命令行群聊程序

    这是学习网络编程后写的一个练手的小程序,可以帮助复习socket,I/O复用,非阻塞I/O等知识点. 通过回顾写的过程中遇到的问题的形式记录程序的关键点,最后给出完整程序代码. 0. 功能 编写一个简 ...

随机推荐

  1. 运维DBA要不要学python

    运维DBA要不要学python 我个人认为是:要 现在python在运维数据库的工作中主要用在 1.编写一些运维脚本 2.编写运维管理平台 3.研究互联网大厂的运维脚本/工具并应有 特别是运维开源数据 ...

  2. Windows10家庭版运行应用提示”管理员已阻止你运行此应用...“的解决办法

    win10版本家庭中文版: 运行应用程序报错: 解决办法(亲试): 1.进入”控制面板“--”用户账户“--”用户账户“,选择”更改用户账户控制设置“,选择最后一项,点击”确定“按钮,如下图: 2.按 ...

  3. Storm入门(十四)Trident API Overview

    The core data model in Trident is the "Stream", processed as a series of batches. A stream ...

  4. TTL 和 DNS TTL 的区别

    TTL TTL是 Time To Live 的缩写,该字段指定IP包被路由器丢弃之前允许通过的最大网段数量.TTL是IPv4包头的一个8 bit字段.在IPv4包头中TTL是一个8 bit字段,它位于 ...

  5. ASP.NET Core 共享第三方依赖库部署的正常打开方式

    曾经: 写了一篇: ASP.Net Core on Linux (CentOS7) 共享第三方依赖库部署 当第二次想做相同的事,却遇上了Bug,于是有了第二篇: ASP.NET Core 共享第三方依 ...

  6. emscripten、 WebAssembly,传递字符串给c函数

    下面看具体的实例. 下面的代码是一个C函数,实现简单的字符串拼接,然后返回拼接的字符串. #include <stdio.h> #include <string>  char* ...

  7. Java基础--JDK的安装和配置

    一.Java平台简述 1.1 Java语言简介 Java是一门面向对象的编程语言,不仅吸收了C++语言的各种优点,还摒弃了C++里难以理解的多继承.指针等概念,因此Java语言具有功能强大和简单易用两 ...

  8. 支持向量机(SVM)之数学公式详细推导

    一.概述 1.含义: 支持向量机(support vector machine,SVM)是一种二类分类器,它的基本模型是定义在特征空间上的间隔最大化的线性分类器,通过引入核函数,也可以作为非线性分类器 ...

  9. Docker 搜索镜像

    文章首发个人网站: https://www.exception.site/docker/docker-search-image 本文中,您将学习 Docker 如何搜索镜像? 一.search 命令 ...

  10. Python爬虫入门教程 45-100 Charles抓取兔儿故事-下载小猪佩奇故事-手机APP爬虫部分

    1. Charles抓取兔儿故事背景介绍 之前已经安装了Charles,接下来我将用两篇博客简单写一下关于Charles的使用,今天抓取一下兔儿故事里面关于小猪佩奇的故事. 爬虫编写起来核心的重点是分 ...