前言

此篇笔记根据自己的理解和练习心得来解释算法,只代表个人观点,如有不足请指出(我刚学QWQ)

浅谈字符串匹配

设想一个场景,假设你是一个净化网络语言环境的管理员,每天需要翻阅大量的文章和帖子来查找敏感字,那么这个时候很简单的可以想到可以运用字符串匹配来做到,但是朴素的单模式字符串匹配耗用时间多,那么在这里我们就可以运用高效率的\(KMP\)算法来解决。

算法对比

  • 朴素单模式字符串匹配算法

朴素的单模式串匹配大概就是枚举每一个文本串元素,然后从这一位开始不断向后比较,每次比较失败之后都要从头开始重新比对

给定一个文本串(要查找符合条件的字符串),以及一个模式串(需要匹配的字符串)

模式串:abcab
文本串:abcacababcab

一般的思想就是,当我们在第五位失配时,我们会从当前模式串的第一位所处在文本串的位置的后一位开始与模式串的第一位进行匹配,直到匹配成功位置,就会出现以下的情况

模式串:   abcab
文本串:abcacababcab

这一种算法的正确性是100%的,但是复杂度显然不是那么喜人,一般来说,期望时间复杂度可以为\(O(n+m)\)的,但是一些有心的出题人甚至可以卡到\(O(nm)\),所以这个算法仅仅用于暴力打法即可。

  • \(KMP\)字符匹配算法

对于失配以后的字符串,不需要去从头开始枚举浪费时间,而是根据预先处理好的值来进行枚举即可,也就是寻找最优历史处理,

根据处理的过程,时间复杂度为\(O(n+m)\)

依旧是给定一个样例来说明

模式串:abcabc
文本串:abcabdababcabc

在这个样例中我们可以看到,在第六位的时候失配了,这个时候有一个\(KMP\)算法的专门小\(trick\),我们观察字符串可以发现的是,在模式串中,失配的前一位第五位在这整个模式串中可以找到一个和他相匹配的字符,也就是第二位的\(b\),那么我们现在就可以把模式串的匹配长度跳转到\(2\)继续查找,那么为什么可以这样做呢,因为我们可以发现,在匹配的时候,第五位的\(b\)之所以可以转移到第二位,靠的就是以第五位结尾的一个子串,可以与从\(1-2\)这个范围内的子串一一对应起来,也就是完全的按位匹配。

那么转移过来就是这样的

模式串:   abcabc
文本串:abcabdababcabc

通过这个方法我们可以节省一大堆无用的时间。

思路分析

首先设置\(kmp\)数组为失配数组,也就是存储当匹配失败后跳转到接下来模式串匹配的最优的位置,因为相比较于文本串,模式串更加的灵活多变,处理起来也很方便,那么处理失配数组的时候将模式串当做处理串。

那么核心就在于如何来处理失配数组的值

我们要明确的是,在上面条件的基础上,我们要考虑的是当模式串的第\(i\)为失配以后,如何来调到最优的位置继续进行匹配,因为在文本串当中\(i\)以前的位置都已经失效了,那么我们对于每一个\(kmp_i\)要记录的是:

在模式串\(str\)中,我们可以找到一个最优的位置\(j\),满足\(i\geq j\)并且满足\(str_i=str_j\),并且在\(j!=1\)的时候,有从\(str_1-str_{j-1}\)分别与\(str_{i-j+1}-str_{j-1}\)按位匹配。

简单来说就是在模式串中,存在一个长度为\(len\)的以\(1\)开头以\(j\)结尾的子串与以\(i-j+1\)开头以\(i\)结尾的子串完全相同

代码实现

#include<iostream>
#include<cstring>
#include<stack>
#include<algorithm>
#include<cmath>
#include<cstdio>
#include<queue>
#include<map>
using namespace std;
const int N=1e6+9;
int kmp[N],j;
int lena,lenb;
char a[N],b[N];
int main()
{
cin>>a+1;
cin>>b+1;
lena=strlen(a+1);
lenb=strlen(b+1);
//预处理kmp数组
for(int i=2;i<=lenb;i++)//第一个字符一定是匹配的所以不需要i=1
{
while(b[i]!=b[j+1]&&j)//如果不匹配就往回跳
j=kmp[j];
if(b[i]==b[j+1])j++;//遇见相同的就向右移动
kmp[i]=j;
}
j=0;
for(int i=1;i<=lena;i++)
{
while(j&&b[j+1]!=a[i])
j=kmp[j];//通过自己匹配自己来求得每一个点的kmp值
if(b[j+1]==a[i])
j++;
if(j==lenb)
{
printf("%d\n",i-lenb+1);//这个是开始的值
j=kmp[j];
}
}
for(int i=1;i<=lenb;i++)
printf("%d ",kmp[i]);
return 0;
}

KMP算法 字符串匹配(看猫片)的更多相关文章

  1. KMP算法——字符串匹配

    正直找工作面试巅峰时期,有幸在学校可以听到July的讲座,在时长将近三个小时的演讲中,发现对于找工作来说,算法数据结构可以算是程序员道路的一个考量吧,毕竟中国学计算机的人太多了,只能使用这些方法来淘汰 ...

  2. KMP算法---字符串匹配

    算法细节详见点击打开链接和点击打开链接 #include <stdio.h> #include <stdlib.h> #define N 7 #define M 15 void ...

  3. 字符串匹配的KMP算法-16张图片看明白

    作者: 阮一峰 日期: 2013年5月 1日 字符串匹配是计算机的基本任务之一. 举例来说,有一个字符串"BBC ABCDAB ABCDABCDABDE",我想知道,里面是否包含另 ...

  4. KMP算法——字符匹配

     暴力匹配: 假设现在我们面临这样一个问题:有一个文本串S,和一个模式串P,现在要查找P在S中的位置,怎么查找呢? 如果用暴力匹配的思路,并假设现在文本串S匹配到 i 位置,模式串P匹配到 j 位置, ...

  5. 算法——字符串匹配之BM算法

    前言 Boyer-Moore算法是一种基于后缀匹配的模式串匹配算法(简称BM算法),后缀匹配就是模式串从右到左開始比較,但模式串的移动依旧是从左到右的.在实践中.BM算法效率高于前面介绍的<KM ...

  6. HDU 1711(KMP)字符串匹配

    链接  HDU 1711 Number Sequence KMP 算法 我以自己理解写的,写的不对,不明白的地方海王子出来,一起共同学习: 字符串匹配 就是KMP,一般思想,用一个for循环找开头   ...

  7. KMP算法-字符匹配

    字符匹配模式-KMP算法 j直接跳到了2的位置,因为在之前的都相同. 那么就需要求如果不等了之后,j需要回跳的位置next[j] 如果tk'与tj相等,则next [j+1]=k'+1 如果tk'与t ...

  8. KMP快速字符串匹配

    KMP算法是一种改进的字符串匹配算法,由D.E.Knuth,J.H.Morris和V.R.Pratt同时发现.KMP算法的关键是利用匹配失败后的信息,从错误中吸取经验,尽量减少模式串与主串的匹配次数以 ...

  9. 算法——字符串匹配Rabin-Karp算法

    前言 Rabin-Karp字符串匹配算法和前面介绍的<朴素字符串匹配算法>类似,也是相应每一个字符进行比較.不同的是Rabin-Karp採用了把字符进行预处理,也就是对每一个字符进行相应进 ...

随机推荐

  1. E-BOOK-TINY6410-LCD的使用

    电子书需要通过屏幕显示出来,首先写了LCD模块.代码上传到了 github https://github.com/qq2216691777/E-book 本次完善了lcd模块的程序.可以适用在其他地方 ...

  2. python谷歌序列化传输

    今日破解某app加密app当中用到了谷歌序列化传输 1.请求序列化文件 # Generated by the protocol buffer compiler. DO NOT EDIT! # sour ...

  3. 解决首页中Better-scroll可滚动区域的问题

    在首页时候,使用BetterScroll插件的时候,滚动的时候经常会卡顿.Better-scroll在决定有多少区域可以滚动时,是根据ScrollerHeight属性决定的.ScrollerHeigh ...

  4. vscode 安装与配置

    vscode 安装与配置 安装 安装 vscode 从官网 [https://code.visualstudio.com/Download] 下载速度奇慢,可以找到下载的网址,如下图所示,将其中红色框 ...

  5. golang语法笔记

    开始微服务,那就先温习下golang语法吧; golang变量类型 1. 整形 Go %b    表示为二进制 %c    该值对应的unicode码值 %d    表示为十进制 %o    表示为八 ...

  6. maven 导出所有依赖jar到指定路径

    mvn dependency:copy-dependencies -DoutputDirectory=lib

  7. idea中maven的安装与配置

    说明:类似maven安装和配置的帖子在网上有很多,本人也有做过参照,但是有些帖子的步骤跳跃性比较大,故此,本人整理了一下,给大家做个参考. 一.下载安装 一般都是在官网进行下载 https://mav ...

  8. JDK动态代理案例与原理分析

    一.JDK动态代理实现案例 Person接口 package com.zhoucong.proxy.jdk; public interface Person { // 寻找真爱 void findlo ...

  9. Mysql性能监控可视化

    前言 ​ 操作系统以及Mysql数据库的实时性能状态数据尤为重要,特别是在有性能抖动的时候,这些实时的性能数据可以快速帮助你定位系统或Mysql数据库的性能瓶颈,镜像你在Linux系统上使用top.i ...

  10. Tomca7t服务器 配置HTTP和HTTPS 同时访问

    (首先你要有 ssl 证书 ,我是阿里的 ) 查看申请ssl证书(https://www.cnblogs.com/lxf-mw/p/14261303.html) 一.下载 tomcat证书(两个文件) ...