KMP算法 字符串匹配(看猫片)
前言
此篇笔记根据自己的理解和练习心得来解释算法,只代表个人观点,如有不足请指出(我刚学QWQ)
浅谈字符串匹配
设想一个场景,假设你是一个净化网络语言环境的管理员,每天需要翻阅大量的文章和帖子来查找敏感字,那么这个时候很简单的可以想到可以运用字符串匹配来做到,但是朴素的单模式字符串匹配耗用时间多,那么在这里我们就可以运用高效率的\(KMP\)算法来解决。
算法对比
- 朴素单模式字符串匹配算法
朴素的单模式串匹配大概就是枚举每一个文本串元素,然后从这一位开始不断向后比较,每次比较失败之后都要从头开始重新比对
给定一个文本串(要查找符合条件的字符串),以及一个模式串(需要匹配的字符串)
模式串:abcab
文本串:abcacababcab
一般的思想就是,当我们在第五位失配时,我们会从当前模式串的第一位所处在文本串的位置的后一位开始与模式串的第一位进行匹配,直到匹配成功位置,就会出现以下的情况
模式串: abcab
文本串:abcacababcab
这一种算法的正确性是100%的,但是复杂度显然不是那么喜人,一般来说,期望时间复杂度可以为\(O(n+m)\)的,但是一些有心的出题人甚至可以卡到\(O(nm)\),所以这个算法仅仅用于暴力打法即可。
- \(KMP\)字符匹配算法
对于失配以后的字符串,不需要去从头开始枚举浪费时间,而是根据预先处理好的值来进行枚举即可,也就是寻找最优历史处理,
根据处理的过程,时间复杂度为\(O(n+m)\)
依旧是给定一个样例来说明
模式串:abcabc
文本串:abcabdababcabc
在这个样例中我们可以看到,在第六位的时候失配了,这个时候有一个\(KMP\)算法的专门小\(trick\),我们观察字符串可以发现的是,在模式串中,失配的前一位第五位在这整个模式串中可以找到一个和他相匹配的字符,也就是第二位的\(b\),那么我们现在就可以把模式串的匹配长度跳转到\(2\)继续查找,那么为什么可以这样做呢,因为我们可以发现,在匹配的时候,第五位的\(b\)之所以可以转移到第二位,靠的就是以第五位结尾的一个子串,可以与从\(1-2\)这个范围内的子串一一对应起来,也就是完全的按位匹配。
那么转移过来就是这样的
模式串: abcabc
文本串:abcabdababcabc
通过这个方法我们可以节省一大堆无用的时间。
思路分析
首先设置\(kmp\)数组为失配数组,也就是存储当匹配失败后跳转到接下来模式串匹配的最优的位置,因为相比较于文本串,模式串更加的灵活多变,处理起来也很方便,那么处理失配数组的时候将模式串当做处理串。
那么核心就在于如何来处理失配数组的值
我们要明确的是,在上面条件的基础上,我们要考虑的是当模式串的第\(i\)为失配以后,如何来调到最优的位置继续进行匹配,因为在文本串当中\(i\)以前的位置都已经失效了,那么我们对于每一个\(kmp_i\)要记录的是:
在模式串\(str\)中,我们可以找到一个最优的位置\(j\),满足\(i\geq j\)并且满足\(str_i=str_j\),并且在\(j!=1\)的时候,有从\(str_1-str_{j-1}\)分别与\(str_{i-j+1}-str_{j-1}\)按位匹配。
简单来说就是在模式串中,存在一个长度为\(len\)的以\(1\)开头以\(j\)结尾的子串与以\(i-j+1\)开头以\(i\)结尾的子串完全相同
代码实现
#include<iostream>
#include<cstring>
#include<stack>
#include<algorithm>
#include<cmath>
#include<cstdio>
#include<queue>
#include<map>
using namespace std;
const int N=1e6+9;
int kmp[N],j;
int lena,lenb;
char a[N],b[N];
int main()
{
cin>>a+1;
cin>>b+1;
lena=strlen(a+1);
lenb=strlen(b+1);
//预处理kmp数组
for(int i=2;i<=lenb;i++)//第一个字符一定是匹配的所以不需要i=1
{
while(b[i]!=b[j+1]&&j)//如果不匹配就往回跳
j=kmp[j];
if(b[i]==b[j+1])j++;//遇见相同的就向右移动
kmp[i]=j;
}
j=0;
for(int i=1;i<=lena;i++)
{
while(j&&b[j+1]!=a[i])
j=kmp[j];//通过自己匹配自己来求得每一个点的kmp值
if(b[j+1]==a[i])
j++;
if(j==lenb)
{
printf("%d\n",i-lenb+1);//这个是开始的值
j=kmp[j];
}
}
for(int i=1;i<=lenb;i++)
printf("%d ",kmp[i]);
return 0;
}
KMP算法 字符串匹配(看猫片)的更多相关文章
- KMP算法——字符串匹配
正直找工作面试巅峰时期,有幸在学校可以听到July的讲座,在时长将近三个小时的演讲中,发现对于找工作来说,算法数据结构可以算是程序员道路的一个考量吧,毕竟中国学计算机的人太多了,只能使用这些方法来淘汰 ...
- KMP算法---字符串匹配
算法细节详见点击打开链接和点击打开链接 #include <stdio.h> #include <stdlib.h> #define N 7 #define M 15 void ...
- 字符串匹配的KMP算法-16张图片看明白
作者: 阮一峰 日期: 2013年5月 1日 字符串匹配是计算机的基本任务之一. 举例来说,有一个字符串"BBC ABCDAB ABCDABCDABDE",我想知道,里面是否包含另 ...
- KMP算法——字符匹配
暴力匹配: 假设现在我们面临这样一个问题:有一个文本串S,和一个模式串P,现在要查找P在S中的位置,怎么查找呢? 如果用暴力匹配的思路,并假设现在文本串S匹配到 i 位置,模式串P匹配到 j 位置, ...
- 算法——字符串匹配之BM算法
前言 Boyer-Moore算法是一种基于后缀匹配的模式串匹配算法(简称BM算法),后缀匹配就是模式串从右到左開始比較,但模式串的移动依旧是从左到右的.在实践中.BM算法效率高于前面介绍的<KM ...
- HDU 1711(KMP)字符串匹配
链接 HDU 1711 Number Sequence KMP 算法 我以自己理解写的,写的不对,不明白的地方海王子出来,一起共同学习: 字符串匹配 就是KMP,一般思想,用一个for循环找开头 ...
- KMP算法-字符匹配
字符匹配模式-KMP算法 j直接跳到了2的位置,因为在之前的都相同. 那么就需要求如果不等了之后,j需要回跳的位置next[j] 如果tk'与tj相等,则next [j+1]=k'+1 如果tk'与t ...
- KMP快速字符串匹配
KMP算法是一种改进的字符串匹配算法,由D.E.Knuth,J.H.Morris和V.R.Pratt同时发现.KMP算法的关键是利用匹配失败后的信息,从错误中吸取经验,尽量减少模式串与主串的匹配次数以 ...
- 算法——字符串匹配Rabin-Karp算法
前言 Rabin-Karp字符串匹配算法和前面介绍的<朴素字符串匹配算法>类似,也是相应每一个字符进行比較.不同的是Rabin-Karp採用了把字符进行预处理,也就是对每一个字符进行相应进 ...
随机推荐
- [LeetCode]Subtree of Another Tree判断一棵树是不是另一棵树的子树
将树序列化为字符串,空节点用符号表示,这样可以唯一的表示一棵树. 用list记录所有子树的序列化,和目标树比较. List<String> list = new ArrayList< ...
- [Deep Learning] 神经网络编程基础 (Basics of Neural Network Programming) - 逻辑回归-梯度下降-计算图
在神经网络中,假如有m个训练集,我们想把他们加入训练,第一个想到得就是用一个for循环来遍历训练集,从而开始训练.但是在神经网络中,我们换一个计算方法,这就是 前向传播和反向传播. 对于逻辑回归,就是 ...
- JavaSwing 船只停靠管理可视化(二)
JavaSwing 船只停靠管理可视化(一) JavaSwing 船只停靠管理可视化(二) JavaSwing 船只停靠管理可视化(三) JavaSwing 船只停靠管理可视化(四) JavaSwin ...
- logback日志对象要素
<logger>节点 分两种 1.是普通日志对象 logger分为2种,一种是普通日志对象,另一种是根日志对象.对于大部分应用来说,只设置根日志对象即可. 在java日志系统中,无论是lo ...
- noip2016自测报告
随便测了一下2016的提高组,发现自己还是太菜了... day1 T1:玩具谜题 一个模拟题,打挂了,只有95分,错的很傻逼 code: #include<bits/stdc++.h> u ...
- Spring框架的IOC(控制反转)
1.1.IoC是什么 Ioc-Inversion of Control,即"控制反转",不是什么技术,而是一种设计思想.在Java开发中,Ioc意味着将你设计好的对象交给容器控制, ...
- Alpha冲刺--总结随笔
一.项目预期计划 时间 (天) 前端预期计划 完成情况 后端预期计划 完成情况 1-2 前端开始基本页面的设计 完成 整合项目依赖,搭建基本框架,建立数据库 完成 3-5 前端基础页面的实现与完善 完 ...
- 【C++】《Effective C++》第六章
第六章 继承与面向对象设计 条款32:确定你的public继承塑模出is-a关系 public隐含的寓意:每个派生类对象同时也是一个基类对象,反之不成立.只不过基类比派生类表现出更一般化的概念,派生类 ...
- innodb是怎么刷新日志缓冲的
当innodb把日志缓冲刷新到磁盘日志文件的时候,先会用一个mutex锁住缓冲区,刷新到所需要的位置,然后移动剩下的条目到缓冲区的前面,当mutex释放时,可能有超过一个事务已经准备好刷新其日志记录, ...
- 把vscode打造成技术写作神器
作为技术开发,大家平时肯定需要记录技术笔记.甚至有的同学还开通可自己的技术博客或者技术公众号进行创作. 这个时候有套趁手的写作工具尤为重要,节省下时间好好休息一下,对于咱们程序员来说更加重要.因为最近 ...