KMP算法 字符串匹配(看猫片)
前言
此篇笔记根据自己的理解和练习心得来解释算法,只代表个人观点,如有不足请指出(我刚学QWQ)
浅谈字符串匹配
设想一个场景,假设你是一个净化网络语言环境的管理员,每天需要翻阅大量的文章和帖子来查找敏感字,那么这个时候很简单的可以想到可以运用字符串匹配来做到,但是朴素的单模式字符串匹配耗用时间多,那么在这里我们就可以运用高效率的\(KMP\)算法来解决。
算法对比
- 朴素单模式字符串匹配算法
朴素的单模式串匹配大概就是枚举每一个文本串元素,然后从这一位开始不断向后比较,每次比较失败之后都要从头开始重新比对
给定一个文本串(要查找符合条件的字符串),以及一个模式串(需要匹配的字符串)
模式串:abcab
文本串:abcacababcab
一般的思想就是,当我们在第五位失配时,我们会从当前模式串的第一位所处在文本串的位置的后一位开始与模式串的第一位进行匹配,直到匹配成功位置,就会出现以下的情况
模式串: abcab
文本串:abcacababcab
这一种算法的正确性是100%的,但是复杂度显然不是那么喜人,一般来说,期望时间复杂度可以为\(O(n+m)\)的,但是一些有心的出题人甚至可以卡到\(O(nm)\),所以这个算法仅仅用于暴力打法即可。
- \(KMP\)字符匹配算法
对于失配以后的字符串,不需要去从头开始枚举浪费时间,而是根据预先处理好的值来进行枚举即可,也就是寻找最优历史处理,
根据处理的过程,时间复杂度为\(O(n+m)\)
依旧是给定一个样例来说明
模式串:abcabc
文本串:abcabdababcabc
在这个样例中我们可以看到,在第六位的时候失配了,这个时候有一个\(KMP\)算法的专门小\(trick\),我们观察字符串可以发现的是,在模式串中,失配的前一位第五位在这整个模式串中可以找到一个和他相匹配的字符,也就是第二位的\(b\),那么我们现在就可以把模式串的匹配长度跳转到\(2\)继续查找,那么为什么可以这样做呢,因为我们可以发现,在匹配的时候,第五位的\(b\)之所以可以转移到第二位,靠的就是以第五位结尾的一个子串,可以与从\(1-2\)这个范围内的子串一一对应起来,也就是完全的按位匹配。
那么转移过来就是这样的
模式串: abcabc
文本串:abcabdababcabc
通过这个方法我们可以节省一大堆无用的时间。
思路分析
首先设置\(kmp\)数组为失配数组,也就是存储当匹配失败后跳转到接下来模式串匹配的最优的位置,因为相比较于文本串,模式串更加的灵活多变,处理起来也很方便,那么处理失配数组的时候将模式串当做处理串。
那么核心就在于如何来处理失配数组的值
我们要明确的是,在上面条件的基础上,我们要考虑的是当模式串的第\(i\)为失配以后,如何来调到最优的位置继续进行匹配,因为在文本串当中\(i\)以前的位置都已经失效了,那么我们对于每一个\(kmp_i\)要记录的是:
在模式串\(str\)中,我们可以找到一个最优的位置\(j\),满足\(i\geq j\)并且满足\(str_i=str_j\),并且在\(j!=1\)的时候,有从\(str_1-str_{j-1}\)分别与\(str_{i-j+1}-str_{j-1}\)按位匹配。
简单来说就是在模式串中,存在一个长度为\(len\)的以\(1\)开头以\(j\)结尾的子串与以\(i-j+1\)开头以\(i\)结尾的子串完全相同
代码实现
#include<iostream>
#include<cstring>
#include<stack>
#include<algorithm>
#include<cmath>
#include<cstdio>
#include<queue>
#include<map>
using namespace std;
const int N=1e6+9;
int kmp[N],j;
int lena,lenb;
char a[N],b[N];
int main()
{
cin>>a+1;
cin>>b+1;
lena=strlen(a+1);
lenb=strlen(b+1);
//预处理kmp数组
for(int i=2;i<=lenb;i++)//第一个字符一定是匹配的所以不需要i=1
{
while(b[i]!=b[j+1]&&j)//如果不匹配就往回跳
j=kmp[j];
if(b[i]==b[j+1])j++;//遇见相同的就向右移动
kmp[i]=j;
}
j=0;
for(int i=1;i<=lena;i++)
{
while(j&&b[j+1]!=a[i])
j=kmp[j];//通过自己匹配自己来求得每一个点的kmp值
if(b[j+1]==a[i])
j++;
if(j==lenb)
{
printf("%d\n",i-lenb+1);//这个是开始的值
j=kmp[j];
}
}
for(int i=1;i<=lenb;i++)
printf("%d ",kmp[i]);
return 0;
}
KMP算法 字符串匹配(看猫片)的更多相关文章
- KMP算法——字符串匹配
正直找工作面试巅峰时期,有幸在学校可以听到July的讲座,在时长将近三个小时的演讲中,发现对于找工作来说,算法数据结构可以算是程序员道路的一个考量吧,毕竟中国学计算机的人太多了,只能使用这些方法来淘汰 ...
- KMP算法---字符串匹配
算法细节详见点击打开链接和点击打开链接 #include <stdio.h> #include <stdlib.h> #define N 7 #define M 15 void ...
- 字符串匹配的KMP算法-16张图片看明白
作者: 阮一峰 日期: 2013年5月 1日 字符串匹配是计算机的基本任务之一. 举例来说,有一个字符串"BBC ABCDAB ABCDABCDABDE",我想知道,里面是否包含另 ...
- KMP算法——字符匹配
暴力匹配: 假设现在我们面临这样一个问题:有一个文本串S,和一个模式串P,现在要查找P在S中的位置,怎么查找呢? 如果用暴力匹配的思路,并假设现在文本串S匹配到 i 位置,模式串P匹配到 j 位置, ...
- 算法——字符串匹配之BM算法
前言 Boyer-Moore算法是一种基于后缀匹配的模式串匹配算法(简称BM算法),后缀匹配就是模式串从右到左開始比較,但模式串的移动依旧是从左到右的.在实践中.BM算法效率高于前面介绍的<KM ...
- HDU 1711(KMP)字符串匹配
链接 HDU 1711 Number Sequence KMP 算法 我以自己理解写的,写的不对,不明白的地方海王子出来,一起共同学习: 字符串匹配 就是KMP,一般思想,用一个for循环找开头 ...
- KMP算法-字符匹配
字符匹配模式-KMP算法 j直接跳到了2的位置,因为在之前的都相同. 那么就需要求如果不等了之后,j需要回跳的位置next[j] 如果tk'与tj相等,则next [j+1]=k'+1 如果tk'与t ...
- KMP快速字符串匹配
KMP算法是一种改进的字符串匹配算法,由D.E.Knuth,J.H.Morris和V.R.Pratt同时发现.KMP算法的关键是利用匹配失败后的信息,从错误中吸取经验,尽量减少模式串与主串的匹配次数以 ...
- 算法——字符串匹配Rabin-Karp算法
前言 Rabin-Karp字符串匹配算法和前面介绍的<朴素字符串匹配算法>类似,也是相应每一个字符进行比較.不同的是Rabin-Karp採用了把字符进行预处理,也就是对每一个字符进行相应进 ...
随机推荐
- java数组之binarySearch查找
/** * 1.如果找到目标对象则返回<code>[公式:-插入点-1]</code> * 插入点:第一个大与查找对象的元素在数组中的位置,如果数组中的所有元素都小于要查找的对 ...
- 如何解决 ajax跨域被阻止 CORS 头缺少 'Access-Control-Allow-Origin'的问题?
已拦截跨源请求:同源策略禁止读取位于 http://192.168.1.72:8080/securityMonitor_TV/service/getTest 的远程资源. (原因:CORS 头缺少 ' ...
- mapboxgl实现带箭头轨迹线
最近在使用mapboxgl实现轨迹展示时,想实现类似高德地图导航轨迹效果,然而并未在网上找到类似示例.经一番研究与尝试,最终解决,效果如下. 添加箭头核心代码如下,只需在配置layout中添加symb ...
- 基于ROBO-MAS多智能体自主协同 高频投影定位系统
- mysql使用全文索引实现大字段的模糊查询
0.场景说明 centos7 mysql5.7 InnoDB引擎 0.1创建表 DROP TABLE IF EXISTS tbl_article_content; CREATE TABLE tbl_a ...
- 双重校验锁 --使用volatile和两次判空校验
介绍 双重校验锁是单例模式中,饿汉式的一种实现方式.因为有两次判空校验,所以叫双重校验锁,一次是在同步代码块外,一次是在同步代码块内. 为什么在同步代码块内还要再检验一次? 第一个if减少性能开销,第 ...
- 使用vs code搭建Q#开发环境 (Mac)
Q# 是微软几年前发布的一门用于模拟量子编程的语言. 3年前我在当时风靡的博客网站 ITEYE 上发布过如何在windows上搭建其开发环境:Q#开发环境搭建.时过境迁,不但iteye不知何处去,连Q ...
- 断言封装整合到requests封装中应用(纠错False,Result循环,tag测试)
检查json_key_value: 检查: requests.py # -*- coding: utf-8 -*-#@File :demo_04.py#@Auth : wwd#@Time : 2020 ...
- python函数3-函数嵌套/递归/匿名函数
2 .函数递归: 3.匿名函数
- 2021升级版微服务教程7-OpenFeign实战开发和参数调优
2021升级版SpringCloud教程从入门到实战精通「H版&alibaba&链路追踪&日志&事务&锁」 教程全目录「含视频」:https://gitee.c ...