字符串(2)KMP算法
给你两个字符串a(len[a]=n),b(len[b]=m),问b是否是a的子串,并且统计b在a中的出现次数,如果我们枚举a从什么位置与匹配,并且验证是否匹配,那么时间复杂度O(nm),
而n和m的范围为10^5,这样做显然超时,因此我们就要用到神奇的KMP算法,在O(n)的时间内解决这一类的问题。
首先给出两个字符串
A:abababaababacb
B:ababacb
首先我们思考朴素算法,我们枚举A串的每一位作为开始与B串匹配的位置,然后一位一位进行检验,如果匹配失败则会从B串的开始重新匹配,这也是朴素算法为什么会超时的原因所在,那么我们可不可以不从B串的开始与A串的下一位匹配,而是直接找到一个可以与A串枚举到的那一位匹配的B串的一个位置,这样我们只需要扫描一遍字符串A,然后在更新可以匹配到B串的哪一个位置。
举个例子:
对于字符串A,B,他们的前五位是一样的,可以匹配。

但是第6位就无法匹配了,所以我们需要调整B串的位置重新匹配,通过观察我们发现B串的前3位和A串的3到5位可以匹配,所以我们可以直接将j的值改为3,然后继续和A串匹配。

这样一来我们就又可以继续向后匹配了。

但是i=8时又无法匹配了,我们需要继续调整B串的位置以便于进行匹配。

然而这样仍然不能匹配,那就继续移动,直至可以匹配为止。

最终我们成功将A串与B串匹配成功。

我们根据B串的移动规律可以构造出这样的一个p数组,使得p[j]表示B[1…j]=B[j-k+1…j]的k的最大值(即B串前j个字符最长相同的前缀和后缀的长度),这样我们就可以直接将B串进行上述的移动操作了。
void kmp()
{
int j=;
for(int i=;i<n;i++)
{
while(j>&&b[j+]!=a[i+]) j=p[j];//如果下一位不能匹配就移动B串
if(b[j+]==a[i+]) j++;//如果可以匹配就继续匹配下一位
if(j==m)//这里表示完全匹配,也就是A串和B串成功匹配了
{
printf("%d\n",i-m+);
j=p[j];//这样的目的是为了不遗漏重叠的匹配
}
}
}
kmp匹配
接下来我们思考如何求这个p数组,假如我们知道了p[1…j-1]的值,那我们如何求p[j]的值呢?如果B[i+1]==B[j+1],那么显然p[j]=p[j-1]+1,因为这相当于前缀后缀都加了一个相同的字符,总长都加上1,那么若果B[i+1]!=B[j+1]我们可以考虑将j向后退一步,也就是减小j的值,再进行匹配。
void pre()
{
p[]=;
int j=;
for(int i=;i<m;i++)
{
while(j>&&b[i+]!=b[j+]) j=p[j];
if(b[i+]==b[j+]) j++;
p[i+]=j;
}
}
求p数组
这样我们就成功完成了kmp算法
字符串(2)KMP算法的更多相关文章
- [Algorithm] 字符串匹配算法——KMP算法
1 字符串匹配 字符串匹配是计算机的基本任务之一. 字符串匹配是什么?举例来说,有一个字符串"BBC ABCDAB ABCDABCDABDE",我想知道,里面是否包含另一个字符串& ...
- 字符串匹配算法——KMP算法
处理字符串的过程中,难免会遇到字符匹配的问题.常用的字符匹配方法 1. 朴素模式匹配算法(Brute-Force算法) 求子串位置的定位函数Index( S, T, pos). 模式匹配:子串的定位操 ...
- 查找字符串的 KMP 算法
查找字符串是我们平常编程过程中经常遇到的,现在介绍一种查找字符串算法,增加程序的执行速度. 通常我们是这么写的: /* content: search a string in a othor stri ...
- 字符串匹配算法——KMP算法学习
KMP算法是用来解决字符串的匹配问题的,即在字符串S中寻找字符串P.形式定义:假设存在长度为n的字符数组S[0...n-1],长度为m的字符数组P[0...m-1],是否存在i,使得SiSi+1... ...
- 字符串模式匹配KMP算法
一篇不错的博客:http://www.cnblogs.com/dolphin0520/archive/2011/08/24/2151846.html KMP字符串模式匹配通俗点说就是一种在一个字符串中 ...
- 字符串查找KMP算法(转)
如果你用过ctrl+F这个快捷键,那么你有很大的概率使用过这个算法,这就是在待查找字符串(可能有成千上万个字符)中找出模式串(比较小,可能有几个字符),可能找到大于或者等于1次的位置.例如,在abab ...
- 字符串查找KMP算法
如果你用过ctrl+F这个快捷键,那么你有很大的概率使用过这个算法,这就是在待查找字符串(可能有成千上万个字符)中找出模式串(比较小,可能有几个字符),可能找到大于或者等于1次的位置.例如,在abab ...
- c算法:字符串查找-KMP算法
/* *用KMP算法实现字符串匹配搜索方法 *该程序实现的功能是搜索本目录下的所有文件的内容是否与给定的 *字符串匹配,如果匹配,则输出文件名:包含该字符串的行 *待搜索的目标串搜索指针移动位数 = ...
- 字符串匹配算法-kmp算法
一原理: 部分转自:http://www.ruanyifeng.com/blog/2013/05/Knuth%E2%80%93Morris%E2%80%93Pratt_algorithm.html 字 ...
- 字符串匹配算法KMP算法
数据结构中讲到关于字符串匹配算法时,提到朴素匹配算法,和KMP匹配算法. 朴素匹配算法就是简单的一个一个匹配字符,如果遇到不匹配字符那么就在源字符串中迭代下一个位置一个一个的匹配,这样计算起来会有很多 ...
随机推荐
- Activiti6-数据库配置-dbconfig(学习笔记)
常用数据连接池种类: 不一样的地方在于filters过滤器,设置了统计.和记录 avtiviti支持的数据库有: <?xml version="1.0" encoding=& ...
- 在CENTOS上源码搭建LNMP环境
前言 1.操作前提: CentOS Linux release 7.5.1804: sudo用户(需要root权限): 2.需要安装的组件: nginx稳定版:nginx-1.14.0: MariaD ...
- CSS3文字、背景与列表
一.文本相关属性 1.字体 (1)字体设置 在HTML中,字体通过<font face="字体名称">来设置.在CSS中字体通过font-family属性来控制,里面可 ...
- Qin Shi Huang's National Road System HDU - 4081(树形dp+最小生成树)
Qin Shi Huang's National Road System HDU - 4081 感觉这道题和hdu4756很像... 求最小生成树里面删去一边E1 再加一边E2 求该边两顶点权值和除以 ...
- Python 常用模块大全(整理)
https://www.cnblogs.com/jpfss/p/9686050.html
- jcp 打印机字体变淡变模糊bootstrap
问题: 如果应用了bootstrap.css, 当使用网页打印时,文字的颜色都会丢失,div中的背景色也会丢失.字体失真 解决: 找到bootstrap 的css文件,在星号后面加括号那些东西即可 @ ...
- day08读取文件
可参考;https://www.cnblogs.com/gengcx/p/6713646.html主要内容: 1.只读 2.只写 3.追加 4.r+读写 5.w+写读 6.a+写读 7.其他一.使用p ...
- 使用Vlc.DotNet打开摄像头并截图 C#
参考上一篇 使用vlc打开usb摄像头 理论上输入下面地址 "dshow:// :dshow-size=1600*1200:dshow-vdev=USB CAM2"C#就能打 ...
- Python变量命名规范
模块名: 小写字母,单词之间用_分割 ad_stats.py 包名: 和模块名一样 类名: 单词首字母大写 AdStats ConfigUtil 全局变量名(类变量,在java中相当于static变量 ...
- CVE-2017-7494 Linux Samba named pipe file Open Vul Lead to DLL Execution
catalogue . 漏洞复现 . 漏洞代码原理分析 . 漏洞利用前提 . 临时缓解 && 修复手段 1. 漏洞复现 . SMB登录上去 . 枚举共享目录,得到共享目录/文件列表,匿 ...