串string (KMP)
1、Definition
串string,是零个或多个字符组成的有限序列。一般记作S="a1a2a3...an",其中S是串名,双引号括起来的字符序列是串值;ai(1<= i <=n)可以是字母、数字或其他字符;串中所包含的字符个数称为该串的长度。长度为零的串称为空串(Empty String),不包含任何字符。
2、
子串、主串:串中任意连续的字符组成的子序列被称为该串的子串。包含子串的串有被称为该子串的主串。
子串的位置:子串在主串中第一次出现的第一个字符的位置。
两个串相等:两个串长度相等,并且各个对应的字符也都相等。
3、串的模式匹配算法
串的匹配实际上是对与合法的位置1<= i <=n-m+1,依次将目标串中的子串S[i..i+m-2]和模式串T[1..m-1]进行比较,若S[i..i+m-2]=T[1..m-1],则称从位置i开始的匹配成功,亦称模式T在目标S中出现:若S[i..i+m-2]!=T[1..m-1],则称从位置i开始的匹配失败。
其算法段为:
for(i=1; i<=n-m+1; i++)
if(S[i..i+m-2]=T[1..m-1])
return i;
int index1(string s, string t)
{
int n=s.length();
int m=t.length(); for(int i=0;i<n-m; i++)
{
int j=0;
int k=i;
while(j<m && s[k]==t[j])
{
k++;
j++;
}
if(j>=m)return i;
} return -1;
}
int index2(string s, string t)
{
int n=s.length();
int m=t.length();
int i,j;
while((i<n) && (j<m))
{
if(s[i]==t[j])
{
i++;
j++;
}
else
{
i=i-j+1;
j=0;
}
}
if(j>=m)return i-j;
else return -1;
}
4、KMP算法
在3中我们看到的是模式匹配的暴力求解法,这种算法虽然能够得到结果,但问题是,这个算法的时间复杂度为O(M*N),效率不高,为了解决这个问题,KMP三人对此做出了改进,提出了KMP算法。
详细描述:
在一般的暴力求解法中,当文本串第i个字符与模式串第j个字符不匹配时,文本串往往会回溯到i-j+1处,而模式串会回溯到0处,在KMP算法中却不用进行这样的回溯,
当发生失配时,我们通过拉动模式串进行不回溯的检查,当文本串第i个字符与模式串第j个字符不匹配时,模式串会跳转到next[j]值所在的位置再继续比较(next[j]是啥?莫急,稍后解释),如果next[j]只是-1,那么只能从模式串开始来比较了。
KMPcode
int KMP(string s, string t, int next[])
{
int i=0;
int j=0;
int n=s.length();
int m=t.length(); while((i<n)&&(j<m))
{
if(j=-1||s[i]==t[j])
{
i++;
j++;
}
else
j=next[j];
} if(j==m)return i-j;
else return -1;
}
现在让我们来看看next是啥子玩意
next是一个数组,是一个模式函数值,对于每一个模式串的每一个字符可能会存在最大k个前缀与k个后缀相等,则字符的next值为k个前缀的下一个字符的index,对于第一个字符来说它的next值就为-1,以下贴出求数组代码
void CalcNext(string s, int next[])
{
int n=s.length();
next[0]=-1;
int k=-1;
int j=0;
while(j<n)
{
if(k==-1||s[j]==s[k])
{
++k;
++j;
next[j]=k;
}
else
k=next[k];
}
}
以下为优化代码,有的地方可以称次next数组为nextvalue数组
void CalcNext(string p, int next[])
{
int n=p.length();
next[0]=-1;
int k=-1;
int j=0;
while(j<n)
{
if(k==-1||p[j]==p[k])
{
++k;
++j;
if(p[j]==p[k])
next[j]=next[k];
else
next[j]=k;
}
else
{
k=next[k];
}
}
}
串string (KMP)的更多相关文章
- hdu 3336:Count the string(数据结构,串,KMP算法)
Count the string Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others) ...
- HDOJ 2203 亲和串 【KMP】
HDOJ 2203 亲和串 [KMP] Time Limit: 3000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others) ...
- [从今天开始修炼数据结构]串、KMP模式匹配算法
[从今天开始修炼数据结构]基本概念 [从今天开始修炼数据结构]线性表及其实现以及实现有Itertor的ArrayList和LinkedList [从今天开始修炼数据结构]栈.斐波那契数列.逆波兰四则运 ...
- hdu 3336 Count the string KMP+DP优化
Count the string Problem Description It is well known that AekdyCoin is good at string problems as w ...
- HDU 2203 亲串(kmp)
Problem Description 随着人们年龄的增长更大,更聪明还是越大越愚蠢,这是一个值,相同的问题Eddy也一直在思考,由于他在非常小的时候就知道亲和串怎样推断了,可是发现,如今长大了却不知 ...
- 第4章学习小结_串(BF&KMP算法)、数组(三元组)
这一章学习之后,我想对串这个部分写一下我的总结体会. 串也有顺序和链式两种存储结构,但大多采用顺序存储结构比较方便.字符串定义可以用字符数组比如:char c[10];也可以用C++中定义一个字符串s ...
- 数据结构-模式匹配串算法(KMP)
#include<cstdio> #include<iostream> #include<string> #include<cstring> #incl ...
- Codeforces Round #282 (Div. 1)B. Obsessive String KMP+DP
B. Obsessive String Hamed has recently found a string t and suddenly became quite fond of it. He s ...
- 串、KMP模式匹配算法
串是由0个或者多个字符组成的有限序列,又名叫字符串. 串的比较: 串的比较是通过组成串的字符之间的编码来进行的,而字符的编码指的是字符在对应字符集中的序号. 计算机中常用的ASCII编码,由8位二进制 ...
随机推荐
- 【原生js】原生js的省市区三级联动
html: <!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" c ...
- 面试题-Java基础-Applet部分
java applet是能够被包含在HTML页面中并且能被启用了java的客户端浏览器执行的程序.Applet主要用来创建动态交互的web应用程序.
- noip 2016 提高组题解
前几天写的那个纯属搞笑.(额,好吧,其实这个也不怎么正经) 就先说说day2吧: T1:这个东西应该叫做数论吧. 然而我一看到就照着样例在纸上推了大半天(然而还是没有看出来这东西是个杨辉三角) 然后就 ...
- Defraggler(磁盘整理软件) V2.21.993 绿色版
软件名称: Defraggler(磁盘整理软件) 软件语言: 简体中文 授权方式: 免费软件 运行环境: Win 32位/64位 软件大小: 5.0MB 图片预览: 软件简介: Defraggler ...
- PHP 在 Nginx 下主动断开连接 Connection Close 与 ignore_user_abort 后台运行
这两天弄个PHP调用 SVN 同步 update 多台服务器更新的程序,为了避免 commit 的时候不会被阻塞卡半天得想个办法只请求触发,而不需要等待程序 update 完成返回结果这样耗时太长,所 ...
- CodeForces 669C Little Artem and Matrix GNU
模拟. 把操作记录一下,倒着复原回去. #pragma comment(linker, "/STACK:1024000000,1024000000") #include<cs ...
- Another Array of Orz Pandas
Another Array of Orz Pandas 题目链接:http://acm.xidian.edu.cn/problem.php?id=1187 线段树 线段树维护区间和以及区间内各个数平方 ...
- 《C++反汇编与逆向分析技术揭秘》——函数的工作原理
各种调用方式的考察 示例: cdecl方式是调用者清空堆栈: 如果执行的是fastcall: 借助两个寄存器传递参数: 参数1和2借助局部变量来存储: 返回值 如果返回值是结构体: 返回值存放在eax ...
- layer ifram 弹出框
父层 <div class="col-xs-4 text-left" style="padding-left: 50px;"><button ...
- python绝技 — 用Scapy测试无线网卡的嗅探功能
代码 #!/usr/bin/python #--*--coding=utf-8--*-- from scapy.all import * def pktPrint(pkt): if pkt.hasla ...