一、问题

给定两个字符串S(原串)和(模式串)T,找出T在S中出现的位置。

二、朴素算法

当S[i] != T[j]时,把T往后移一位,回溯S的位置并重新开始比较。

  

(1) 成功匹配的部分(ABC)中,没有一样的字符

(a)

S: i A B C A B C E
T: j A B C E      

(b)

S: i A B C A B C E
T: j   A B C E    

(c)

S: i A B C A B C E
T: j     A B C E  

(d)

S: i A B C A B C E
T: j       A B C E

(2) 成功匹配的部分(ABA)中,有一样的部分(A)

(a)

S: i A B A A B A C
T: j A B A C      

(b)

S: i A B A A B A C
T: j   A B A    

(c)

S: i A B A A B A C
T: j     A B A   

(d)

S: i A B A A B A C
T: j       A B A C

三、KMP算法

基本思想:通过整理模式串T中的元素相似性,减少朴素算法中对原串S不必要的回溯。当发生失配时,回溯T到它的最长前缀的后一个位置,同时S的位置不变,再继续匹配。

前缀:包含T首字母的子串

后缀:包含T最后一个字母的子串

next数组

next[j]: 求得T[0, ..., j-1] 中最长的相同的前/后缀,next[j] 是该前缀的后一个字符所在位置。当T[j] 和S[i]不相同时,回溯T[j] 到next[j],S[i]的位置不变。

(1) next[j] =-1  if j == 0 //第一个字符的回溯位置为 -1

(2) next[ j ] = max{ k |T0...T k-1  = Tj-k-1...T j-1 } //最长的相同的前后缀,回溯时相同的部分不用再比较

(3) next[j] = 0 if 其他情况 //没有找到相同的前后缀,回溯的时候只能从第一个字符重新开始比较

计算next数组 

T中有两个相同的子串X(蓝色部分),i 和 j 是当前比较的两个位置

 (1) T[i] = T[j] = 2: next[j+1] = i+1 //T[0, ..., j] 的前缀Xi 和 后缀Xj 一样

 (2) 2 = T[i] != T[j] = 3: i = next[i] //对 i 进行回溯,重新寻找满足条件的前后缀。绿色部分,最后一个元素为 3

next数组的使用效果

(1) 成功匹配的部分(ABC)中,没有一样的字符 (省去 (b,c))

(a)

S: i A B C A B C E
T: j A B C E      
T: next[j] -1 0 0 0      

(d)

S: i A B C A B C E
T: j       A B C E
T: next[j]       -1 0 0 0

S[3] = D, T[3] = E, 不相同。j = next[3] = 0 回溯。(ABC)没有相同的部分,因此不必将 S:i 回溯再尝试匹配。

(2) 成功匹配的部分(ABA)中,有一样的部分(A) (省去 (b)) 

(a)

S: i A B A A B A C
T: j A B A C      
T: next[j] -1 0 0 1      

(c)

S: i A B A A B A C
T: j     B A C  
T: next[j]     -1 0 0 1  

(d)

S: i A B A A B A C
T: j       A B A C
T: next[j]       -1 0 0 1

S[3] = D, T[3] = C,第三个位置不匹配。j = next[3] = 1  回溯。下次比较是可以直接从S[3]和T[1]开始匹配,因为T[0] 和 T[2] 相同。

四、KMP算法源码

hihocoder】 http://hihocoder.com/problemset/problem/1015?sid=808424

 #include <iostream>
#include <string>
using namespace std; //计算next数组
void get_next(string& T, int* next)
{
int i = , j = -, Tlen = T.length();
next[] = -;
while(i < Tlen)
{
if(j == - || T[i] == T[j])
{
++i;
++j;
next[i]=(T[i] == T[j] ? next[j]:j);//使得回溯前和回溯后的元素不一样
}
else
j = next[j];
}
} //计算T在S中出现的次数
int subStrCnt(string& S, string& T)
{
int cnt = ;
int Slen = S.length(), Tlen = T.length();
int next[];
int i = , j = ;
get_next(T, next);
while(i < Slen && j < Tlen)
{
if(j == - || S[i] == T[j])
{
++i;
++j;
}
else
j = next[j];
if(j == Tlen){//T匹配完成,从T: next[j]再开始
cnt++;
j = next[j];
}
}
return cnt;
}
int main()
{
int cnt;
string S, T;
cin>>cnt;
while(cnt-- > )
{
cin>>T>>S;
cout<<subStrCnt(S, T)<<endl;
}
return ;
}

hihocoder上的一个问题:如果next是动态分配,会导致TLE。

【KMP算法】字符串匹配的更多相关文章

  1. KMP算法 字符串匹配(看猫片)

    前言 此篇笔记根据自己的理解和练习心得来解释算法,只代表个人观点,如有不足请指出(我刚学QWQ) 浅谈字符串匹配 设想一个场景,假设你是一个净化网络语言环境的管理员,每天需要翻阅大量的文章和帖子来查找 ...

  2. KMP算法——字符串匹配

    正直找工作面试巅峰时期,有幸在学校可以听到July的讲座,在时长将近三个小时的演讲中,发现对于找工作来说,算法数据结构可以算是程序员道路的一个考量吧,毕竟中国学计算机的人太多了,只能使用这些方法来淘汰 ...

  3. KMP算法---字符串匹配

    算法细节详见点击打开链接和点击打开链接 #include <stdio.h> #include <stdlib.h> #define N 7 #define M 15 void ...

  4. 算法——字符串匹配之BM算法

    前言 Boyer-Moore算法是一种基于后缀匹配的模式串匹配算法(简称BM算法),后缀匹配就是模式串从右到左開始比較,但模式串的移动依旧是从左到右的.在实践中.BM算法效率高于前面介绍的<KM ...

  5. HDU 1711(KMP)字符串匹配

    链接  HDU 1711 Number Sequence KMP 算法 我以自己理解写的,写的不对,不明白的地方海王子出来,一起共同学习: 字符串匹配 就是KMP,一般思想,用一个for循环找开头   ...

  6. KMP算法——字符匹配

     暴力匹配: 假设现在我们面临这样一个问题:有一个文本串S,和一个模式串P,现在要查找P在S中的位置,怎么查找呢? 如果用暴力匹配的思路,并假设现在文本串S匹配到 i 位置,模式串P匹配到 j 位置, ...

  7. KMP算法-字符匹配

    字符匹配模式-KMP算法 j直接跳到了2的位置,因为在之前的都相同. 那么就需要求如果不等了之后,j需要回跳的位置next[j] 如果tk'与tj相等,则next [j+1]=k'+1 如果tk'与t ...

  8. KMP快速字符串匹配

    KMP算法是一种改进的字符串匹配算法,由D.E.Knuth,J.H.Morris和V.R.Pratt同时发现.KMP算法的关键是利用匹配失败后的信息,从错误中吸取经验,尽量减少模式串与主串的匹配次数以 ...

  9. 算法——字符串匹配Rabin-Karp算法

    前言 Rabin-Karp字符串匹配算法和前面介绍的<朴素字符串匹配算法>类似,也是相应每一个字符进行比較.不同的是Rabin-Karp採用了把字符进行预处理,也就是对每一个字符进行相应进 ...

  10. [数据结构与算法] 字符串匹配 - BF算法

    BF(Brute Force)算法 又称暴力匹配算法,是一种朴素的模式匹配算法 给定主串 S : Bilibili 和子串 T :Bilididi 步骤: 1. 主串 S 第一位开始与子串 T 第一位 ...

随机推荐

  1. Linux进程间通信(七):消息队列 msgget()、msgsend()、msgrcv()、msgctl()

    下面来说说如何用不用消息队列来进行进程间的通信,消息队列与命名管道有很多相似之处.有关命名管道的更多内容可以参阅我的另一篇文章:Linux进程间通信 -- 使用命名管道 一.什么是消息队列 消息队列提 ...

  2. Go - 字典(map)

    字典是一种内置的数据结构,用来保存 键值对 的 无序集合. (1)字典的创建 1) make(map[KeyType] ValueType, initialCapacity) 2) make(map[ ...

  3. Android实现页面跳转及传递参数的方法

    简单的示例 实现的效果是这样的: 第一个页面有一个按钮,一个文本框,点击按钮,将文本框的内容传递到第二个页面,并显示在第二个页面中. 首先是在给按钮添加点击事件 setOnClickListener( ...

  4. iOS开发——高级篇——流水布局UICollectionViewFlowLayout的基本使用

    之前看到过的一篇文章 对collectionView的使用总结的非常好:“iOS6新特征:UICollectionView介绍” 流水布局在现在的应用中很常见了,简单的研究了下,实现下面的功能 那我这 ...

  5. BZOJ3436——小K的农场

    1.题意:大概是给一些制约限制,问是否存在合法解 2.分析:我们来观察这三个限制 农场a比农场b至少多种植了c个单位的作物     可以变成b 比 a至多多种了-c 农场a比农场b至多多种植了c个单位 ...

  6. JQuery Mobile 页面参数传递

    在单页模版中使用基于HTTP的方式通过POST和GET请求传递参数,而在多页模版中不需要与服务器进行通信,通常在多页模版中有以下三种方法来实现页面间的参数传递. 1.GET方式:在前一个页面生成参数并 ...

  7. MySQL MHA 搭建&测试

    一:背景介绍 MHA(Master HA)是一款开源的MySQL的高可用工具,能在MySQL主从复制的基础上,实现自动化主服务器故障转移.虽然MHA试图从宕机的主服务器上保存二进制日志,但并不是总是可 ...

  8. ASM:《X86汇编语言-从实模式到保护模式》第16章:Intel处理器的分页机制和动态页面分配

    第16章讲的是分页机制和动态页面分配的问题,说实话这个一开始接触是会把人绕晕的,但是这个的确太重要了,有了分页机制内存管理就变得很简单,而且能直接实现平坦模式. ★PART1:Intel X86基础分 ...

  9. artdialog

    <html><head><meta http-equiv="Content-Type" content="text/html; charse ...

  10. React学习笔记-2-什么是jsx?如何使用jsx?

    什么是jsx?    JSX是JavaScript  XML 这两个单词的缩写,xml和html非常类似,简单来说可以把它理解成使用各种各样的标签,大家可以自行 百度.所以jsx就是在javascri ...