C++编程练习(7)----“KMP模式匹配算法“字符串匹配
/* Index_KMP.h头文件 */
#include<string>
#include<sstream> void get_next(std::string T,int *next)
{
unsigned int i,j;
i=1;
j=0;
next[1]=0;
while(i<(T.size()-1)) /* 此处T的首个字符T[0]表示串T的长度,不参与计算 */
{
if(j==0||T[i]==T[j]) /* T[i]表示后缀的单个字符,T[j]表示前缀的单个字符 */
{
++i;
++j;
next[i]=j;
}
else
j=next[j]; /* 若字符不相同,则j值回溯 */
}
} int Index_KMP(std::string S, std::string T, unsigned int pos)
{
std::string s,t; /*在字符串S,T的最前插入一个字符来保存串的长度值,*/
std::ostringstream s1,s2; /*用来保证字符串的有用元素是从下标1开始*/
s1<<S.size()<<S; /*将新的数组保存为s,t*/
s2<<T.size()<<T;
s=s1.str();
t=s2.str();
unsigned int i=pos; /* i用于主串s当前位置下标值,若pos不为1,则从pos位置开始匹配 */
unsigned int j=1; /* j用于字串t中当前位置下标值 */
int next[255]; /* 定义一next数组 */
get_next(t,next); /* 对串t作分析,得到next数组 */
while (i<=(s.size()-1) && j<=(t.size()-1)) /* 若i小于S的长度且j小于T的长度时,循环继续 */
{
if ( j==0 || s[i]==t[j]) /* 两字母相等则继续,相对于朴素算法增加了j=0判断 */
{
++i;
++j;
}
else /* 指针后退重新开始匹配 */
{
j=next[j]; /* j退回合适的位置,i值不变 */
}
}
if ( j>(t.size()-1) )
return i-(t.size()-1);
else
return 0;
}
KMP模式匹配算法的改进:
/* Index_KMP.h头文件 */
#include<string>
#include<sstream> void get_nextval(std::string T,int *nextval)
{
unsigned int i,j;
i=1;
j=0;
nextval[1]=0;
while(i<(T.size()-1)) /* 此处T的首个字符T[0]表示串T的长度,不参与计算 */
{
if(j==0||T[i]==T[j]) /* T[i]表示后缀的单个字符,T[j]表示前缀的单个字符 */
{
++i;
++j;
if (T[i]!=T[j]) /*若当前字符与前缀字符不同*/
nextval[i]=j; /*则当前的j为nextval在i位置的值*/
else
nextval[i]=nextval[j]; /*如果与前缀字符相同,则将前缀字符的nextval值赋值给nextval在i位置的值*/ }
else
j=nextval[j]; /* 若字符不相同,则j值回溯 */
}
} int Index_KMP(std::string S, std::string T, unsigned int pos)
{
std::string s,t; /*在字符串S,T的最前插入一个字符来保存串的长度值,*/
std::ostringstream s1,s2; /*用来保证字符串的有用元素是从下标1开始*/
s1<<S.size()<<S; /*将新的数组保存为s,t*/
s2<<T.size()<<T;
s=s1.str();
t=s2.str();
unsigned int i=pos; /* i用于主串s当前位置下标值,若pos不为1,则从pos位置开始匹配 */
unsigned int j=1; /* j用于字串t中当前位置下标值 */
int next[255]; /* 定义一next数组 */
get_nextval(t,next);
while (i<=(s.size()-1) && j<=(t.size()-1)) /* 若i小于S的长度且j小于T的长度时,循环继续 */
{
if ( j==0 || s[i]==t[j]) /* 两字母相等则继续,相对于朴素算法增加了j=0判断 */
{
++i;
++j;
}
else /* 指针后退重新开始匹配 */
{
j=next[j]; /* j退回合适的位置,i值不变 */
}
}
if ( j>(t.size()-1) )
return i-(t.size()-1);
else
return 0;
}
匹配算法不做变化,只需要将"get_next(T,next)"改为“get_nextval (T,next)”即可。
总结:改进过的KMP算法,它是在计算出 next 值的同时,如果a位字符与它 next 值指向的 b 位字符相等,则该 a 位的nextval 就指向 b 位的 nextval 值,如果不等,则该 a 位的 nextval 值就是它自己 a 位的 nextval 的值。
C++编程练习(7)----“KMP模式匹配算法“字符串匹配的更多相关文章
- 线性表-串:KMP模式匹配算法
一.简单模式匹配算法(略,逐字符比较即可) 二.KMP模式匹配算法 next数组:j为字符序号,从1开始. (1)当j=1时,next=0: (2)当存在前缀=后缀情况,next=相同字符数+1: ( ...
- 详细解读KMP模式匹配算法
转载请注明出处:http://blog.csdn.net/fightlei/article/details/52712461 首先我们需要了解什么是模式匹配? 子串定位运算又称为模式匹配(Patter ...
- [从今天开始修炼数据结构]串、KMP模式匹配算法
[从今天开始修炼数据结构]基本概念 [从今天开始修炼数据结构]线性表及其实现以及实现有Itertor的ArrayList和LinkedList [从今天开始修炼数据结构]栈.斐波那契数列.逆波兰四则运 ...
- 串、KMP模式匹配算法
串是由0个或者多个字符组成的有限序列,又名叫字符串. 串的比较: 串的比较是通过组成串的字符之间的编码来进行的,而字符的编码指的是字符在对应字符集中的序号. 计算机中常用的ASCII编码,由8位二进制 ...
- KMP模式匹配算法
KMP模式匹配算法 相信很多人对于这个还有点不了解,或者说是不懂,下面,通过一道题,来解决软考中的这个问题! 正题: aaabaaa,其next函数值为多少? 对于这个问题,我们应该怎么做呢? 1.整 ...
- 字符串的模式匹配算法——KMP模式匹配算法
朴素的模式匹配算法(C++) 朴素的模式匹配算法,暴力,容易理解 #include<iostream> using namespace std; int main() { string m ...
- 数据结构(三)串---KMP模式匹配算法
(一)定义 由于BF模式匹配算法的低效(有太多不必要的回溯和匹配),于是某三个前辈发表了一个模式匹配算法,可以大大避免重复遍历的情况,称之为克努特-莫里斯-普拉特算法,简称KMP算法 (二)KMP算法 ...
- 浅谈KMP模式匹配算法
普通的模式匹配算法(BF算法) 子串的定位操作通常称为模式匹配算法 假设有一个需求,需要我们从串"a b a b c a b c a c b a b"中,寻找内容为"a ...
- 初探—KMP模式匹配算法
KMP算法思想: 普通的字符串匹配算法S主串必须要回溯.但回溯就影响了效率. 改进的地方也就是这里,我们从P 串本身出发,事先就找准了T自身前后部分匹配的位置,那就可以改进算法. next数组的含义: ...
随机推荐
- spell checking
Spell checker Description You, as a member of a development team for a new spell checking program, a ...
- RAC(ReactiveCocoa)
什么是 ReactiveCocoa ReactiveCocoa(其简称为 RAC)是由 Github 开源的一个应用于 iOS 和 OS X 开发的新框架.RAC 具有函数式编程和响应式编程的特性.它 ...
- K-means算法简介
K-means 算法是无监督的 聚类算法,算法简单,有效. K-means算法: 输入参数: 指定聚类数目 k,训练集 X 输出 : k 个聚类 算法描述: K-means 算法 是一个 迭代算法,每 ...
- android MessageQueue入门
接触安卓几年了.但是感觉一直不是很明白,东西太多了.反过来说就是自己太菜了.很多东西其实都是模凌两可,不熟悉,很多知识点都是知道一点,最多大家都这样用.没问题,事件长了也一直这样用的.但是有个问题,安 ...
- tableview的reloadData应注意
http://blog.csdn.net/ouyangtianhan/article/details/7835041 http://stackoverflow.com/questions/160715 ...
- cf Round 594
A.Warrior and Archer(思维) 战士一定会ban掉当前边缘的位置.而战士和射手就会选择剩下的最远的两点.我们让剩下的最远的两点最近就达到了均衡.于是我们枚举战士ban掉的边缘,ban ...
- 【转】每一个程序员需要了解的10个Linux命令
作为一个程序员,在软件开发职业生涯中或多或少会用到Linux系统,并且可能会使用Linux命令来检索需要的信息.本文将为各位开发者分享10个有用的Linux命令,希望对你会有所帮助. 以下就是今天我们 ...
- UVa 10299 - Relatives
题目大意:Euler's Totient的应用. 几乎和UVa 10179 - Irreducable Basic Fractions一样,于是偷了个懒,直接用10179题的代码,结果WA了,感觉一样 ...
- C# TPL学习
程序Ⅰ:通过Task类创建新线程 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 ...
- 写了一个复杂的sql语句
$sp_sql = "select sp_ProductNo, sp_ProductName,sp_Standard,sp_Unit,sum(sp_Amount) as amount fro ...