【数据结构&&等差数列】KMP简介和算法的实现(c++ && java)
KMP算法假定了解案件的原则,其实很easy。
KMP算法简述
关于根据自己的理解在这里。
KMP该算法由三个发明人的名称(Knuth、Morris、Pratt)的首字母组成,又称字符串查找算法。
个人认为能够理解为最小回溯算法,即匹配失效的时候,尽量少回溯。从而缩短时间复杂度。
KMP算法有两个关键的地方。1)求解next数组。2)利用next数组进行最小回溯。
1)求解next数组
当k=-1的时候。表示找不到这种最长前缀。
| j | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
|---|---|---|---|---|---|---|---|---|---|
| p | a | b | a | a | b | c | a | b | a |
| next[j] | -1 | -1 | 0 | 0 | 1 | -1 | 0 | 1 | 2 |
以 j = 8 为例,最长前缀为aba,最后一个字符位置为2,故 next[8] = 2 。
- t = next[ j - 1 ] + 1,t 指向可能等于 p[ j ] 的位置,即 p[ t ] 可能等于 p[ j ]。
- 假设 p[ t ] = p[ j ] , 那么 next[ j ] = next[ j - 1 ] + 1
- 假设 p[ t ] != p[ j ] , 则令 t = next[ t - 1 ] + 1,继续第 2 步直到 t = 0 或者找到位置。
- 结束时推断p[ t ] 是否等于 p[ j ] ,假设等于则 next[ j ] = t , 否则等于 -1 。
下图表示了第一次不匹配。第二次匹配的过程,其他过程能够类推。当中 或 覆盖部分表示最长匹配串。 为待判定位置,
为已判定位置。
2)利用next数组进行最小回溯
s ××××××××××××××××××××××××××××××××××××××××××××
p ××××××××××××××
在j处不失配时,前面的有部分匹配。这时须要利用next数组信息进行最小回溯。
s ××××××××××××××××××××××××××××××××××××××××××××
p ××××××××××××××
(这里 i 指向 s , j 指向 p。)
注意在 j = 0 的时候失配时。直接 i++ 就可以。
当 j > 0 的时候,须要利用next数组最快找到 p[ j ] == s[ i ] 的位置。
假设 j 移动到了0还找不到。则 i++,然后继续匹配。
这里我们能够发现仅仅有 j 回溯了,i没有回溯,可是因为普通版本号的 KMP 算法 j 须要不停地回溯直到找到合适的回溯位置,因此速度不是特别快。还能够继续优化。感兴趣的读者能够想想怎样事先求解好next数组从而不须要不停地回溯。
代码实现
strStr返回的是首次匹配的地址。假设不能匹配则返回NULL。
class Solution {
public:
vector<int> getNext(char* &s){
vector<int> next(strlen(s), -1);
for(int i=1; i<strlen(s); i++){
int j = next[i-1]; /* 前一个字符的最长匹配长度 */
while(s[j+1] != s[i] && j>=0)
j = next[j];
if(s[j+1] == s[i])
next[i] = j+1;
// else 默觉得-1
}
return next;
}
char *strStr(char *haystack, char *needle) {
if(haystack==NULL || needle==NULL) return NULL;
if(strlen(haystack) < strlen(needle)) return NULL;
if(strlen(needle) == 0) return haystack;
vector<int> next = getNext(needle);
int i = 0;
int j = 0;
int haystackLen = strlen(haystack);
int needleLen = strlen(needle);
while(i<haystackLen && j<needleLen){
if(haystack[i] == needle[j] ) {
i++;
j++;
if(j == needleLen) return haystack + i - j;
}else{
if(j == 0) i++;
else j = next[j-1]+1; /* 该步骤能够优化 */
}
}
return NULL;
}
};
因为有人问有没有java版本号的,因为鄙人java比較挫。写java时部分还写成了scala的语法。不知道代码是否规范,有优化的地方还麻烦java方面的大神指点。
import java.util.*;
public class StrStrSolution {
private List<Integer> getNext(String p){
List<Integer> next = new ArrayList<Integer>();
next.add(-1);
for(int i=1; i<p.length(); i++){
int j = next.get(i-1);
while(p.charAt(j+1) != p.charAt(i) && j>=0)
j = next.get(j);
if(p.charAt(j+1) == p.charAt(i))
next.add( j + 1 );
else
next.add( -1 );
}
return next;
}
public String strStr(String haystack, String needle) {
if (haystack == null || needle == null) return null;
if (needle.length() == 0) return haystack;
if (needle.length() > haystack.length()) return null;
List<Integer> next = getNext(needle);
int i = 0;
int j = 0;
int haystackLen = haystack.length();
int needleLen = needle.length();
while(i < haystackLen && j < needleLen){
if(haystack.charAt(i) == needle.charAt(j) ) {
i++;
j++;
if(j == needleLen) return haystack.substring(i - j);
}else{
if(j==0) i++;
else j = next.get(j-1)+1;
}
}
return null;
}
public static void main(String[] args) {
String s = "babcabaabcacbac";
String p = "abaabcac";
StrStrSolution sol = new StrStrSolution();
System.out.println(sol.strStr(s,p));
}
}
【数据结构&&等差数列】KMP简介和算法的实现(c++ && java)的更多相关文章
- hdu 3336:Count the string(数据结构,串,KMP算法)
Count the string Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others) ...
- C++基础代码--20余种数据结构和算法的实现
C++基础代码--20余种数据结构和算法的实现 过年了,闲来无事,翻阅起以前写的代码,无意间找到了大学时写的一套C++工具集,主要是关于数据结构和算法.以及语言层面的工具类.过去好几年了,现在几乎已经 ...
- Bug2算法的实现(RobotBASIC环境中仿真)
移动机器人智能的一个重要标志就是自主导航,而实现机器人自主导航有个基本要求--避障.之前简单介绍过Bug避障算法,但仅仅了解大致理论而不亲自动手实现一遍很难有深刻的印象,只能说似懂非懂.我不是天才,不 ...
- 详解Linux内核红黑树算法的实现
转自:https://blog.csdn.net/npy_lp/article/details/7420689 内核源码:linux-2.6.38.8.tar.bz2 关于二叉查找树的概念请参考博文& ...
- Python学习(三) 八大排序算法的实现(下)
本文Python实现了插入排序.基数排序.希尔排序.冒泡排序.高速排序.直接选择排序.堆排序.归并排序的后面四种. 上篇:Python学习(三) 八大排序算法的实现(上) 1.高速排序 描写叙述 通过 ...
- Python八大算法的实现,插入排序、希尔排序、冒泡排序、快速排序、直接选择排序、堆排序、归并排序、基数排序。
Python八大算法的实现,插入排序.希尔排序.冒泡排序.快速排序.直接选择排序.堆排序.归并排序.基数排序. 1.插入排序 描述 插入排序的基本操作就是将一个数据插入到已经排好序的有序数据中,从而得 ...
- RMQ问题总结,标准RMQ算法的实现
RMQ问题:对于长度为N的序列,询问区间[L,R]中的最值 RMQ问题的几种解法: 普通遍历查询,O(1)-O(N) 线段树,O(N)-O(logN) DP,O(NlogN)-O(1) RMQ标准算法 ...
- Canny边缘检测算法的实现
图像边缘信息主要集中在高频段,通常说图像锐化或检测边缘,实质就是高频滤波.我们知道微分运算是求信号的变化率,具有加强高频分量的作用.在空域运算中来说,对图像的锐化就是计算微分.由于数字图像的离散信号, ...
- java基础解析系列(四)---LinkedHashMap的原理及LRU算法的实现
java基础解析系列(四)---LinkedHashMap的原理及LRU算法的实现 java基础解析系列(一)---String.StringBuffer.StringBuilder java基础解析 ...
随机推荐
- Android编程心得-Handler与子线程的交互初步
在编写项目的时候,本人发现一个关于线程与Handler很容易犯的错误. 我有两个Activity,一个Activity在后台创建了一个线程并且启动,这个线程对象对应的实体实在另外一个Activity的 ...
- 求刷Kindle Fire HD的方法
前几天入手了台Amazon Kindle Fire HD 其系统是经过Amazon尝试改造过的Android,用起来很不爽,想刷个CM10之类的,求教程和工具.
- PageHeap,调试Heap问题的工具
<Windows用户态程序高效排错>第二章主要介绍用户态调试相关的知识和工具.本文主要讲了PageHeap,调试Heap问题的工具. AD:51CTO学院:IT精品课程在线看! 2.4.2 ...
- HTTP POST请求的Apache Rewrite规则设置
最近自测后端模块时有个业务需求需要利用WebServer(我用的是Apache)将HTTP POST请求转发至后端C模块,后端处理后返回2进制加密数据.http post请求的url格式为: ...
- [置顶] 初识window.location.search
window.location.search是从当前URL的?号开始的字符串 如:http://www.domain.com/item?id=0064014 它的search就是?id=0064014
- MingW环境下的windows编程
一般在进行windows编程时都使用vc++精简版,其插入菜单,图片等资源等更简单,且vc中对中文有更好的支持,win7下安装的Mingw中文并不能很好地显示,有光标显示的位置和光标实际位置不符的问题 ...
- iOS视图控制器之间delegate传值教程
之前在StackOverFlow上看到一篇讲传值(segue传值和delegate传值)的文章,感觉讲的非常清晰,就将delegate部分翻译了一下.有兴趣能够看看. 原文: http://stack ...
- 14.3.5.2 Deadlock Detection and Rollback 死锁检测和回滚:
14.3.5.2 Deadlock Detection and Rollback 死锁检测和回滚: InnoDB 自动检查四艘,回滚一个事务或者事务来打破死锁. InnoDB 试图选择小的事务来回滚, ...
- OC对象创建过程
在利用OC开发应用程序中,须要大量创建对象,那么它的过程是什么呢? 比方:NSArray *array = [[NSArrayalloc] init]; 在说明之前,先把OC的Class描写叙述一下: ...
- 我为什么要创建帮创业者找合伙人的缘创派(ycpai.com)?
我为什么要创建帮助创业者找合伙人的缘创派(ycpai.com)? 在我发出第一条离开CSDN出来创业的微博后,感谢各位朋友的鼓励.很多朋友问我一些问题,我在这里一并回答,并简单阐述一下我的理念. 问: ...