BF算法和KMP算法
这两天复习数据结构(严蔚敏版),记录第四章串中的两个重要算法,BF算法和KMP算法,博主主要学习Java,所以分析采用Java语言,后面会补上C语言的实现过程。
1、Brute-Force算法(暴力法)
要求:将主串的第i个字符(一般情况i为1)和字串的第一个字符进行比较。若相等,则继续比较后续字符;若不相等,则从主串的下一个字符起,重新与子串的第一个字符比较。成功,返回主串中与子串相匹配的子序列的第一个字符的序号;失败,返回0
public class Brute_Force {
/**
* 暴力法 ,O(m*n) (m、n分别为主串长度和子串长度)
* @param S 主串(原始字符串)
* @param T 子串(模式字符串)
* @return 如果模式字符串在原始字符串中存在,返回模式字符串在原始字符串中第一次出现的索引
*/
private int Index_BF(String S, String T) {
//习惯性排除错误的模式
if (S==null || S.length()<=0 || T==null || T.length()<=0)
return 0;
int S_length = S.length();
int T_length = T.length();
int i=0, j=0;
while (i<S_length && j<T_length) {
if (S.charAt(i) == T.charAt(j)) {
i++;
j++;
}else {
//不等
i = i-j+1; //这一步的思想是主串返回到的步数为子串移动的步数i-j,然后从下一个开始+1
j = 0; //j返回索引为0的位置
}
}
if (j == T_length) {
return i-T_length;
}
return 0;
}
//主方法,测试
public static void main(String[] args) {
Brute_Force bf = new Brute_Force();
String S = "hello world";
String T = "world";
System.out.println(bf.Index_BF(S,T)); //6
}
}
2、KMP算法
要求效果同上,只是更合理地应用部分已经匹配的结果
public class KMP {
/**
* KMP 高效法 ,O(m+n) (m、n分别为主串长度和子串长度)
* @param S 主串(原始字符串)
* @param T 子串(模式字符串)
* @return 如果模式字符串在原始字符串中存在,返回模式字符串在原始字符串中第一次出现的索引
*/
private int Index_KMP(String S, String T) {
//习惯性排除错误的模式
if (S==null || S.length()<=0 || T==null || T.length()<=0)
return 0;
//得到子串的next数组
int[] nextArr = getNextArray(T);
int S_length = S.length();
int T_length = T.length();
int i=0, j=0;
while (i<S_length && j<T_length) {
if (j==-1 || S.charAt(i) == T.charAt(j)) {//j==-1第一个字符就和当前测试的字符不相等
i++;
j++;
}else {
j = nextArr[j];
}
}
if (j==T_length) {
return i-T_length;
}
return 0;
}
/**
* 获取模式字符串的next数组
* @param str 子串
* @return
*/
private int[] getNextArray(String str) {
//习惯性排除错误的模式
if (str==null || str.length()<=0)
return null;
int length = str.length();
int[] nextArr = new int[length];
int j=0, k=-1;
nextArr[0] = -1;
while (j<length-1) {
if (k==-1 || str.charAt(j) == str.charAt(k)) {
j++;
k++;
nextArr[j] = k;
}else {
k = nextArr[k];
}
}
return nextArr;
}
//主方法,测试
public static void main(String[] args) {
KMP kmp = new KMP();
String S = "hello world";
String T = "world";
System.out.println(kmp.Index_KMP(S,T)); //6
}
}
3、KMP的讲解
KMP算法的核心,通俗来讲是,当S[i]和T[j]发生不匹配现象时,i指针不需要回溯,只需j指针回溯即可。详情可以看下这篇知乎:
https://www.zhihu.com/question/21923021/answer/281346746
大体的对比:

4、C语言实现
考试还是要用C语言,还是得好好参考下
BF算法:
#include <stdio.h>
#include <string.h>
//串普通模式匹配算法的实现函数,其中 B是主串,A是子串
int BF(char * B,char *A){
int i=0,j=0;
while (i<strlen(B) && j<strlen(A)) {
if (B[i]==A[j]) {
i++;
j++;
}else{
i=i-j+1;
j=0;
}
}
//跳出循环有两种可能,i=strlen(B)说明已经遍历完主串,匹配失败;j=strlen(A),说明子串遍历完成,在主串中成功匹配
if (j==strlen(A)) {
return i-strlen(A)+1;
}
//运行到此,为i==strlen(B)的情况
return 0;
}
int main() {
int number = BF("hello world", "world");
printf("%d",number);
return 0;
}
KMP算法:
#include <stdio.h>
#include <string.h>
void Next(char*T,int *next){
int i=1;
next[1]=0;
int j=0;
while (i<strlen(T)) {
if (j==0||T[i-1]==T[j-1]) {
i++;
j++;
next[i]=j;
}else{
j=next[j];
}
}
}
int KMP(char * S,char * T){
int next[10];
Next(T,next);//根据模式串T,初始化next数组
int i=1;
int j=1;
while (i<=strlen(S)&&j<=strlen(T)) {
//j==0:代表模式串的第一个字符就和当前测试的字符不相等;S[i-1]==T[j-1],如果对应位置字符相等,两种情况下,指向当前测试的两个指针下标i和j都向后移
if (j==0 || S[i-1]==T[j-1]) {
i++;
j++;
}
else{
j=next[j];//如果测试的两个字符不相等,i不动,j变为当前测试字符串的next值
}
}
if (j>strlen(T)) {//如果条件为真,说明匹配成功
return i-(int)strlen(T);
}
return -1;
}
int main() {
int i=KMP("hello world","world");
printf("%d",i);
return 0;
}
BF算法和KMP算法的更多相关文章
- 字符串匹配-BF算法和KMP算法
声明:图片及内容基于https://www.bilibili.com/video/av95949609 BF算法 原理分析 Brute Force 暴力算法 用来在主串中查找模式串是否存以及出现位置 ...
- 字符串匹配的BF算法和KMP算法学习
引言:关于字符串 字符串(string):是由0或多个字符组成的有限序列.一般写作`s = "123456..."`.s这里是主串,其中的一部分就是子串. 其实,对于字符串大小关系 ...
- 串的模式匹配 BF算法和KMP算法
设有主串s和子串t,子串t的定位就是要在主串中找到一个与子串t相等的子串.通常把主串s称为目标串,把子串t称为模式串,因此定位也称为模式匹配. 模式匹配成功是指在目标串s中找到一个模式串t: 不成功则 ...
- 串匹配模式中的BF算法和KMP算法
考研的专业课以及找工作的笔试题,对于串匹配模式都会有一定的考察,写这篇博客的目的在于进行知识的回顾与复习,方便遇见类似的题目不会纠结太多. 传统的BF算法 传统算法讲的是串与串依次一对一的比较,举例设 ...
- BF算法和KMP算法 python实现
BF算法 def Index(s1,s2,pos = 0): """ BF算法 """ i = pos j = 0 while(i < ...
- 字符串匹配(BF算法和KMP算法及改进KMP算法)
#include <stdio.h> #include <string.h> #include <stdlib.h> #include<cstring> ...
- BF算法和KMP算法(javascript版本)
var str="abcbababcbababcbababcabcbaba";//主串 var ts="bcabcbaba";//子串 function BF( ...
- 数据结构(十六)模式匹配算法--Brute Force算法和KMP算法
一.模式匹配 串的查找定位操作(也称为串的模式匹配操作)指的是在当前串(主串)中寻找子串(模式串)的过程.若在主串中找到了一个和模式串相同的子串,则查找成功:若在主串中找不到与模式串相同的子串,则查找 ...
- 软件设计师_朴素模式匹配算法和KMP算法
1.从主字符串中匹配模式字符串(暴力匹配) 2. KMP算法
随机推荐
- git换行符自动转换导致整个文件被修改的解决方案
不少开发者可能遇到过这个问题:从git上拉取服务端代码,然后只修改了一处地方,准备提交时,用diff软件查看,却发现整个文件都被修改了.这是git自动转换换行符导致的问题. 原因 不同操作系统使用的换 ...
- 洛谷P1309——迷宫(傻瓜DFS)
题目背景 迷宫 [问题描述] 给定一个N*M方格的迷宫,迷宫里有T处障碍,障碍处不可通过.给定起点坐标和 终点坐标,问: 每个方格最多经过1次,有多少种从起点坐标到终点坐标的方案.在迷宫 中移动有上下 ...
- [Python]爬虫获取知乎某个问题下所有图片并去除水印
获取URL 进入某个知乎问题的主页下,按F12打开开发者工具后查看network面板. network面板可以查看页面向服务器请求的资源.资源的大小.加载资源花费的时间以及哪些资源加载失败等信息.还可 ...
- TP5框架下实现数据库的备份功能-tp5er/tp5-databackup
1.安装扩展 方法一: composer require tp5er/tp5-databackup dev-master 方法二 composer.json: "require": ...
- ecshop增加调用字段问题汇总
一.ecshop文章列表页调用缩略图.网页描述等 打开includes/lib_article.php文件,大约在69行 添加 $arr[$article_id]['description'] = $ ...
- CF1251F-Red-White Fence【NTT】
前言 刚开始看错题推了半天的生成函数 正题 题目链接:https://www.luogu.com.cn/problem/CF1251F 题目大意 $n$个白色木板,$k$个红色木板,给出这些木板的高度 ...
- Docker安装Jenkins 从GitLab上拉取代码打包SpringBoot项目并部署到服务器
1. 安装Jenkins 采用 Docker 方式安装 jenkins 首先,宿主机上需要安装java和maven,这里我的安装目录如下: 由于是docker安装,jenkins将来是在容器里面运行 ...
- 阿里云ECS服务器Centos中安装SQL Server(破解内存限制)
前言 前段时间赶上阿里云618活动入手了一个低配的Linux服务器,供自己学习使用,在安装SQL Server中遇到了很多小问题,查阅很多博客结合自身遇到的问题做个总结. 安装过程 1.下载阿里云在线 ...
- 智汀家庭云-开发指南Golang:设备插件开发
设备插件模块 开发前先阅读插件设计概要:智汀家庭云-开发指南Golang: 插件模块 使用 plugin-sdk 可以忽略不重要的逻辑,快速实现插件 插件实现 获取sdk go get github. ...
- 巧用优先队列:重载运算符在STL优先队列中的应用
前言 写优先队列优化dijkstra的时候,需要放进优先队列的常常有数值和编号两类,以下介绍让编号捆绑数值放入优先队列的几种方法. 由于过程比较简单,记住代码即可,下面不再讲解,只附上代码,请读者自行 ...