本文根据<大话数据结构>一书,实现了Java版的串的朴素模式匹配算法.KMP模式匹配算法.KMP模式匹配算法的改进算法. 1.朴素的模式匹配算法 为主串和子串分别定义指针i,j. (1)当 i 和 j 位置上的字母相同时,两个指针都指向下一个位置继续比较: (2)当 i 和 j 位置上的字母不同时,i 退回上次匹配首位的下一位,j 则返回子串的首位. (注:该图从下标为1开始 ) 实现程序: /** * 朴素的模式匹配算法 * 说明:下标从0开始,与书稍有不同,但原理一样 * @author…
--喜欢记得关注我哟[shoshana]-- 目录 1.朴素的模式匹配算法2.KMP模式匹配算法 2.1 KMP模式匹配算法的主体思路 2.2 next[]的定义与求解 2.3 KMP完整代码 2.4 一道题目3.KMP模式匹配算法改进 4.朴素算法和KMP算法的时间复杂度分析 5.KMP算法next[]数组理解附: 正文 字符串匹配 给你两个字符串,寻找其中一个字符串是否包含另一个字符串,如果包含,返回包含的起始位置. 如下面两个字符串: string s = "bacbababadababa…
串的模式匹配算法     问题:         求子串位置的定位函数如何写? int index(SString S,SString T,int pos);         给定串S,子串T,问T在S中从pos位开始第一次出现的位置是? 我没有使用字符数组或者string,而是自己实现SString,(这其实是数据结构作业).S[0]中存放的是串的长度. 方法一:大暴力 #include<iostream> #include<cstdio> #define MAXSTRLEN 2…
  数据结构- 串的模式匹配算法:BF和 KMP算法  Brute-Force算法的思想 1.BF(Brute-Force)算法 Brute-Force算法的基本思想是: 1) 从目标串s 的第一个字符起和模式串t的第一个字符进行比较,若相等,则继续逐个比较后续字符,否则从串s 的第二个字符起再重新和串t进行比较. 2) 依此类推,直至串t 中的每个字符依次和串s的一个连续的字符序列相等,则称模式匹配成功,此时串t的第一个字符在串s 中的位置就是t 在s中的位置,否则模式匹配不成功. Brute…
//串的模式匹配算法 //KMP算法,时间复杂度为O(n+m) #include <iostream> #include <string> #include <cstring> using namespace std; //-----串的定长顺序存储结构----- #define MAXLEN 255 //串的最大长度 typedef struct { ]; //存储串的一维数组 int length; //串的当前长度 }SString; ]; ]; int Inde…
//KMP串的模式匹配算法 #include <stdio.h> #include <stdlib.h> #include <string.h> int* get_next(char t[], int length) { , j = -; int* next = (int *)malloc(length * sizeof(int)); next[] = -; while (i < length) { || t[i] == t[j]) { i++; j++; nex…
串的定长顺序存储#define MAXSTRLEN 255,//超出这个长度则超出部分被舍去,称为截断 串的模式匹配: 串的定义:0个或多个字符组成的有限序列S = 'a1a2a3…….an ' n = 0时为空串串的顺序存储结构:字符数组,串的长度就是数组末尾‘\0'前面的字符个数数组需在定义时确定长度,有局限性数组的最大长度二:串的堆分配存储表示typedef struct { char *ch; //若是非空串,则按串长分配存储区 //否则ch为空 int length; //串长度}HS…
串的模式匹配的一般方法如算法4.5(在bo4-1.cpp 中)所示:由主串S 的第pos 个字 符起,检验是否存在子串T.首先令i 等于 pos(i 为S 中当前待比较字符的位序),j 等于 1(j 为T 中当前待比较字符的位序),如果S 的 第i 个字符与T 的第j 个字符相同,则i.j 各 加1 继续比较,直至T 的最后一个字符(找 到).如果还没到T 的最后一个字符,比较就 出现了不同(没找到),则令i 等于pos+1,j 等 于1,由pos 的下一个位置起,继续查找是否 存在子串T.这个…
BF算法 字符串的模式匹配不一定要从主串的第一个位置开始,可以指定主串中查找的起始位置 pos. 2. 算法步骤: 1)分别利用计数器指针 i 和 j 指定主串和模式串即小字符串待比较的位置,初始化为 1. 2) 如果两个串均为比较到串尾,就进行以下操作,S[ i ] 和 T[ j ] 进行比较,若相等,指针后移,继续匹配,若不等,指针后退,重新开始匹配.从主串的下一个字符串开始,i = i - j +2; 话不多说,直接上代码 package softcolledge.test; public…
模式匹配 在字符串匹配问题中,我们期待察看源串 " S串 " 中是否含有目标串 " 串T " (也叫模式串).其中 串S被称为主串,串T被称为子串. 1.如果在主串中查找到子串,则称为模式匹配成功,返回模式串的第一个字符在主串中出现的位置. 2.如果在主串中未找到子串,则称为模式匹配失败,返回-1. 在模式匹配过程中有两个比较经典的算法:Brute-Force与KMP算法是两种最经典的模式匹配算法. 在本片中主要分析BF算法,很黄很暴力.下面是简单的思路解析:  …
1.朴素的模式匹配算法 朴素的模式匹配算法:就是对主串的每个字符作为子串开头,与要连接的字符串进行匹配.对主串做大循环,每个字符开头做T的长度的小循环,直到成功匹配或全部遍历完成为止. 又称BF算法 package com.alice.dataStructe5.bf; /** * 返回子串t在主串s中第pos个字符之后的位置,若不存在,则返回-1 * @author Administrator * */ public class BF { public int index(String s,St…
朴素的模式匹配算法(C++) 朴素的模式匹配算法,暴力,容易理解 #include<iostream> using namespace std; int main() { string mainStr, str; cin >> mainStr >> str; int i, j, pos = -1, count = 0; for(i = 0; i < mainStr.length(); i++) { for(j = 0; j < str.length(); j…
[从今天开始修炼数据结构]基本概念 [从今天开始修炼数据结构]线性表及其实现以及实现有Itertor的ArrayList和LinkedList [从今天开始修炼数据结构]栈.斐波那契数列.逆波兰四则运算的实现 [从今天开始修炼数据结构]队列.循环队列.PriorityQueue的原理及实现 一.什么是串? 串是羊肉牛肉等用铁签穿过的食物,常碳烤.油炸.不对,错了…… 串String是由零个或多个字符组成的有限序列,又名字符串. 二.串的比较 在计算机中串的大小取决于它们挨个字母的字典顺序,比如“…
KMP算法是一种模式匹配算法的改进版,其通过减少匹配的次数以及使主串不回朔来减少字符串匹配的次数,从而较少算法的相应代价,但是,事件万物是普遍归中的,KMP算法的有效性也是有一定的局限的,我将在本文的最后也讨论这个算法的局限性. 一般的匹配算法: KMP基本概念引入: 但是,其实我们会发现,上面的中间两个匹配步骤是没有必要的,因为他们的第一个匹配字母就不相同,完全没有可比性,而当我们在第四次匹配的时候,其实我们从模式串中就可得知,只有当模式串滑到这个地方的时候,它的匹配才是最有价值的,因为从模式…
(一)定义 由于BF模式匹配算法的低效(有太多不必要的回溯和匹配),于是某三个前辈发表了一个模式匹配算法,可以大大避免重复遍历的情况,称之为克努特-莫里斯-普拉特算法,简称KMP算法 (二)KMP算法了解 问题由模式串T决定,而不是由目标串S决定 可以避免不必要的回溯和多余的匹配 1.思路启发一(避免了所有的回溯): 前提:对于模式串和目标串的匹配,我们在前4个完全匹配,直到i5与j5才失配 上面匹配到j5与i5时失配,那么我们下一步应该如何匹配呢?是按照BF算法回溯到i=i-j+-->i2处继…
直接接上篇上代码: //KMP算法 public class KMP { // 获取next数组的方法,根据给定的字符串求 public static int[] getNext(String sub) { int j = 1, k = 0; int[] next = new int[sub.length()]; next[0] = -1; // 这个是规定 next[1] = 0; // 这个也是规定 // while (j < sub.length() - 1) { if (sub.char…
串是由0个或者多个字符组成的有限序列,又名叫字符串. 串的比较: 串的比较是通过组成串的字符之间的编码来进行的,而字符的编码指的是字符在对应字符集中的序号. 计算机中常用的ASCII编码,由8位二进制数表示一个字符,总共可以表示256个字符. 对于以英语为主的国家来说,ASCII已经足够使用,但对于其他语种的国家来说,显然是不够的. 所以出现了Unicode编码,使用16位二进制数来表示一个字符,这样总共可以表示2的16次方个字符,同时兼容ASCII编码. 所以在比较两个串是否相等时,必须是它们…
一.模式匹配 串的查找定位操作(也称为串的模式匹配操作)指的是在当前串(主串)中寻找子串(模式串)的过程.若在主串中找到了一个和模式串相同的子串,则查找成功:若在主串中找不到与模式串相同的子串,则查找失败.两种主要的模式匹配算法是Brute Force算法和KMP算法. 二.Brute Force算法 1.Brute Force算法也被称为朴素的模式匹配算法,是一种简单.直观的模式匹配算法.简单来说,就是对主串的每一个字符作为子串开头,与要匹配的字符串进行匹配.对主串做大循环,每个字符开头做次数…
 本文根据<大话数据结构>一书,实现了Java版的顺序存储结构. 顺序存储结构指的是用一段地址连续的存储单元一次存储线性表的数据元素,一般用一维数组来实现. 书中的线性表抽象数据类型定义如下(第45页): 实现程序: package SqList; /** * * 几个注意点: * 1.初始化时,应考虑数组大小为负的情况 * 2.在各操作中,当涉及到位置i时,都应考虑i位置不合理的情况 * 3.插入操作中,需考虑线性表已满的情况 * 删除.获取操作中,需考虑线性表为空的情况 * 4.插入删除操…
本文根据<大话数据结构>一书,实现了Java版的单链表. 每个结点中只包含一个指针域的链表,称为单链表. 单链表的结构如图所示: 单链表与顺序存储结构的对比: 实现程序: package LinkList; /** * 说明: * 1.<大话数据结构>中没有线性表的长度,但提到可以存储于头节点的数据域中. * 本程序的线性表长度存放于count变量中,线性表长度可以使程序比较方便. * 2.程序中,第i个位置代表第i个结点,头结点属于第0个结点 * 3.因为链表为泛型,整表创建采用…
本文根据<大话数据结构>一书,实现了Java版的静态链表. 用数组描述的链表,称为静态链表. 数组元素由两个数据域data和cur组成:data存放数据元素:cur相当于单链表中的next指针,称为游标. 某一静态链表结构如图所示(游标存放内容可参考程序中的说明1): 静态链表的优缺点: 静态链表实现程序: package StaticLinkList; /** * 说明: * 1.数组第一个元素的cur为备用链表第一个结点下标, * 数组最后一个元素的cur为第一个有数据的元素的下标,相当于…
本文根据<大话数据结构>一书,实现了Java版的双向链表. 在每个数据结点中都有两个指针,分别指向直接后继和直接前驱,这样的链表称为双向链表. 双向链表的结构如图所示: 查找元素可以根据元素的位置,分别沿正向和反向查找. 双向链表实现程序: package DuLinkList; public class DuLinkList<E> { private Node<E> head; private int count; /** * 结点 */ class Node<…
本文根据<大话数据结构>一书,实现了Java版的栈的顺序存储结构.两栈共享空间.栈的链式存储机构. 栈:限定仅在表尾进行插入和删除操作的线性表. 栈的插入(进栈)和删除(出栈)操作如下图所示.   1.栈的顺序存储结构 用数组存放数据,top变量来指示栈顶元素在数组中的位置(栈顶指针).一个长度为5的栈的示意图如下: 实现程序: /** * 栈的顺序储存结构 * * 问题:构造器中,泛型数组创建是否有更好的方法? * @author Yongh * */ public class SqStac…
本文根据<大话数据结构>一书,实现了Java版的循环队列.链队列. 队列:只允许在一端进行插入操作,而在另一端进行删除操作的线性表. 1.循环队列 队列的顺序储存结构:用数组存储队列,引入front指针指向队头元素,rear指针指向队尾元素的下一个位置,当front=rear时,为空队列,结构如下图所示. 当执行入队操作时,若数组尾部已满,而数组前部因有元素出队而有空位时,我们把新插入的元素从头开始入队,这样就类似于头尾相接的结构. 队列的这种头尾相接的顺序存储结构称为循环队列,如下图所示.…
本文根据<大话数据结构>一书,对Java版的二叉树.线索二叉树进行了一定程度的实现. 另: 二叉排序树(二叉搜索树) 平衡二叉树(AVL树) 二叉树的性质 性质1:二叉树第i层上的结点数目最多为 2{i-1} (i≥1). 性质2:深度为k的二叉树至多有2{k}-1个结点(k≥1). 性质3:在任意一棵二叉树中,若终端结点的个数为n0,度为2的结点数为n2,则n0=n2+1. 证明提示:分支线总数=n0+n1+n2-1=n1+2×n2 性质4:具有n个节点的完全二叉树的深度为[log2n]+1…
本文根据<大话数据结构>一书,实现了Java版的顺序查找.折半查找.插值查找.斐波那契查找. 注:为与书一致,记录均从下标为1开始. 顺序表查找 顺序查找  顺序查找(Sequential Search):从第一个到最后一个记录依次与给定值比较,若相等则查找成功. 顺序查找优化:设置哨兵,可以避免每次循环都判断是否越界.在数据量很多时能提高效率. 时间复杂度:O(n),n为记录的数. 以下为顺序查找算法及其优化的Java代码: package Sequential_Search; /** *…
本文根据<大话数据结构>一书,实现了Java版的二叉排序树/二叉搜索树. 二叉排序树介绍 在上篇博客中,顺序表的插入和删除效率还可以,但查找效率很低:而有序线性表中,可以使用折半.插值.斐波那契等查找方法来实现,但因为要保持有序,其插入和删除操作很耗费时间. 二叉排序树(Binary Sort Tree),又称为二叉搜索树,则可以在高效率的查找下,同时保持插入和删除操作也又较高的效率.下图为典型的二叉排序树. 二叉查找树具有以下性质: (1) 若任意节点的左子树不空,则左子树上所有结点的值均小…
本文根据<大话数据结构>一书及网络资料,实现了Java版的平衡二叉树(AVL树). 平衡二叉树介绍 在上篇博客中所实现的二叉排序树(二叉搜索树),其查找性能取决于二叉排序树的形状,当二叉排序树比较平衡时(深度与完全二叉树相同,[log2n]+1),时间复杂度为O(logn):但也有可能出现极端的斜树,如依照{35,37,47,51,58,62,73,88,91,99}的顺序,构建的二叉排序树就如下图所示,查找时间复杂度为O(n). 图1 斜树 为提高查找复杂度,在二叉排序树的基础上,提出了二叉…
本文根据<大话数据结构>一书,实现了Java版的一个简单的散列表(哈希表). 基本概念 对关键字key,将其值存放在f(key)的存储位置上.由此,在查找时不需比较,只需计算出f(key)便可直接取得所查记录.这个函数 f() 就叫做散列函数,按这个思想建立的表称为散列表. 散列技术即是一种存储方法,又是一种查找方法: 存储过程:根据关键字key,算出f(key),将记录存放在f(key)的位置上: 查找过程:根据关键字key,算出f(key),该位置上的值即为要找的记录. 散列函数的构造方法…
本文根据<大话数据结构>一书,实现了Java版的冒泡排序. 更多:数据结构与算法合集 基本概念 基本思想:将相邻的元素两两比较,根据大小关系交换位置,直到完成排序. 对n个数组成的无序数列,进行n轮排序,每轮按两两比较的方法找出最小(或最大)的一个.下图表示某数列的第一轮排序. 下面为交换元素的swap()方法代码,后面代码中将直接使用. public void swap(int[] a, int i, int j) { int temp; temp = a[j]; a[j] = a[i];…