strStr()函数的用途是在一个字符串S中寻找某个字串P第一次出现的位置。并返回其下标,找不到时返回-1。最简单的办法就是找出S全部的子串和P进行比較,然而这种方法比較低效。假设我们从S的下标0和P的下标0開始对每一个字符进行比較,假设相等则下标添加,比較后面的字符。假设两者一直相等直到P的下标达到最大值。则表示在S中找到了P。而且第一次出现的位置为0,返回0,但假设在中间某个位置两个字符不相等时。这时S的下标要退回到1,P的下标回到0。又一次開始比較。

后来,有三个牛认为这样不爽。于是他们搞了一个KMP算法,并以他们三人名字的最開始字符命名这个算法。

这个算法的优点是在比較中的某个位置,两个串的字符不相等时。不须要S回退,而P的下标回退到某个值。然后继续和S当前失配的字符进行比較。

关键就是在这里了。P的下标要回退,退到哪儿啊?我们举个样例,S为“abcabcabeg”,P为"abcabe",从下标0開始比較,一直到下标5才发现字符不相等,S相应字符为c。P相应字符为e。这时候。我们就考查P中下标5曾经的字符串,即“abcab”。对于这个字符串,S下标5之前也存在相同的串。我们还发现这个串的前缀和后缀都有“ab”,即下标0、1和3、4分别组成的字符串相等,同一时候等于S串中下标3、4组成的字符串。因此。我们仅仅须要把P的下标退到2的位置。然后跟S的下标5相应的字符继续比較就可以,由于P的0、1下标相应字符和S的3、4下标相应的字符相等。假设对于每一个失配的位置,我们都这样对P的下标进行调整,而S的下标继续往前而不后退,效率会提高非常多。

如今最大的问题就是怎么计算P失配时应该退回到的下标值。而从前面的分析中能够看出是对字符串的前后缀相等部分的长度来获取的。这样问题就变成了怎么编写代码来较为高效地计算在失配时P调整到的新下标值。

对于P中每一个位置,我们能够计算出在该位置失配时应该调整到的下标,并存放在一个next数组中,比方上面P在下标为5时失配。调整到的新下标为2。则有next[5]等2。

写到这里,发现好像讲得越来越乱了。还是贴我自己的代码吧。事实上KMP最关键也是不太好理解的地方就是对next数组的理解和计算方法。

void fillNext(char* p, int* next)

{

    if(!p) return;

     

    int len = strlen(p);

     

    int i = 1;

    int j = 0;

     

    for(int i = 0; i < len; ++i) next[i] = 0;

     

    while(i < len-1)

    {

        if(p[i] == p[j])

        {

            i++;

            j++;

            next[i] = j;

        }

        else

        {

            if(j == 0)

            {  

                i++;

                next[i] = 0;

            }

            else j = next[j];

        }

    }

}

 

int strStr(char* haystack, char* needle) {

 

    if(!haystack || !needle) return -1;

   

    int len_h = strlen(haystack);

    int len_n = strlen(needle);

 

    if(len_n > len_h) return -1;

     

    if(len_n == 0) return 0;

 

    int* next = malloc(sizeof(int)*len_n);

    fillNext(needle, next);

     

    int i = 0;

    int j = 0;

     

    while(i < len_h)

    {

        if(haystack[i] == needle[j])

        {

            j++;

            i++;

            if(j == len_n)break;

        }

        else

        {

            if(j == 0)i++;

            else j = next[j];

        }

    }

     

    free(next);

 

    if(j == len_n)

    {   

        return i - len_n;

    }

     

    return -1;

}

用KMP算法实现strStr()的更多相关文章

  1. 70. Implement strStr() 与 KMP算法

    Implement strStr() Implement strStr(). Returns a pointer to the first occurrence of needle in haysta ...

  2. Linux GCC下strstr的实现以及一个简单的Kmp算法的接口

    今天做了一道题,要用判断一个字符串是否是另一个字符串的子串,于是查了一下strstr的实现. 代码如下: char *strstr(const char*s1,const char*s2) { con ...

  3. 第3章:LeetCode--算法:strStr KMP算法

    https://leetcode.com/problems/implement-strstr/  28. Implement strStr() 暴力算法: int ViolentMatch(char* ...

  4. 自己对kmp算法的理解,借由 28. 实现 strStr() 为例

    做题思路 or 感想 : 就借由这道题来理解一下kmp算法吧 kmp算法的操作过程我觉得有句话很合适 :KMP 算法永不回退 目标字符串 的指针 i,不走回头路(不会重复扫描 目标字符串),而是借助 ...

  5. KMP算法的优化与详解

    文章开头,我首先抄录一些阮一峰先生关于KMP算法的一些讲解. 下面,我用自己的语言,试图写一篇比较好懂的 KMP 算法解释. 1. 首先,字符串"BBC ABCDAB ABCDABCDABD ...

  6. KMP算法 --- 在文本中寻找目标字符串

    KMP算法 --- 在文本中寻找目标字符串 很多时候,为了在大文本中寻找到自己需要的内容,往往需要搜索关键字.这其中就牵涉到字符串匹配的算法,通过接受文本和关键词参数来返回关键词在文本出现的位置.一般 ...

  7. KMP算法详细分解

    1. 引言 给定一个主串(以 S 代替)和模式串(以 P 代替),要求找出 P 在 S 中出现的位置,此即串的模式匹配问题. Knuth-Morris-Pratt 算法(简称 KMP)是解决这一问题的 ...

  8. 从头到尾测地理解KMP算法【转】

    本文转载自:http://blog.csdn.net/v_july_v/article/details/7041827 1. 引言 本KMP原文最初写于2年多前的2011年12月,因当时初次接触KMP ...

  9. 很详尽KMP算法(厉害)

    作者:July时间:最初写于2011年12月,2014年7月21日晚10点 全部删除重写成此文,随后的半个多月不断反复改进.后收录于新书<编程之法:面试和算法心得>第4.4节中. 1. 引 ...

随机推荐

  1. Centos7下部署ceph 12.2.1 (luminous)集群及RBD使用

    前言 本文搭建了一个由三节点(master.slave1.slave2)构成的ceph分布式集群,并通过示例使用ceph块存储. 本文集群三个节点基于三台虚拟机进行搭建,节点安装的操作系统为Cento ...

  2. 从ELK到EFK演进

    背景 作为中国最大的在线教育站点,目前沪江日志服务的用户包含网校,交易,金融,CCTalk 等多个部门的多个产品的日志搜索分析业务,每日产生的各类日志有好十几种,每天处理约10亿条(1TB)日志,热数 ...

  3. 双11Java程序员书单推荐

    Java <Java核心技术卷I> <Java核心技术卷II> <Java编程思想> <Java并发编程实战> <Effective Java&g ...

  4. 爱pia戏推出PC客户端,为您自动置顶窗口,方便查找

    爱pia戏推出PC客户端, 可以在无法使用插件的时候,使用PC客户端, 将为您自动置顶窗口,方便查看剧本. 百度网盘下载地址: 链接: http://pan.baidu.com/s/1pLpvn5p ...

  5. 几种文件查找命令,whereis ,find ,locate.

    whereis对于文件的查找,是将系统内的所有文件放在一个数据库文件里.whereis 和 locate 都是以该数据库为准的(由于每个数据库会有一个更新时间,一般在更新时间之后才可以找到).而fin ...

  6. tcprstat

    tcprstat http://www.percona.com/docs/wiki/tcprstat:start 监控网络流量情况,计算请求的响应时间(the delay between reques ...

  7. Mysql 用法

    一转眼,一个星期过去了,来到测试班也一个星期了,今天经历了一次,这是自己这一周的总结,也算对自己这一周的一个交代. 几个比较重要的语句: 查看数据库 show databases; 创建数据库 cre ...

  8. 以太网接口芯片W5300使用说明

    一.芯片简介 引用百度百科对芯片的一个简介,我就不再赘述. W5300的目标是在高性能的嵌入式领域,如多媒体数据流服务.与WIZnet现有的芯片方案相比较,W5300在内存空间和数据处理能力等方面都有 ...

  9. java面向对象整理

    1.局部变量与全局变量的区别 区别一:定义的位置不同 定义在类中的变量是成员变量 定义在方法中或者{}语句里面的变量是局部变量定义 区别二:在内存中的位置不同 成员变量存储在对内存的对象中 局部变量存 ...

  10. 一个RtspServer的设计与实现和RTSP2.0简介

    一个RtspServer的设计与实现和RTSP2.0简介   前段时间着手实现了一个RTSP Server,能够正常实现多路RTSP流的直播播放,因项目需要,只做了对H.264和AAC编码的支持,但是 ...