每天 3 分钟,走上算法的逆袭之路。

前文合集

每日一道 LeetCode 前文合集

代码仓库

GitHub: https://github.com/meteor1993/LeetCode

Gitee: https://gitee.com/inwsy/LeetCode

题目:实现 strStr()

题目来源:https://leetcode-cn.com/problems/implement-strstr/

实现 strStr() 函数。

给定一个 haystack 字符串和一个 needle 字符串,在 haystack 字符串中找出 needle 字符串出现的第一个位置 (从0开始)。如果不存在,则返回  -1。

示例 1:

输入: haystack = "hello", needle = "ll"
输出: 2

示例 2:

输入: haystack = "aaaaa", needle = "bba"
输出: -1

说明:

当 needle 是空字符串时,我们应当返回什么值呢?这是一个在面试中很好的问题。

对于本题而言,当 needle 是空字符串时我们应当返回 0 。这与 C 语言的 strstr() 以及 Java的 indexOf() 定义相符。

解题思路:暴力方案

解题思路?

这道题还搞啥解题思路?

题目都直接把答案写出来了,「这与 C 语言的 strstr() 以及 Java的 indexOf() 定义相符」,我直接用 indexOf() 它不香么?

public int strStr(String haystack, String needle) {
return haystack.indexOf(needle);
}

看着效率,杠杠的,我可真是个小机灵鬼。

但是如果你在面试的时候这么答,会不会被面试打个半死我就不知道了。

那么接下来,最符合常人的暴力思路来袭,我就喜欢干这事儿。

借一张官方的图:

我做一个循环,直接比较 needle 长度的字符串,如果相等就可以直接返回了,如果比到最后没比出来,就返回 -1 ,解题结束。

我就是这么的直接。。。以及。。。暴力。。。

能用暴力解决的问题,绝不多动脑子。

public int strStr_1(String haystack, String needle) {

    int h = haystack.length(), n = needle.length();

    for (int i = 0; i < h - n + 1; i++) {
if (needle.equals(haystack.substring(i, i + n))) {
return i;
}
} return -1;
}

好像结果也还算可以嘛,没有那种慢到不可接受。

解题思路:暴力方案优化

做完题好习惯看看答案,然后知道了我上面的这种暴力方案是基于一个叫 「滑动窗口」 的东西,这个名字倒是蛮形象的。

上面的暴力方案有一个缺点是,会将 haystack 所有长度为 n 的子串都和 needle 做比较,那么能不能少比较几次呢?

当然是可以的,以下内容来源于官网:

  1. 第一件事儿就是只有第一个字符相等的才有比较的意义,如果第一个字符都不相等,这也就不用比了(图片来源于官方)。

  1. 接着一个字符一个字符比较,一旦不匹配了就立刻终止(图片来源于官方)。

截止到目前,都还是很好理解的,下面这一步就稍微有点抽象了,而这个方案的精髓也是下面这一步。

  1. 这里,比较到最后一位的时候发现不匹配,开始回溯。需要注意的是,pn 指针是移动到 pn = pn - curr_len + 1 的位置(图片来源于官方)。

  1. 在这之后,接着 ++pn ,寻找开头和 needle 第一位相同的子串,找到之后重复上面的比较的过程,然后找到了答案置(图片来源于官方)。

实现代码如下(代码来自于官方):

public int strStr_2(String haystack, String needle) {
int L = needle.length(), n = haystack.length();
if (L == 0) return 0; int pn = 0;
while (pn < n - L + 1) {
// 第一次循环 pn ,寻找和 needle 第一位相同的子串
while (pn < n - L + 1 && haystack.charAt(pn) != needle.charAt(0)) ++pn; // 从 pn 开始,按位比较字符,获得相同位数长度 currLen
int currLen = 0, pL = 0;
while (pL < L && pn < n && haystack.charAt(pn) == needle.charAt(pL)) {
++pn;
++pL;
++currLen;
} // 如果 currLen 长度等于 needle 长度,匹配结束
if (currLen == L) return pn - L; // 如果不等于,开始回溯
pn = pn - currLen + 1;
}
return -1;
}

这段代码自己做了字符的循环比较,但是很不幸,这种比较方案要比使用 equals() 来的要慢,我稍微修改下:

public int strStr_3(String haystack, String needle) {
int L = needle.length(), n = haystack.length();
if (L == 0) return 0;
int pn = 0;
while (pn < n - L + 1) {
// 第一次循环 pn ,寻找和 needle 第一位相同的子串
while (pn < n - L + 1 && haystack.charAt(pn) != needle.charAt(0)) ++pn;
// 如果 pn + L 的长度大于当前字符串长度,直接返回 -1
if (pn + L > n) return -1;
// 如果 pn + L 得到的子串和 needle 相同,直接返回 pn
if (haystack.substring(pn, pn + L).equals(needle)) {
return pn;
}
// 没匹配到 ++pn
++pn;
}
return -1;
}

思路还是同样的思路,但是我在字符串的比较换成了 equals() ,耗时重回 1ms 。

抛砖引玉

到这里,我们往回看一个问题,为啥 jdk 提供的 indexOf() 这个方法,可以把耗时压缩到 0ms ?为何 indexOf() 这个方法如此 NB ?

点开源码,找到核心方法(jdk 版本: 1.8.0_221):

static int indexOf(char[] source, int sourceOffset, int sourceCount,
char[] target, int targetOffset, int targetCount,
int fromIndex) {
// 1、当开始查找位置 大于等于 源字符串长度时,如果[查找字符串]为空,则:
// 返回字符串的长度,否则返回-1.
if (fromIndex >= sourceCount) {
return (targetCount == 0 ? sourceCount : -1);
}
// 2、如果 fromIndex 小于 0 ,则从 0 开始查找。
if (fromIndex < 0) {
fromIndex = 0;
}
// 3、如果[查找字符串]为空,则返回 fromIndex
if (targetCount == 0) {
return fromIndex;
}
// 4、开始查找,从[查找字符串]中得到第一个字符,标记为 first
char first = target[targetOffset];
int max = sourceOffset + (sourceCount - targetCount);
// 4.1、计算[源字符串最大长度]
for (int i = sourceOffset + fromIndex; i <= max; i++) {
// 4.2.1、从[源字符串]中,查找到第一个匹配到[目标字符串] first 的位置
// for循环中,增加 while 循环
/* Look for first character. */
if (source[i] != first) {
while (++i <= max && source[i] != first);
}
// 4.2.2、如果在[源字符串]中,找到首个[目标字符串],
// 则匹配是否等于[目标字符串]
/* Found first character, now look at the rest of v2 */
if (i <= max) {
// 4.2.2.1、得到下一个要匹配的位置,标记为 j
int j = i + 1;
// 4.2.2.2、得到其余[目标字符串]的长度,标记为 end
int end = j + targetCount - 1;
// 4.2.2.3、遍历,其余[目标字符串],从 k 开始,
// 如果 j 不越界(小于 end ,表示:其余[目标字符串]的范围),
// 同时[源字符串]==[目标字符串],则
// 自增,继续查找匹配。 j++ 、 k++
for (int k = targetOffset + 1; j < end && source[j]
== target[k]; j++, k++);
// 4.2.2.4、如果 j 与 end 相等,则表示:
// 源字符串中匹配到目标字符串,匹配结束,返回 i 。
if (j == end) {
/* Found whole string. */
return i - sourceOffset;
}
}
}
return -1;
}

这段代码看起来平平无奇,而且查找的方式和我们上面的优化方案非常像,都是先查找首个匹配字符,然后再做循环查找整个匹配的字符串。

单纯的靠代码优化把耗时从 2ms 缩减到了 0ms ,只能是一个大写的佩服,不愧是写 jdk 源码的大神。

每日一道 LeetCode (9):实现 strStr()的更多相关文章

  1. 每日一道 LeetCode (3):回文数

    前文合集 每日一道 LeetCode 文章合集 题目:回文数 题目来源:https://leetcode-cn.com/problems/palindrome-number/ 判断一个整数是否是回文数 ...

  2. 每日一道 LeetCode (5):最长公共前缀

    前文合集 每日一道 LeetCode 前文合集 代码仓库 GitHub: https://github.com/meteor1993/LeetCode Gitee: https://gitee.com ...

  3. 每日一道 LeetCode (6):有效的括号

    每天 3 分钟,走上算法的逆袭之路. 前文合集 每日一道 LeetCode 前文合集 代码仓库 GitHub: https://github.com/meteor1993/LeetCode Gitee ...

  4. 每日一道 LeetCode (8):删除排序数组中的重复项和移除元素

    每天 3 分钟,走上算法的逆袭之路. 前文合集 每日一道 LeetCode 前文合集 代码仓库 GitHub: https://github.com/meteor1993/LeetCode Gitee ...

  5. 每日一道 LeetCode (10):搜索插入位置

    每天 3 分钟,走上算法的逆袭之路. 前文合集 每日一道 LeetCode 前文合集 代码仓库 GitHub: https://github.com/meteor1993/LeetCode Gitee ...

  6. 每日一道 LeetCode (14):数组加一

    每天 3 分钟,走上算法的逆袭之路. 前文合集 每日一道 LeetCode 前文合集 代码仓库 GitHub: https://github.com/meteor1993/LeetCode Gitee ...

  7. 每日一道 LeetCode (15):二进制求和

    每天 3 分钟,走上算法的逆袭之路. 前文合集 每日一道 LeetCode 前文合集 代码仓库 GitHub: https://github.com/meteor1993/LeetCode Gitee ...

  8. 每日一道 LeetCode (19):合并两个有序数组

    每天 3 分钟,走上算法的逆袭之路. 前文合集 每日一道 LeetCode 前文合集 代码仓库 GitHub: https://github.com/meteor1993/LeetCode Gitee ...

  9. 每日一道 LeetCode (41):阶乘后的零

    每天 3 分钟,走上算法的逆袭之路. 前文合集 每日一道 LeetCode 前文合集 代码仓库 GitHub: https://github.com/meteor1993/LeetCode Gitee ...

随机推荐

  1. RocketMQ在面试中那些常见问题及答案+汇总

    0.汇总 RocketMQ入门到入土(一)新手也能看懂的原理和实战! RocketMQ入门到入土(二)事务消息&顺序消息 从入门到入土(三)RocketMQ 怎么保证的消息不丢失? Rocke ...

  2. Azure 提供负载均衡(一)Azure Traffic Manager 为我们的Web项目提供负载均衡

    一,引言 上一篇讲到我们将自己的Net Core Web 项目部署到 Azure 的 Web App 的一项 pass 服务,假如随着项目的日益增长的访问量,之前部署到单节点的应用可能无法保证其稳定性 ...

  3. 解决Kubernetes Pod故障的5个简单技巧

    在很多情况下,你可能会发现Kubernetes中的应用程序没有正确地部署,或者没有正常地工作.今天这篇文章就提供了如何去快速解决这类故障以及一些技巧. 在阅读了这篇文章之后,你还将深入了解Kubern ...

  4. python中if及if-else如何使用

    if 结构 if 结构允许程序做出选择,并根据不同的情况执行不同的操作 基本用法 比较运算符 根据 PEP 8 标准,比较运算符两侧应该各有一个空格,比如:5 == 3. PEP8 标准 ==(相等) ...

  5. 如何在Python对Excel进行读取

    在python自动化中,经常会遇到对数据文件的操作,比如添加多名员工,但是直接将员工数据写在python文件中,不但工作量大,要是以后再次遇到类似批量数据操作还会写在python文件中吗? 应对这一问 ...

  6. 基于Scrapy的B站爬虫

    基于Scrapy的B站爬虫 最近又被叫去做爬虫了,不得不拾起两年前搞的东西. 说起来那时也是突发奇想,想到做一个B站的爬虫,然后用的都是最基本的Python的各种库. 不过确实,实现起来还是有点麻烦的 ...

  7. Image Processing Using Multi-Code GAN Prior, CVPR2020

    论文:Image Processing Using Multi-Code GAN Prior, CVPR2020 代码:https://github.com/genforce/mganprior 这是 ...

  8. 一个在raw里面放着数据库文件的网上例子

    https://www.cnblogs.com/yutingliuyl/p/6880103.html

  9. sed 指定行范围匹配

    sed -n '5,10{/pattern/p}' file sed是一个非交互性性文本编辑器,它编辑文件或标准输入 导出的文件拷贝.标准输入可能是来自键盘.文件重定向.字符串或变量,或者是一个管道文 ...

  10. table标签用法

    <table>标签 HTML中表格由 <table> 标签来定义. 每个表格均有若干行(由 <tr> 标签定义),每行被分割为若干单元格(由 <td> ...