LeetCode算法题-Most Common Word(Java实现)
这是悦乐书的第321次更新,第342篇原创
01 看题和准备
今天介绍的是LeetCode算法题中Easy级别的第190题(顺位题号是819)。给定一个段落和一组禁止词,返回不在禁止词列表中的最常用词。段落中保证至少有一个词没有被禁止,并且答案是独一无二的。禁用单词列表中的单词以小写字母给出,没有标点符号。段落中的单词不区分大小写。答案是小写的。例如:
输入:
paragraph = "Bob hit a ball, the hit BALL flew far after it was hit."
banned = ["hit"]
输出: "ball"
说明:“hit”出现了3次,但这是一个被禁止的词。“ball”出现了两次(没有其他单词),因此它是段落中最常见的非禁止词。请注意,段落中的单词不区分大小写,标点符号被忽略(即使与单词相邻,例如“ball,”),并且“hit”不是答案,即使出现的次数最多,却是一个被禁止的单词。
注意:
1 <= paragraph.length <= 1000.
0 <= banned.length <= 100.
1 <= banned[i].length <= 10.
答案是唯一的,并用小写字母书写(即使它在段落中的出现可能有大写符号,即使它是一个专有名词。)
段落只包含字母,空格或标点符号!?',;.。
没有连字符或带连字符的单词。
单词仅由字母组成,从不包含撇号或其他标点符号。
本次解题使用的开发工具是eclipse,jdk使用的版本是1.8,环境是win7 64位系统,使用Java语言编写和测试。
02 第一种解法
既然题目中说段落字符串会包含标点符号,那么我们先将标点符号替换为空格,并且转为小写,然后遍历禁止单词数组,将段落中出现的禁止单词也替换掉,得到一个新的段落字符串。
因为要计算哪个单词出现的次数最多,所以需要借助HashMap来统计新段落字符串中,每个单词的出现次数。对新段落字符串根据空格拆分,然后存入HashMap中,最后遍历HashMap,找到出现次数最多的字符串单词。
public String mostCommonWord(String paragraph, String[] banned) {
String str = paragraph.toLowerCase();
str = str.replace(",", " "); //!?',;.
str = str.replace("!", " ");
str = str.replace("?", " ");
str = str.replace("'", " ");
str = str.replace(";", " ");
str = str.replace(".", " ");
for (String s : banned) {
str = str.replaceAll(s, "");
}
String[] arr = str.split(" ");
Map<String, Integer> map = new HashMap<String, Integer>();
for (String ss : arr) {
if (!ss.trim().isEmpty()) {
map.put(ss.trim(), map.getOrDefault(ss.trim(), 0)+1);
}
}
int max = Integer.MIN_VALUE;
String result = "";
for (Map.Entry<String,Integer> entry : map.entrySet()) {
if (entry.getValue() > max) {
max = entry.getValue();
result = entry.getKey();
}
}
return result;
}
03 第二种解法
第一步,使用双指针,利用字符串截取的方式,将段落字符串中的每个单词截取出来,存入HashMap。有一点需要注意,如果段落中不包含禁止单词,那么右指针是已经走到了字符串最后一位字符的位置,也需要根据左指针的位置来判断是否要存入HashMap,如果左指针小于右指针,就截取两指针中间的字符串存入HashMap。
第二步,遍历禁止单词数组,从HashMap中移除禁止单词。
第三步,遍历HashMap,找出出现次数最多的单词字符串。
public String mostCommonWord2(String paragraph, String[] banned) {
if (paragraph.trim().isEmpty()) {
return "";
}
Map<String, Integer> map = new HashMap<String, Integer>();
int start = 0, end = 0, n = paragraph.length();
while (end < n) {
if (Character.isLetter(paragraph.charAt(end))) {
end++;
} else {
if (end > 0 && Character.isLetter(paragraph.charAt(end-1))) {
String str = paragraph.substring(start, end).toLowerCase();
start = end;
map.put(str, map.getOrDefault(str, 0)+1);
}
start++;
end++;
}
}
if (start < end) {
String str = paragraph.substring(start, end).toLowerCase();
map.put(str, map.getOrDefault(str, 0)+1);
}
for (String s : banned) {
if (map.containsKey(s)) {
map.remove(s);
}
}
int max = Integer.MIN_VALUE;
String result = "";
for (Map.Entry<String,Integer> entry : map.entrySet()) {
if (entry.getValue() > max) {
max = entry.getValue();
result = entry.getKey();
}
}
return result;
}
04 第三种解法
第一步,利用正则表达式,根据段落字符串中的非字母字符拆分为单词数组,依旧使用HashMap,存入单词和其出现次数。
第二步,遍历禁止单词数组,从HashMap中移除禁止单词。
第三步,遍历HashMap,找出出现次数最多的单词字符串。
public String mostCommonWord3(String paragraph, String[] banned) {
if (paragraph.trim().isEmpty()) {
return "";
}
String[] arr = paragraph.toLowerCase().split("\\W+");
Map<String, Integer> map = new HashMap<String, Integer>();
for (String ss : arr) {
map.put(ss, map.getOrDefault(ss, 0)+1);
}
for (String s : banned) {
if (map.containsKey(s)) {
map.remove(s);
}
}
String result = "";
for (String key : map.keySet()) {
if (result == "") {
result = key;
} else if (map.get(key) > map.get(result)) {
result = key;
}
}
return result;
}
05 小结
算法专题目前已日更超过五个月,算法题文章190+篇,公众号对话框回复【数据结构与算法】、【算法】、【数据结构】中的任一关键词,获取系列文章合集。
以上就是全部内容,如果大家有什么好的解法思路、建议或者其他问题,可以下方留言交流,点赞、留言、转发就是对我最大的回报和支持!
LeetCode算法题-Most Common Word(Java实现)的更多相关文章
- LeetCode算法题-Shortest Completing Word(Java实现)
这是悦乐书的第309次更新,第330篇原创 01 看题和准备 今天介绍的是LeetCode算法题中Easy级别的第178题(顺位题号是748).从给定的字典单词中查找最小长度单词,其中包含字符串lic ...
- LeetCode算法题-Detect Capital(Java实现)
这是悦乐书的第251次更新,第264篇原创 01 看题和准备 今天介绍的是LeetCode算法题中Easy级别的第118题(顺位题号是520).给定一个单词,你需要判断其中大写字母的使用是否正确.当下 ...
- LeetCode算法题-Rotate String(Java实现)
这是悦乐书的第317次更新,第338篇原创 在开始今天的算法题前,说几句,今天是世界读书日,推荐两本书给大家,<终身成长>和<禅与摩托车维修艺术>,值得好好阅读和反复阅读. 0 ...
- LeetCode算法题-Rotated Digits(Java实现)
这是悦乐书的第316次更新,第337篇原创 01 看题和准备 今天介绍的是LeetCode算法题中Easy级别的第185题(顺位题号是788).如果一个数字经过180度旋转后,变成了一个与原数字不同的 ...
- LeetCode算法题-Toeplitz Matrix(Java实现)
这是悦乐书的第312次更新,第333篇原创 01 看题和准备 今天介绍的是LeetCode算法题中Easy级别的第181题(顺位题号是766).如果从左上角到右下角的每个对角线具有相同的元素,则矩阵是 ...
- LeetCode算法题-Flood Fill(Java实现)
这是悦乐书的第306次更新,第325篇原创 01 看题和准备 今天介绍的是LeetCode算法题中Easy级别的第173题(顺位题号是733).图像由二维整数数组表示,每个整数表示图像的像素值(从0到 ...
- LeetCode算法题-Image Smoother(Java实现)
这是悦乐书的第282次更新,第299篇原创 01 看题和准备 今天介绍的是LeetCode算法题中Easy级别的第150题(顺位题号是661).给定表示图像灰度的2D整数矩阵M,您需要设计一个平滑器以 ...
- LeetCode算法题-Design LinkedList(Java实现)
这是悦乐书的第300次更新,第319篇原创 01 看题和准备 今天介绍的是LeetCode算法题中Easy级别的第168题(顺位题号是707).设计链表的实现.您可以选择使用单链表或双链表.单链表中的 ...
- LeetCode算法题-Design HashMap(Java实现)
这是悦乐书的第299次更新,第318篇原创 01 看题和准备 今天介绍的是LeetCode算法题中Easy级别的第167题(顺位题号是706).在不使用任何内置哈希表库的情况下设计HashMap.具体 ...
随机推荐
- win2008 ad域控搭建
一.前言 1.1 AD 域服务 什么是目录(directory)呢? 日常生活中使用的电话薄内记录着亲朋好友的姓名.电话与地址等数据,它就是 telephone directory(电话目录):计算机 ...
- web project 解决 中文乱码问题
1.get请求-->在tomcat-->conf-->server.xml <Connector connectionTimeout="20000" por ...
- XML 简介 – 什么是 XML?
XML 指可扩展标记语言(eXtensible Markup Language). XML 被设计用来传输和存储数据. XML 很重要,也很容易学习. <?xml version="1 ...
- std::string 和 CString问题
std::string stdTemp; CString strTemp; strTemp = stdTemp; ;//这一步直接赋值可不可以 因为CString可以接受const char*的 ...
- Zookeeper简介及安装(一)
1 Zookeeper入门1.1 概述Zookeeper是一个开源的分布式的,为分布式应用提供协调服务的Apache项目. 1.2 特点 1.3 数据结构 1.4 应用场景提供的服务包括:统一命名服务 ...
- BeanPostProcessor和BeanFactoryPostProcessor的区别
官方文档: 在Spring核心的1.8章节 使用BeanPostProcessor自定义Bean BeanPostProcessor 接口定义了您可以实现的回调方法,以提供您自己的(或覆盖容器的默认) ...
- 序列式容器————dequeue
#include <deque> 双端队列,可以在队头队尾进行入队出队操作 deque<int> q; q.empty(); q.push_front(s);//将s插入到队头 ...
- 也谈HTTP协议
HTTP(HyperText Transfer Protocol,超文转移协议,超文本传输协议的译法并不严谨.) 一.网络基础 TCP/IP 1.1 TCP/IP 协议族 TCP/IP 协议族是互联网 ...
- eclipse 简单配置
1.安装STS4 help-->Eclipse Maketplace-->search 'STS'-->install 2.代码提示 Window-->preferences- ...
- mysql 安装相关
Mysql 是基于C/S端的管理文件的服务器软件. Mysql简单分为两个软件:1服务器软件 2客户端软件 对于服务器软件中的socket服务器是一只开着的,客户端需要连接,并且还有创建文件删除文件等 ...