题目描述

一般的文本编辑器都有查找单词的功能,该功能可以快速定位特定单词在文章中的位置,有的还能统计出特定单词在文章中出现的次数。

现在,请你编程实现这一功能,具体要求是:给定一个单词,请你输出它在给定的文章中出现的次数和第一次出现的位置。注意:匹配单词时,不区分大小写,但要求完全匹配,即给定单词必须与文章中的某一独立单词在不区分大小写的情况下完全相同(参见样例1),如果给定单词仅是文章中某一单词的一部分则不算匹配(参见样例2 )。

输入格式

共2行。

第1行为一个字符串,其中只含字母,表示给定单词;

第2行为一个字符串,其中只可能包含字母和空格,表示给定的文章。

输出格式

一行,如果在文章中找到给定单词则输出两个整数,两个整数之间用一个空格隔开,分别是单词在文章中出现的次数和第一次出现的位置(即在文章中第一次出现时,单词首字母在文章中的位置,位置从0开始);如果单词在文章中没有出现,则直接输出一个整数−1。

输入输出样例

输入 #1

To

to be or not to be is a question

输出 #1

2 0

输入 #2

to

Did the Ottoman Empire lose its power at that time

输出 #2

-1


我的分析

乍一看,该题目比传统字符串模式匹配简单。因为单词已经用空格分开,一个单词初始部分匹配不成功就不需要看该单词剩余部分了,直接跳到下一个单词即可。算法中更不存在传统模式匹配中游标i在匹配不成功后还要退回去重新匹配的尴尬处境,全程遍历游标i只需要向右移动而无须回退。我们最终可以轻易地写出时间复杂度为O(n)的算法,n为英文文章的长度。

 

 

然而,第一次提交代码时我居然有部分case没有过!诶?



我眉头微微一皱,发现想要写出对所有case都AC的健壮代码,事情并没有那么简单。。。╮(╯◇╰)╭

 

如何读取带有空格的字符串?是否可考虑了边界问题?比如处理最后一个单词时数组下标会不会越界?是否周全考虑了模式串长于或短于某单词的情况?是否全面考虑了模式串出现在某单词开头,中间,末尾的情况,以保证你的算法不会出现错判?以上个个都是坑,稍不注意就会掉进坑里,更恐怖的掉进坑里了你还浑然不觉。

 

说实话,这道题的算法我修修补补,各种断点调试了半天,始终有问题。最后我采取了一个小技巧,就是在原来的单词文章后面再加一个空格,这对于后面防止数组越界和简化一些条件判断都非常有帮助,大大简化了代码。

 

我最终提交并AC的代码如下:

#include<iostream>
using namespace std;
int main(){
string p;
string s;
getline(cin,p); //读取一行字符串(包括空格)
getline(cin,s);
int pos=-1;
int count=0;
s +=' ';
for(int i=0;i<s.length();++i){
//单词和模式串的首字母相同(不分大小写)即开始匹配
if(s[i]==p[0]||abs(s[i]-p[0])==32){ 
int tmp=i; //记录开始匹配时i的位置
bool flag=1;//标志flag为表示匹配是否成功
for(int j=1;j<p.length();++j){
i++;
if(s[i]!=p[j]&&abs(s[i]-p[j])!=32){
flag=0;
break;
}
}
//就算全部匹配,还必须保证除了模式串,
//单词后面是空格而非其他字母,否则不匹配
if(flag==1){
if(s[i+1]!=' '){
flag=0;
}
}
//满足匹配要求,计数加一
//若是第一次匹配成功,记录本次开始匹配的位置
if(flag){
count++;
if(pos==-1) pos=tmp;
}
//跳到下一个单词,保证不在本单词继续匹配了
while(s[i]!=' ') i++;
}
//否则,直接跳到下一个单词
else{
while(s[i]!=' ') i++;
}
}
if(count==0) cout<<"-1"<<endl;
if(count>0) cout<<count<<" "<<pos<<endl;
return 0;
}

洛谷P1308.统计单词数(字符串匹配)的更多相关文章

  1. 洛谷 P1308 统计单词数【字符串+模拟】

    P1308 统计单词数 题目描述 一般的文本编辑器都有查找单词的功能,该功能可以快速定位特定单词在文章中的位置,有的还能统计出特定单词在文章中出现的次数. 现在,请你编程实现这一功能,具体要求是:给定 ...

  2. 洛谷 P1308 统计单词数【字符串处理】

    题目描述 一般的文本编辑器都有查找单词的功能,该功能可以快速定位特定单词在文章中的位置,有的还能统计出特定单词在文章中出现的次数. 现在,请你编程实现这一功能,具体要求是:给定一个单词,请你输出它在给 ...

  3. 洛谷 P1308 统计单词数

    P1308 统计单词数 题目描述 一般的文本编辑器都有查找单词的功能,该功能可以快速定位特定单词在文章中的位置,有的还能统计出特定单词在文章中出现的次数. 现在,请你编程实现这一功能,具体要求是:给定 ...

  4. 洛谷 P1026 统计单词个数

    题目描述 给出一个长度不超过200的由小写英文字母组成的字母串(约定;该字串以每行20个字母的方式输入,且保证每行一定为20个).要求将此字母串分成k份(1<k<=40),且每份中包含的单 ...

  5. 【洛谷】P1308 统计单词数-全AC题解(易理解

    弟弟的混乱代码(易理解 大概 思路: 循环b(被找的字符串),遇空格比较两空格间的长度是否与a(需要查找的字符)相等:不相等继续循环:相等比较内容是否相同(倒数比较,不一样直接退出 ,直到比较到第一个 ...

  6. 洛谷 P1026 统计单词个数 Label:dp

    题目描述 给出一个长度不超过200的由小写英文字母组成的字母串(约定;该字串以每行20个字母的方式输入,且保证每行一定为20个).要求将此字母串分成k份(1<k<=40),且每份中包含的单 ...

  7. [NOIP2001] 提高组 洛谷P1026 统计单词个数

    题目描述 给出一个长度不超过200的由小写英文字母组成的字母串(约定;该字串以每行20个字母的方式输入,且保 证每行一定为20个).要求将此字母串分成k份(1<k<=40),且每份中包含的 ...

  8. 洛谷P1026 统计单词个数【区间dp】

    题目:https://www.luogu.org/problemnew/show/P1026 题意: 给定一个字符串,要求把他分成k段.给定s个单词,问划分成k段之后每段中包含的单词和最大是多少. 一 ...

  9. 洛谷 P1308 统计单词数【string类及其函数应用/STL】

    题目描述 一般的文本编辑器都有查找单词的功能,该功能可以快速定位特定单词在文章中的位置,有的还能统计出特定单词在文章中出现的次数. 现在,请你编程实现这一功能,具体要求是:给定一个单词,请你输出它在给 ...

随机推荐

  1. Disease Manangement 疾病管理

    题目描述 Alas! \(A\) set of \(D (1 <= D <= 15)\) diseases (numbered \(1..D\)) is rshning through t ...

  2. OneinStack - 自动编译环境安装脚本

    https://oneinstack.com/

  3. .Net、ASP.Net、C#、VisualStudio之间的关系是什么

    .Net一般指的是.NetFramework,提供了基础的.Net类,这些类可以被任何一种.Net编程语言调 用,.NetFramework还提供了 CLR.JIT.GC等基础功能. ASP.Net是 ...

  4. 题解 UVA11865 【Stream My Contest】

    最小树形图(朱刘算法)\(+\) 二分答案. 由题意得,我们要在一些有向边中选出一些边,使\(0\)号节点能够到达其他节点,使距离之和\(\leqslant cost\),并且使每条边中的带宽的最小值 ...

  5. CCNA - Part11 - 隔离广播域的 VLAN 来了

    之前在对交换机的介绍中,我们知道交换机的作用就是隔离广播域,在不需要跨网段传输时,在同一子网中转发数据包从而进行通信.实现的核心原理就是在交换机中拥有一张 MAC 表,记录了对应终端设备和接口之间的关 ...

  6. [leetcode/lintcode 题解] 微软面试题:股票价格跨度

    编写一个 StockSpanner 类,它收集某些股票的每日报价,并返回该股票当日价格的跨度. 今天股票价格的跨度被定义为股票价格小于或等于今天价格的最大连续日数(从今天开始往回数,包括今天). 例如 ...

  7. ~~并发编程(十一):GIL全局解释锁~~

    进击のpython ***** 并发编程--GIL全局解释锁 这小节就是有些"大神"批判python语言不完美之处的开始 这一节我们要了解一下Cpython的GIL解释器锁的工作机 ...

  8. R 数据读取与写入

    路径 getwd() #获取当前工作路径 setwd() #设置工作路径 获取普通文本数据 x = read.table("data.txt") #通过路径直接获取 x = rea ...

  9. pandas之时间数据

    1.时间戳Timestamp() 参数可以为各种形式的时间,Timestamp()会将其转换为时间. time1 = pd.Timestamp('2019/7/13') time2 = pd.Time ...

  10. c++ string类型举例(递归预习的边界)

    #include <iostream> #include <string> using namespace std; int main ( ) { string str; // ...