WordCount程序及测试
Github地址:https://github.com/CG0317/WordCount
PSP表:
PSP2.1 |
PSP阶段 |
预估耗时 (分钟) |
实际耗时 (分钟) |
Planning |
计划 |
30 | 30 |
· Estimate |
· 估计这个任务需要多少时间 |
720 | 1200 |
Development |
开发 |
360 | 600 |
· Analysis |
· 需求分析 (包括学习新技术) |
30 | 120 |
· Design Spec |
· 生成设计文档 |
30 | 30 |
· Design Review |
· 设计复审 (和同事审核设计文档) |
20 | 20 |
· Coding Standard |
· 代码规范 (为目前的开发制定合适的规范) |
20 | 20 |
· Design |
· 具体设计 |
30 | 60 |
· Coding |
· 具体编码 |
300 | 420 |
· Code Review |
· 代码复审 |
30 | 60 |
· Test |
· 测试(自我测试,修改代码,提交修改) |
120 | 240 |
Reporting |
报告 |
30 | 120 |
· Test Report |
· 测试报告 |
30 | 30 |
· Size Measurement |
· 计算工作量 |
10 | 10 |
· Postmortem & Process Improvement Plan |
· 事后总结, 并提出过程改进计划 |
30 | 20 |
合计 |
710 | 1180 |
解题思路:
看到题目首先想到的是上学期编译技术课设实现的编译器,通过对输入文件的词法分析对单词,字符和行进行计数,通过语法分析区分代码行,注释行和空行。所以就参照编译器对这次作业进行实现。主要问题有:代码行,空行和注释行的定义,输入内容的需求及报错,实现过程源代码的管理。
程序设计实现过程:
首先定义判定字符的变量,然后函数wc对单词,行和字符进行计数。对于输入,通过count函数判定输入的正确性,同时实现输入所需求的功能。
代码说明:
函数wc:
void wc()//统计单词,字符,行的数量
{
chars = ;
words = ;
lines = ;
while ((c = fgetc(file)) != EOF)
{
chars++;//字符+1
if (!isSeparator(c))
{
words++;//不是分隔符则单词+1
while ((c = fgetc(file)) != EOF)
{
chars++;
if (!isSeparator(c))
{
}//不是分隔符依然算一个单词,若是则继续判定
else if (isLine(c))//若是新行,行数+1
{
lines++;
break;
}
else if (isSpace(c) || isComma(c) || isTab(c))//单词判定结束
{
break;
}
}
}
else if (isLine(c))
lines++;
}
if (chars !=)//有字符的最后一行无换行符依然令行数+1
lines++;
}
逐个读入字符,字符数+1,若不是分隔符,单词数+1,知道读到分隔符,单词计数结束,循环读入,若读到分隔符为换行符,则行数+1,有字符的最后一行没有换行符但行数显然也应该+1.
count函数部分:
char *resultFile = "result.txt", *fileName = NULL,*outputFile = NULL;
int isc=, isw=, isl=,iso = ;//是否有字符、单词、行数计数和指定文件输出结果的需求
for (int i = ; i < argc; i++)
{
if (strcmp(argv[i], "-o") == )//若有-o,则接着输入指定输出文件名
{
if (iso == )
iso = i;
else
{
cout << "error :input format is wrong." << endl;//参数输入重复
return ;
}
if (i < argc - )
outputFile = argv[i + ];
else
{
cout << "error :output file is empty." << endl;//没有输入指定输出文件报错
return ;
}
}
else if (strcmp(argv[i], "-c") == )
{
if (isc == )
isc = i;
else
{
cout << "error :input format is wrong." << endl;
return ;
}
}
else if (strcmp(argv[i], "-w") == )
{
if (isw == )
isw = i;
else
{
cout << "error :input format is wrong." << endl;
return ;
} }
else if (strcmp(argv[i], "-l") == )
{
if (isl == )
isl = i;
else
{
cout << "error :input format is wrong." << endl;
return ;
} }
else if (i!= && i < && fileName == NULL && argv[i][] != '-')
{
fileName = argv[i];
} }
对输入输出文件定义,按照输入参数的顺序规定输入格式,同时对不规则的输入进行判断,给出错误提示。
输出结果:
fstream resFile;
resFile.open(resultFile, ios_base::out);
for (int i = ; i < argc; i++)
{
if (strcmp(argv[i], "-c") == )
{
cout << "字符数:" << chars << endl;
if (resFile.is_open())
{
resFile << fileName << ", 字符数:" << chars << endl;
}
}
else if (strcmp(argv[i], "-w") == )
{
cout << "单词数:" << words << endl;
if (resFile.is_open())
{
resFile << fileName << ", 单词数:" << words << endl;
}
}
else if (strcmp(argv[i], "-l") == )
{
cout << "行数:" << lines << endl;
if (resFile.is_open())
{
resFile << fileName << ", 行数:" << lines << endl;
}
}
}
resFile.close();
}
将计算结果输入到默认输出文件,若判定有“-o”输入到指定文件。
测试设计过程:
测试需要覆盖程序中所有可执行语句,所以要尽量测试出程序功能的问题,程序易出现风险的地方有:注释行判定,输入参数规范判定,停用词表的判定等。程序功能有,统计单词,字符,行数,统计代码行,注释行,空行数,将统计结果输入到默认或指定文件,递归处理目录下符合条件的文件,排除停用词表内容的单词计数,错误输入的报错等。测试用例对应代码的功能及易出错的地方进行检验,测试用例如下:
test1:测试-c功能
输入:WCtest.exe -c file.c
test2:测试-w功能
输入:WCtest.exe -w file.c
test3:测试-l功能
输入:WCtest.exe -l file.c
test4:测试-a功能
输入:WCtest.exe -a file.c
test5: 测试-o功能
输入:WCtest.exe -c file.c -o outputFile.txt
test6: 测试-e功能
输入:WCtest.exe -c file.c -e stop.txt
test7:测试多个参数共用
输入:WCtest.exe -c -w -l -a file.c -e stop.txt -o outputFile.txt
test8: 测试-s功能
输入:WCtest.exe -s -c -w -l *.c
test9:测试参数错误报错
输入:WCtest.exe -c -c -b file.c
test10:测试输入/输出文件为空报错
输入:WCtest.exe -c -w -o outputFile.txt/WCtest.exe -c -w file.c -o
参考文献如下:
【1】:https://www.cnblogs.com/xiaoyongwu/p/5303132.html
【2】:http://www.cnblogs.com/xinz/p/5044037.html
【3】:http://www.cnblogs.com/xinz/archive/2011/10/22/2220872.html
【4】:http://www.cnblogs.com/xinz/archive/2011/11/20/2255830.html
WordCount程序及测试的更多相关文章
- spark学习11(Wordcount程序-本地测试)
wordcount程序 文件wordcount.txt hello wujiadong hello spark hello hadoop hello python 程序示例 package wujia ...
- WordCount程序与测试
Github地址: https://github.com/hcy6668/wordCount PSP表格: PSP PSP阶段 预估耗时(分钟) 实际耗时(分钟) Planning 计划 60 40 ...
- Hadoop集群测试wordcount程序
一.集群环境搭好了,我们来测试一下吧 1.在java下创建一个wordcount文件夹:mkdir wordcount 2.在此文件夹下创建两个文件,比如file1.txt和file2.txt 在fi ...
- WordCount小程序及测试
Github项目地址:https://github.com/792450735/wc PSP表格: PSP2.1表格[1] PSP2.1 PSP阶段 预估耗时 (分钟) 实际耗时 (分钟) Plann ...
- wordcount程序实现与测试
GitHub地址 https://github.com/jiaxuansun/wordcount PSP表格 PSP PSP阶段 预估耗时(分钟) 实际耗时(分钟) Planning 计划 10 5 ...
- 软件工程:Wordcount程序作业
由于时间的关系,急着交作业,加上这一次也不是那么很认真的去做,草草写了“Wordcount程序”几个功能,即是 .txt文件的读取,能计算出文件内容的单词数,文件内容的字符数,及行数. 这次选用C来做 ...
- Hadoop环境搭建及wordcount程序
目的: 前期学习了一些机器学习基本算法,实际企业应用中算法是核心,运行的环境和数据处理的平台是基础. 手段: 搭建简易hadoop集群(由于机器限制在自己的笔记本上通过虚拟机搭建) 一.基础环境介绍 ...
- hadoop学习笔记——用python写wordcount程序
尝试着用3台虚拟机搭建了伪分布式系统,完整的搭建步骤等熟悉了整个分布式框架之后再写,今天写一下用python写wordcount程序(MapReduce任务)的具体步骤. MapReduce任务以来H ...
- hadoop2.7.x运行wordcount程序卡住在INFO mapreduce.Job: Running job:job _1469603958907_0002
一.抛出问题 Hadoop集群(全分布式)配置好后,运行wordcount程序测试,发现每次运行都会卡住在Running job处,然后程序就呈现出卡死的状态. wordcount运行命令:[hado ...
随机推荐
- windows10环境下运行Debug
1. 什么是Debug? Debug是DOS.Windows都提供的实模式(8086方式)程序的调试工具. 使用它,可以查看CPU各种寄存器中的内容.内存的情况和在机器码级别跟踪程序的运行. 2. 常 ...
- Linux sed 批量替换多个文件中的字符串【转载】
原文网址:http://blog.sina.com.cn/s/blog_730edb930100qzz5.html 比如,要将目录/modules下面所有文件中的zhangsan都修改成lis ...
- 获得Oracke中刚插入的ID ---> GetInsertedID()
(1)首先 需要创建序列: CREATE SEQUENCE SE_TD_POWER MINVALUE 1 NOMAXVALUE START WITH 1 INCREMENT BY 1 NOCYCLE ...
- iOS播放视频
1.首先导入 MediaPlayer import MediaPlayer 2.播放事件 class ViewController:UIViewController{ var pc:MPMoviePl ...
- Java基础--单例类创建和测试
单例模式的主要作用是保证在Java程序中,某个类只有一个实例存在.单例模式有很多好处,它能够避免实例对象的重复创建,不仅可以减少每次创建对象的时间开销,还可以节约内存空间:能够避免由于操作多个实例导致 ...
- springboot+springcloud config
参考:sorry,全找不到了,当时没记录,最后后知后觉觉得应该记录,所以后面的都有在asfood父项目中的doc文件夹下记录,望见谅. 1. springconfig server 1.1. pom. ...
- Spring集成Quartz定时任务框架介绍
在JavaEE系统中,我们会经常用到定时任务,比如每天凌晨生成前天报表,每一小时生成汇总数据等等.我们可以使用java.util.Timer结合java.util.TimerTask来完成这项工作,但 ...
- CRC 简介
CRC wiki,历史发展,各个版本的用途 等 https://en.wikipedia.org/wiki/Cyclic_redundancy_check (apple)crc32.c /* * Th ...
- 数据库:ubantu下MySQL数据库备份方法
1.编辑/etc/crontab文件设定定时任务,在制定时间执行backup_databases.sh vi /etc/crontab # /etc/crontab: system-wide cron ...
- 开发环境入门 linux基础 (部分)正则表达式 grep sed
/etc/profile /etc/bashrc .变量添加到shell环境中,永久生效. /root/.bashrc /root/.bash_profile 正则表达式 定义:正则就是用一些具有特 ...