WordCount 程序的实现
WordCount是一个常见的工具,它能统计文本文件的字数、单词数和行数。在本次项目中,要求写一个命令行程序,模仿已有的WordCount.exe的功能,并加以扩充,统计出某程序设计语言源文件的字符数、单词数和行数。在此基础上,还实现了对某程序设计语言源文件的空行、代码行和注释行的统计。
程序处理用户需求的模式为:
wc.exe [parameter][filename]
各个参数的意义
基本功能列表
wc.exe -c file.c 对字符数的统计
wc.exe -w file.c 对单词数的统计
wc.exe -l file.c: 对行数的统计
扩展功能
wc.exe -a 对空行、代码行和注释行的统计
空行:本行全部是空格或格式控制字符,如果包括代码,则只有不超过一个可显示的字符,例如“}”。
代码行:本行包括多余一个字符的代码。
注释行:本行不是代码行,并且本行包括注释。
本项目一共分成了四个模块:分别是字符统计模块、单词统计模块、行数统计模块和综合统计模块,综合统计模块包括代码行、空行和注释行的统计。设计如下:
void CharCount(); //字符统计函数
void WordCount(); //单词统计函数
void LineCount(); //行数统计函数
void Muiltiple(); //综合统计函数,包括代码行,空行,注释行
字符统计模块:
void CharCount() //字符统计函数
{
FILE *fp;
int c = ;
char ch;
if((fp = fopen("file.c","r")) == NULL)
{
printf("file read failure.");
}
ch = fgetc(fp);
while(ch != EOF)
{
c ++;
ch = fgetc(fp);
}
printf("char count is :%d.\n",c);
fclose(fp);
}
本模块以只读的方式打开在程序目录中的file.c文本文件,依次访问文本文件中的每个字符,统计变量依次加1,直到文本文件结束为止。
单词统计模块:
void WordCount() //单词统计函数
{
FILE *fp;
int w = ;
char ch;
if((fp = fopen("file.c","r")) == NULL)
{
printf("file read failure.");
}
ch = fgetc(fp);
while(ch != EOF)
{
if ((ch >= 'a'&&ch <= 'z')||(ch >= 'A'&&ch <='Z')||(ch >= ''&&ch <= ''))
{
while ((ch >= 'a'&&ch <= 'z')||(ch >= 'A'&&ch <= 'Z')||(ch >= ''&&ch <= '')||ch == '_')
{
ch = fgetc(fp);
}
w ++;
ch = fgetc(fp);
}
else
{
ch = fgetc(fp);
}
}
printf("word count is :%d.\n",w);
fclose(fp); }
本模块统计的是以字母、数字和下划线组成,且首字母不为下划线的所有单词。统计过程同字符统计模块,此处不再赘述。
行数统计模块:
void LineCount() //行数统计函数
{
FILE *fp;
int l = ;
char ch;
if((fp = fopen("file.c","r")) == NULL)
{
printf("file read failure.");
}
ch = fgetc(fp);
while(ch != EOF)
{
if (ch == '\n')
{
l ++;
ch = fgetc(fp);
}
else
{
ch = fgetc(fp);
}
}
printf("line count is :%d.\n",l);
fclose(fp);
}
此模块行数的初始化为1,依次访问文本文件中的字符,遇到换行符依次加1,直到文本结束为止。
综合统计模块:
void Muiltiple() //综合统计函数,包括代码行,空行,注释行
{
FILE *fp;
char ch;
int c=,e=,n=;
if((fp = fopen("file.c","r")) == NULL)
{
printf("file read failure.");
}
ch = fgetc(fp);
while(ch != EOF)
{
if (ch == '{'||ch == '}')
{
e ++;
ch = fgetc(fp);
}
else if (ch == '\n')
{
ch = fgetc(fp);
while(ch == '\n')
{
e ++;
ch = fgetc(fp);
}
}
else if (ch == '/')
{
ch = fgetc(fp);
if (ch == '/')
while(ch != '\n')
{
ch = fgetc(fp);
}
n ++;
ch = fgetc(fp);
}
else
{
c ++;
while (ch != '{'&&ch != '}'&&ch != '\n'&&ch != '/'&&ch != EOF)
{
ch = fgetc(fp);
}
} }
printf("code line count is :%d.\n",c);
printf("empt line count is :%d.\n",e);
printf("note line count is :%d.\n",n);
fclose(fp);
}
此模块能够实现对空行、代码行和注释行的统计。依次访问文本文件中的字符,若该字符为“{”或“}”,则空行变量加1。若该字符为两个连续的“/”,则注释行变量加1。否则代码变量加1。依次循坏,直到文本结束为止。
总模块的设计:
int main(int argc,char *argv[])
{
if ((strcmp(argv[], "-c") == ) && (strcmp(argv[], "file.c") == ))
{
CharCount();
} if ((strcmp(argv[], "-w") == ) && (strcmp(argv[], "file.c") == ))
{
WordCount();
}
if ((strcmp(argv[], "-l") == ) && (strcmp(argv[], "file.c") == ))
{
LineCount();
}
if ((strcmp(argv[], "-a") == ) && (strcmp(argv[], "file.c") == ))
{
Muiltiple();
}
return ;
}
总模块对命令行参数中字符串数组进行判断,第一个字符串数组为程序名,若第二个字符串为“-c”、“-w”、“-l”、“-a”,且第三个字符串数组为file.c,则依次调用CharCount、WordCount、LineCount、Muiltiple函数以实现对字符数、单词数、行数和空行数、代码行数和注释行数的统计。
程序运行测试:
需要统计的文本文件:
void main() //main
{
int x,y,s;
scanf("%d%d",&x,&y);
s = Add(int x,int y);
printf("x + y = %d.",s);
} int Add(int x,int y) //Add
{
return x + y;
}

找到程序所在目录。注:需要统计的文本文件file.c在此目录中。
字符数的统计测试:

单词数的统计测试:

行数的统计测试:

对空行数、代码行数、注释行数的统计测试:

本次项目任有没能实现的功能,wc.exe -s递归处理目录下符合条件的文件和wc.exe -x 显示图形界面,用户可以通过界面选取单个文件,程序就会显示文件的字符数、行数等全部统计信息。对于递归处理目录下符合的文件功能,暂时还没有能够很好解决的思想,所以等待下次作业的完善。对于显示图形界面的功能,由于还没有做图形界面的经历,再加上本次项目时间有些仓促,也是没能完美完成。
附上完整代码:
// WC.cpp : Defines the entry point for the console application.
// #include "stdafx.h"
#include "stdio.h"
#include "stdlib.h"
#include "string.h" void CharCount(); //字符统计函数
void WordCount(); //单词统计函数
void LineCount(); //行数统计函数
void Muiltiple(); //综合统计函数,包括代码行,空行,注释行 int main(int argc,char *argv[])
{
if ((strcmp(argv[], "-c") == ) && (strcmp(argv[], "file.c") == ))
{
CharCount();
} if ((strcmp(argv[], "-w") == ) && (strcmp(argv[], "file.c") == )) WordCount();
}
if ((strcmp(argv[], "-l") == ) && (strcmp(argv[], "file.c") == ))
{
LineCount();
}
if ((strcmp(argv[], "-a") == ) && (strcmp(argv[], "file.c") == ))
{
Muiltiple();
}
return ; } void CharCount() //字符统计函数
{
FILE *fp;
int c = ;
char ch;
if((fp = fopen("file.c","r")) == NULL)
{
printf("file read failure.");
}
ch = fgetc(fp);
while(ch != EOF)
{
c ++;
ch = fgetc(fp);
}
printf("char count is :%d.\n",c);
fclose(fp);
} void WordCount() //单词统计函数
{
FILE *fp;
int w = ;
char ch;
if((fp = fopen("file.c","r")) == NULL)
{
printf("file read failure.");
}
ch = fgetc(fp);
while(ch != EOF)
{
if ((ch >= 'a'&&ch <= 'z')||(ch >= 'A'&&ch <='Z')||(ch >= ''&&ch <= ''))
{
while ((ch >= 'a'&&ch <= 'z')||(ch >= 'A'&&ch <= 'Z')||(ch >= ''&&ch <= '')||ch == '_')
{
ch = fgetc(fp);
}
w ++;
ch = fgetc(fp);
}
else
{
ch = fgetc(fp);
}
}
printf("word count is :%d.\n",w);
fclose(fp); } void LineCount() //行数统计函数
{
FILE *fp;
int l = ;
char ch;
if((fp = fopen("file.c","r")) == NULL)
{
printf("file read failure.");
}
ch = fgetc(fp);
while(ch != EOF)
{
if (ch == '\n')
{
l ++;
ch = fgetc(fp);
}
else
{
ch = fgetc(fp);
}
}
printf("line count is :%d.\n",l);
fclose(fp);
} void Muiltiple() //综合统计函数,包括代码行,空行,注释行
{
FILE *fp;
char ch;
int c=,e=,n=;
if((fp = fopen("file.c","r")) == NULL)
{
printf("file read failure.");
}
ch = fgetc(fp);
while(ch != EOF)
{
if (ch == '{'||ch == '}')
{
e ++;
ch = fgetc(fp);
}
else if (ch == '\n')
{
ch = fgetc(fp);
while(ch == '\n')
{
e ++;
ch = fgetc(fp);
}
}
else if (ch == '/')
{
ch = fgetc(fp);
if (ch == '/')
while(ch != '\n')
{
ch = fgetc(fp);
}
n ++;
ch = fgetc(fp);
}
else
{
c ++;
while (ch != '{'&&ch != '}'&&ch != '\n'&&ch != '/'&&ch != EOF)
{
ch = fgetc(fp);
}
} }
printf("code line count is :%d.\n",c);
printf("empt line count is :%d.\n",e);
printf("note line count is :%d.\n",n);
fclose(fp);
}
WordCount 程序的实现的更多相关文章
- 软件工程:Wordcount程序作业
由于时间的关系,急着交作业,加上这一次也不是那么很认真的去做,草草写了“Wordcount程序”几个功能,即是 .txt文件的读取,能计算出文件内容的单词数,文件内容的字符数,及行数. 这次选用C来做 ...
- 标志数在wordcount程序中的应用与拓展
wordcount程序要求测出文本中的单词数,字符数和行数. 设计思路: 将文件读入,逐字检测,检测到空格单词数加一,检测到回车行数单词数加一,如果既不是回车也不是空格则说明是字符,字符数加一 编程时 ...
- Hadoop入门实践之从WordCount程序说起
这段时间需要学习Hadoop了,以前一直听说Hadoop,但是从来没有研究过,这几天粗略看完了<Hadoop实战>这本书,对Hadoop编程有了大致的了解.接下来就是多看多写了.以Hado ...
- [转] 用SBT编译Spark的WordCount程序
问题导读: 1.什么是sbt? 2.sbt项目环境如何建立? 3.如何使用sbt编译打包scala? [sbt介绍 sbt是一个代码编译工具,是scala界的mvn,可以编译scala,java等,需 ...
- Hadoop下WordCount程序
一.前言 在之前我们已经在 CenOS6.5 下搭建好了 Hadoop2.x 的开发环境.既然环境已经搭建好了,那么现在我们就应该来干点正事嘛!比如来一个Hadoop世界的HelloWorld,也就是 ...
- Yarn集群的搭建、Yarn的架构和WordCount程序在集群提交方式
一.Yarn集群概述及搭建 1.Mapreduce程序运行在多台机器的集群上,而且在运行是要使用很多maptask和reducertask,这个过程中需要一个自动化任务调度平台来调度任务,分配资源,这 ...
- Mapreduce概述和WordCount程序
一.Mapreduce概述 Mapreduce是分布式程序编程框架,也是分布式计算框架,它简化了开发! Mapreduce将用户编写的业务逻辑代码和自带默认组合整合成一个完整的分布式运算程序,并发的运 ...
- Hadoop集群测试wordcount程序
一.集群环境搭好了,我们来测试一下吧 1.在java下创建一个wordcount文件夹:mkdir wordcount 2.在此文件夹下创建两个文件,比如file1.txt和file2.txt 在fi ...
- Eclipse环境搭建并且运行wordcount程序
一.安装Hadoop插件 1. 所需环境 hadoop2.0伪分布式环境平台正常运行 所需压缩包:eclipse-jee-luna-SR2-linux-gtk-x86_64.tar.gz 在Linu ...
- 09、高级编程之基于排序机制的wordcount程序
package sparkcore.java; import java.util.Arrays; import java.util.Iterator; import org.apache.spark. ...
随机推荐
- Arcgis for Js之加载wms服务
概述:本节讲述Arcgis for Js加载ArcgisServer和GeoServer发布的wms服务. 1.定义resourceInfo var resourceInfo = { extent: ...
- Maven配置setting.xml值Mirror与Repository区别
1 Repository(仓库) 1.1 Maven仓库主要有2种: remote repository:相当于公共的仓库,大家都能访问到,一般可以用URL的形式访问 local repository ...
- Docker介绍-hc课堂笔记
1,传统模式-多个服务器:申请.安装jdk等.部署环境. 容器-整包,把有东西打包到一起,把这个包放在服务器上. linux中装了docker,起100个服务,改个数字就可以,5分钟左右. 2,虚拟化 ...
- 理解javascript观察者模式(订阅者与发布者)
什么是观察者模式? 观察者模式又叫做发布订阅模式,它定义了一种一对多的关系,让多个观察者对象同时监听某一个主题对象,这个主题对象的状态发生改变时就会通知所有观察着对象.它是由两类对象组成,主题和观察者 ...
- 清北学堂寒假集训DAY1
第一天,上午讲了些基本的技巧和简单算法,主要就是适应这里. 中午跑到食堂吃了顿“饭”(我并没有挖苦233333),然后回宿舍休息休息 因为 迎接我们的是模拟啊啊啊啊啊阿 下午题一发下来,并没有想象中的 ...
- PRML1-引言
本系列是根据<pattern recognition and machine learning>一书写的,算是读书笔记?算是吧.因为是从自己角度出发,所以其实很大程度上自己看得懂,估计别人 ...
- jquery练习笔记
<!DOCTYPE html> <html lang="en" xmlns="http://www.w3.org/1999/xhtml"> ...
- CAN-bus接口控制实验
CAN-bus接口控制实验 2016-04-12 20:38:41来源: eefocus 关键字:CAN bus 接口控制 收藏 评论(0) 分享到 微博 QQ 微信 LinkedIn 一.实 ...
- Exp9 20155218 Web安全基础实践
Exp9 Web安全基础实践 1.实验环境配置: 1.在命令行里执行:java -jar webgoat-container-7.1-exec.jar运行WebGoat,文件夹里明明有了,但是没成功: ...
- 小程序echarts数据不改变,或者是一次渲染成功,第二次进入,渲染失败的解决办法
1.引入echarts插件: import * as echarts from '../../ec-canvas/echarts'; 2.data中定义: ecBar: { onInit: initC ...