WordCount C语言实现求文本的字符数,单词数,行数
1.码云地址:
https://gitee.com/miaomiaobobo/WordCount
2.psp表格
PSP2.1表格
PSP2.1 |
PSP阶段 |
预估耗时 (分钟) |
实际耗时 (分钟) |
Planning |
计划 |
25 |
20 |
· Estimate |
· 估计这个任务需要多少时间 |
10 |
5 |
Development |
开发 |
200 |
350 |
· Analysis |
· 需求分析 (包括学习新技术) |
25 |
20 |
· Design Spec |
· 生成设计文档 |
30 |
20 |
· Design Review |
· 设计复审 (和同事审核设计文档) |
20 |
40 |
· Coding Standard |
· 代码规范 (为目前的开发制定合适的规范) |
20 |
15 |
· Design |
· 具体设计 |
20 |
40 |
· Coding |
· 具体编码 |
200 |
300 |
· Code Review |
· 代码复审 |
20 |
40 |
· Test |
· 测试(自我测试,修改代码,提交修改) |
30 |
60 |
Reporting |
报告 |
20 |
20 |
· Test Report |
· 测试报告 |
15 |
10 |
· Size Measurement |
· 计算工作量 |
10 |
10 |
· Postmortem & Process Improvement Plan |
· 事后总结, 并提出过程改进计划 |
20 |
30 |
合计 |
665 |
950 |
误差分析:本次项目的主要误差存在于具体的编码和开发阶段,因为前期自己对文件的使用不熟悉以及上传到码云的初次接触,导致在这些地方耗费了大量的时间(总计多出200分钟左右)
3.需求功能分析
WordCount的需求:能够通过cmd执行.exe程序,并且传入文本文件,然后对其中的字符数,单词书,行数进行计算,并将结果保存在.exe程序的同级别目录下。
解题思路:1.通过cmd的命令行向main函数中传入操作方式与相应的文件。
2.通过设置flag记录上一个字符是否为空格结合当前是否为空格来判断单词数;
3.判断是否有“\n”来 确定行数。
其中,C语言实现WordCount参考链接:https://www.cnblogs.com/xiaobao123/articles/9649687.html
字符指针数组的空间分配参考链接:https://www.cnblogs.com/mensanu/p/7979462.html
4.程序设计
程序总共包含4个函数(main,countw,countc,countl)其中,main为主函数,通过传入的操作数不同分别调用不同的函数,
主要的模块有:
1.单词数的统计,当遇到空格时,如果上一个字符不是空格,则可判断这是一个新单词
while(fgets(buffer, , fp) != NULL){
bufferLen = strlen(buffer); for(i=; i<bufferLen; i++){
c = buffer[i];
if( c==' ' || c=='\t'){
!isLastBlank && wordNum++; //当上一个不是空格,而这一个是空格时单词数+1
isLastBlank = ;//表明一个空格
}else if(c!='\n'&&c!='\r'){ isLastBlank = ;
}
}
!isLastBlank && wordNum++;
2.主函数,将cmd的操作指令传入,并通过函数strcmp进行比较,调用不同的函数:
int main(int argc,char* argv[]){
char filname[];
char operation;
int totalline;//总行数
int toalchar;//总字符数
int totalword;//总单词数
if(!strcmp(argv[],"-w"))
countw(argv[]);
else if(!strcmp(argv[],"-c")) countc(argv[]);
else if(!strcmp(argv[],"-l"))
countl(argv[]);
return ;
}
5.具体代码(具体代码也可参考码云链接中的.cpp文件)
#include <stdio.h>
#include <string.h>
#include<malloc.h>
int countw(char *filename);
int countc(char *filename);
int countl(char *filename); int main(int argc,char* argv[]){
char filname[];
char operation;
int totalline;//总行数
int toalchar;//总字符数
int totalword;//总单词数
if(!strcmp(argv[],"-w"))
countw(argv[]);
else if(!strcmp(argv[],"-c")) countc(argv[]);
else if(!strcmp(argv[],"-l"))
countl(argv[]);
return ;
} int countw(char *filename){
FILE *fp=NULL;
FILE *fp2=NULL;
char buffer[];
int bufferLen;
int i;
char c;
int isLastBlank = ;
int totalword=;
int wordNum = ;
if( (fp=fopen(filename, "rb")) == NULL ){
perror(filename);
return NULL;
} while(fgets(buffer, , fp) != NULL){
bufferLen = strlen(buffer); for(i=; i<bufferLen; i++){
c = buffer[i];
if( c==' ' || c=='\t'){
!isLastBlank && wordNum++; //当上一个不是空格,而这一个是空格时单词数+1
isLastBlank = ;//表明一个空格
}else if(c!='\n'&&c!='\r'){ isLastBlank = ;
}
}
!isLastBlank && wordNum++;
isLastBlank = ;
totalword += wordNum;
wordNum = ;
}
printf("totalword:%d ",totalword);
fp2=fopen("result.txt","a");
if(fp2){
fprintf(fp2,"单词总数:%d\n",totalword);
fclose(fp2);
}
return ;
}
int countc(char *filename){ FILE *fp=NULL;
FILE *fp2=NULL;
char buffer[];
int bufferLen;
int i;
char c;
int isLastBlank = ;
int totalchar=;
int charNum = ;
if( (fp=fopen(filename, "rb")) == NULL ){
perror(filename);
return NULL;
}
while(fgets(buffer, , fp) != NULL){
bufferLen = strlen(buffer);
for(i=; i<bufferLen; i++){
c = buffer[i];
if( c==' ' || c=='\t'){
isLastBlank = ;//字符不统计空格
}else if(c!='\n'&&c!='\r'){
charNum++;
isLastBlank = ;
}
} isLastBlank = ; totalchar += charNum; charNum = ; }
printf("totalchar:%d",totalchar);
fp2=fopen("result.txt","a");
if(fp2){
fprintf(fp2,"字符总数:%d\n",totalchar);
fclose(fp2);
}
return ;
} int countl(char *filename){
FILE *fp=NULL;
FILE *fp2=NULL;
char buffer[];
int bufferLen;
int i;
char c;
int totalline=-;
if( (fp=fopen(filename, "rb")) == NULL ){
perror(filename);
return NULL;
} while(fgets(buffer, , fp) != NULL){
bufferLen = strlen(buffer);
for(i=; i<bufferLen; i++){
c=buffer[i];
if(c=='\n'||c=='\r'){
totalline++; }
}
}
printf("totalline:%d",totalline);
fp2=fopen("result.txt","a");
if(fp2){
fprintf(fp2,"总行数:%d\n",totalline);
fclose(fp2);
}
return ; }
All Code
6.本程序的测试
cmd测试命令行:
待测试的文件:
处理的结果:
7.个人项目总结
本次项目,学到的很多新知识。但是在项目开始的时候,我本来对文本的处理不是很熟悉,所以在这方面花费了很多时间,之后通过cmd运行可执行文件也耗费了我大量的时间。所以,这个项目虽然实现的功能比较简单,但总的花费我差不多一天的时间,但收获也是巨大的,也明白了自己的不足。项目本身存在着一些缺陷,包括对错误操作的提示不足,只能进行单一文件处理等,都需要改进。
8.参考资料
1.C语言实现WordCount参考链接:https://www.cnblogs.com/xiaobao123/articles/9649687.html
2. 字符指针数组的空间分配参考链接:https://www.cnblogs.com/mensanu/p/7979462.html
3.%s在c语言中对于空格的处理 : http://bbs.bccn.net/thread-352772-1-1.html
4.git的使用:https://www.liaoxuefeng.com/wiki/0013739516305929606dd18361248578c67b8067c8c017b000/
WordCount C语言实现求文本的字符数,单词数,行数的更多相关文章
- c - 统计字符串"字母,空格,数字,其他字符"的个数和行数.
#include <stdio.h> #include <ctype.h> using namespace std; /* 题目:输入一行字符,分别统计出其中英文字母.空格.数 ...
- java语言实现对程序设计语言源文件统计字符数、单词数、行数及其他拓展功。
本次作业Github项目地址:https://github.com/YiChenglong2018/WordCount 一.项目简介 本项目的需求可以概括为:对程序设计语言源文件统计字符数.单词数.行 ...
- 翻译器DIY它———算在英文文本中的单词数,字符和行数
咳咳.这部分应该是序列化编译器DIY的,然而,在这样做DIY第一次使用前flex 为了练练手,对于后者的理解是有帮助. 在word 我经常看到一个字计数功能,因此,它是如何实现,当然,首先想到的是要经 ...
- C++实现文件内字符数、单词数、行数的统计
先给出github上的代码链接以及项目需求 1. 项目简介 这个项目的需求可以概括为:对程序设计语言源文件统计字符数.单词数.行数,统计结果以指定格式输出到默认文件中,以及其他扩展功能,并能够快速地处 ...
- Android 简单统计文本文件字符数、单词数、行数Demo
做的demo是统计文本文件的字符数.单词数.行数的,首先呢,我们必须要有一个文本文件.所以我们要么创建一个文本文件,并保存,然后再解析:要么就提前把文本文件先放到模拟器上,然后检索到文本名再进行解析. ...
- java:打印菱形图案(传参打印的自定义字符和行数)
打印菱形图案: 代码实现: public class Hello { public static void main(String args[]) { LingXingPrint("#&qu ...
- 如何修改word文档中每行字符的最大默认值和每页最大行数默认值
事情起因是这样的,小明在写论文的过程中,发现自己的文档的字与字的间距看起来比其他人的字符间距大,于是觉得奇怪,明明设置了一样的格式啊,设置每行38个字符,每页34行,为什么小明写的文档字符间距看着比较 ...
- Swift语言指南(十)--字符串与字符
原文:Swift语言指南(十)--字符串与字符 字符串是一段字符的有序集合,如"hellow,world"或"信天翁".Swift 中的字符串由 String ...
- python_计算一段文本各个字符的出现个数
>题目要求 任意给定一段文本,求出每个字符出现的个数,并且打印出来 >程序实现 import pprint str01 = "重庆市,简称巴和渝,别称山城.渝都.雾都.桥都,中华 ...
随机推荐
- Python 3 Mysql 增删改查
import pymysql import datainfo import time #获取参数 host = datainfo.host username = datainfo.username p ...
- APUE(3)---文件I/O (3)
十二.函数sync.fsync和fdatasync 延迟写:传统的Unix系统在内核中设有缓冲区或页高速缓冲,大多数磁盘I/O都通过缓冲区进行,当我们向文件写入数据时,内核通常先将数据复制到缓冲区,然 ...
- 推荐一款优秀的代码编辑软件--Source Insight
“工欲善其事,必先利其器”,好的工具能够提高我们办事的效率,进而提升团队乃至企业的竞争力. 对于软件开发工程师来说,选择一款优秀的代码编辑软件也是很重要的.最近,我看到有很多同事还在用微软的VC ++ ...
- Python之set集合与collections系列
1>set集合:是一个无序且不重复的元素集合:访问速度快,解决了重复的问题: s2 = set(["che","liu","haha" ...
- Delphi xe5如何使用Bluestacks模拟器(用真机或者用猩猩,夜神模拟器,自带的不好用)
首先,关于这个模拟器问题比较纠结,这是一个关于adb的问题. Delphi XE5会自动识别模拟器和真机,但是你必须先打开模拟器在打开Delphi IDE(Delphi开发环境),否则还得麻烦一会儿. ...
- XE5安卓手机要求
1 ARMv7 的 CPU v6 的肯定不支持.2 黑屏是因为你的手机 CPU 不支持 NEON 特性.或者是 T2 CPU.3 系统版本 2.3.3 到 2.3.9 或者 4.0 以上.4. SD ...
- win10与子系统Ubuntu 相关配置
系统间 文件访问: 1. 在win10环境下访问Ubuntu文件系统的home目录:C:\Users\xxx\AppData\Local\Packages\CanonicalGroupLimited. ...
- 870. Advantage Shuffle
Given two arrays A and B of equal size, the advantage of A with respect to B is the number of indice ...
- OCP 12c最新考试原题及答案(071-6)
6.(4-21) choose the best answer: View the Exhibit and examine the structure of the CUSTOMERS table. ...
- 贪心——Prim算法(避圈法)
1.简介 Prim算法是图论中的一种算法,可在带权连通图里搜索产生最小生成树. 该算法于1930年由捷克数学家沃伊捷赫·亚尔尼克(Vojtěch Jarník)发现:并在1957年由美国计算机科学家罗 ...