c语言统计一个文件中的单词,字符和行数
body, table{font-family: 微软雅黑; font-size: 10pt} table{border-collapse: collapse; border: solid gray; border-width: 2px 0 2px 0;} th{border: 1px solid gray; padding: 4px; background-color: #DDD;} td{border: 1px solid gray; padding: 4px;} tr:nth-child(2n){background-color: #f8f8f8;}
|
#include<stdio.h>
#include<stdlib.h>
#include<string.h>
#define MAX 30
typedef struct node
{
char s[30];
struct node* next;
int count;
}node,*List;
int FindInDict(node **dict,char *s);
//int FindInDict(List dict,char *s);
void InsertToDict(node **dict,char *s);
//void InsertToDict(List dict,char *s);
void FindTop(node *dict,List top[],int n);
int main(int argc,char **argv)
{
FILE *fp=fopen(argv[1],"r");
char ch;
char word[30];
int len=0;
int c_ch=0,c_line=0,c_word=0;
node *dict =(node *)calloc(26,sizeof(node)); //定义动态数组,存放的是相应单词的头结点
node *top[10]={0}; //存放排名前十的单词的指针(内存地址)
int i=0;
fseek(fp,0,SEEK_SET);
if(fp!=NULL)
{
while((ch=fgetc(fp))!=EOF)
//注意这里必须(ch=fgetc(fp)),因为!=优先级高,先算!=结果为1,不加()结果ch=1
{
c_ch++;
len=0;
while(ch>='a'&&ch<='z')
{
word[len++]=ch;
ch=fgetc(fp);
c_ch++;
}
if(len!=0)
{
word[len]='\0';
c_word++;
if(FindInDict(&dict,word)==0)
//if(FindInDict(dict,word)==0)
InsertToDict(&dict,word);
// InsertToDict(dict,word);
}
if(ch=='\n')
c_line++;
}
printf("the number of character is:%d\n", c_ch);
printf("the number of line is:%d\n", c_line + 1);
printf("the number of word is:%d\n", c_word);
FindTop(dict,top,10);
for(i=0;i!=10;++i)
printf("the top %2d word is %-10s, %d\n", i + 1, top[i]->s, top[i]->count);
}
else
perror("fopen:The_Holy_Bible_Res.txt");
system("pause");
return 0;
}
int FindInDict(node **dict,char *s)
{
int index=(s[0]-'a');
node *p=((*dict)+index)->next;
while(p!=NULL)
{
if(strcmp((p->s),s)<0)
p=p->next;
else if(strcmp(p->s,s)>0)
return 0;
else
{
p->count++;
return 1;
}
}
return 0;
} |
void InsertToDict(List *dict,char *s)
{
int index=(s[0]-'a');
node *p=(*dict+index)->next;
node *word=(node *)malloc(sizeof(node));
word->count=1;
strcpy(word->s,s);
word->next=NULL;
if(NULL==p)
{
(*dict+index)->next=word;
}
else
{
if(strcmp(s,p->s)<0)
{
word->next=p;
(*dict+index)->next=word;
return;
}
while(p->next!=NULL)
{
if(strcmp(s,p->next->s)<0)
{
word->next=p->next;
p->next=word;
return;
}
else
p=p->next;
}
if(p->next!=word)
p->next=word;
}
}
int cmp(const void *a,const void *b) //List数组中任意两个元素的地址
{
List *i=(List*)a; //强制转换
List *j=(List*)b;
return ((*j)->count-(*i)->count);
}
void FindTop(List dict,List top[],int n)
{
node *p=dict;
node *q=p->next;
node *tmp[100000]={0};
int i,index=0;
while(p<dict+26)
{
while(q!=NULL)
{
tmp[index++]=q;
q=q->next;
}
p++;
q=p->next;
}
qsort(tmp,index,sizeof(List),cmp);
for(i=0;i<n;++i)
top[i]=tmp[i];
}
|
去除标点符号只要一个一个字符读,判断是标点符号就用空格代替;一个一个字符读是因为一行一行的读或者一个数组一个数组的读虽然能提高效率;但是有可能一个单词只读了一半在数组里数组就读满了,或者有些单词一行末尾没写完又转接写到下一行
c语言统计一个文件中的单词,字符和行数的更多相关文章
- MySQL数据库中统计一个库中的所有表的行数?
今天公司两个远端的数据库主从同步有点问题,查看下wordpress库下所有表的表的条目? mysql> use information_schema;Database changedmysql& ...
- 统计一个文件中出现字符'a'的次数
# -*- coding: utf-8 -*- #python 27 #xiaodeng #统计一个文件中出现字符'a'的次数 #http://www.cnblogs.com/hongten/p/ho ...
- HashMap 统计一个字符串中每个单词出现的次数
HashMap 统计一个字符串中每个单词出现的次数 import java.util.HashMap; import java.util.Map; public class Test { public ...
- js 统计一个字符串中出现的字符最多的字符
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/ ...
- C语言统计一个字符串中单词的个数
假定每一个单词用空格隔开. 样例: 输入:how are you! 输出:3 两种方法: 一: #include <stdio.h> #include <string.h> # ...
- Linux:从文件中搜索关键字并显示行数(cat,grep函数)
假如有test1.txt的格式如下图所示: 有test2.txt的内容如下: 现需将test2.txt含有的关键字的行搜索出来并显示行数 则可以用到命令: cat test1.txt | grep - ...
- 在Windows下通过命令行或者.bat文件统计一个目录中文件数量
在Windows下面怎样通过命令行统计一个目录中文件的数量,或者说,如果在一个.bat文件中,统计一个目录中的文件数量? 我原来以为是不可能的,要编一个vbs程序什么的,后来到网上找了下,发现还真是可 ...
- java算法面试题:编写一个程序,将a.txt文件中的单词与b.txt文件中的单词交替合并到c.txt文件中,a.txt文件中的单词用回车符分隔,b.txt文件中用回车或空格进行分隔。
package com.swift; import java.io.BufferedReader; import java.io.BufferedWriter; import java.io.File ...
- shell统计一个文件里某行出现的次数并排序
话说有个aaa.txt文件,文件内容如下: aaaabbbbccccddddeeeeffffmmmmooooaaaaccccaaaabbbbddddaaaammmmbbbbaaaaoooo 然后面试题 ...
随机推荐
- linux网路编程:字节序(大端、小端、网络、主机)
字节序:就是数据在内存中的存放顺序,也可称之为端模式. 大端模式和小端模式的定义 1) Little-Endian就是低位字节排放在内存的低地址端,高位字节排放在内存的高地址端. 2) Big-End ...
- [Spark性能调优] 第四章 : Spark Shuffle 中 JVM 内存使用及配置内幕详情
本课主题 JVM 內存使用架构剖析 Spark 1.6.x 和 Spark 2.x 的 JVM 剖析 Spark 1.6.x 以前 on Yarn 计算内存使用案例 Spark Unified Mem ...
- Windows下搭建Redis服务器
Redis服务器是当下比较流行的缓存服务器,Redis通常被人拿来和Memcached进行对比.在我看来,应当是各具优势吧,虽然应用场景基本类似,但总会根据项目的不同来进行不通的选用. 我们今天主要讲 ...
- hadoop fs命令
- 新手OTCBTC注册前一定要看的几个步骤!【安全性相关】
纽波特市一位名叫詹姆斯·豪威尔的32岁男子,筹集740万英镑给政府,希望政府同意他挖掘当地的一座垃圾填埋场,因为他有一块保存有7500枚比特币(价值人民币8.3亿)的钱包文件的硬盘,就被埋在这座垃圾填 ...
- (GO_GTD_1)基于OpenCV和QT,建立Android图像处理程序
一.创建新QT工程 一定要是全英文路径,比如"E:\android_qt_opencv\GO_GTD" 由于我们在安装的时候,选择android的工具链,所以在这里会出现以下选择, ...
- C/C++知识点清单02-上
第二章 预处理.const.static与sizeof (上) 在这章编写时,发现了一个不错的帖子.其中对程序预处理语句的基本概念写得还是十分清晰的. (http://www.runoob.com/c ...
- SQLServer 创建服务器和数据库级别审计
概述 在上一篇文章中已经介绍了审计的概念:本篇文章主要介绍如何创建审计,以及该收集哪些审核规范. 一.常用的审核对象 1.1.服务器审核对象 1.FAILED_LOGIN_GROUP( Audit L ...
- 【译】巧用CSS变量实现自动前缀
转:https://www.h5jun.com/post/autoprefixing-with-css-variables-lea-verou.html 最近,当我在制作 markapp.io 这个小 ...
- CAD 二次开发 -- 自动加载开发的DLL
CAD二次开发可以采用写扩展DLL的方式实现.该DLL的函数可以被CAD调用. 但是调用前,必须用命令netload 将该dll加载到CAD. 其实可以修改注册表,当CAD软件启动后,自动加载扩展DL ...