c语言统计一个文件中的单词，字符和行数

body, table{font-family: 微软雅黑; font-size: 10pt} table{border-collapse: collapse; border: solid gray; border-width: 2px 0 2px 0;} th{border: 1px solid gray; padding: 4px; background-color: #DDD;} td{border: 1px solid gray; padding: 4px;} tr:nth-child(2n){background-color: #f8f8f8;}

1、先去除文件标点符号并且把大写改成小写。

#include<stdio.h>

#include<stdlib.h>

#include<string.h>

#define MAX 30

typedef struct node

{

char s[30];

struct node* next;

int count;

}node,*List;

int FindInDict(node **dict,char *s);

//int FindInDict(List dict,char *s);

void InsertToDict(node **dict,char *s);

//void InsertToDict(List dict,char *s);

void FindTop(node *dict,List top[],int n);

int main(int argc,char **argv)

{

FILE *fp=fopen(argv[1],"r");

char ch;

char word[30];

int len=0;

int c_ch=0,c_line=0,c_word=0;

node *dict =(node *)calloc(26,sizeof(node)); //定义动态数组，存放的是相应单词的头结点

node *top[10]={0}; //存放排名前十的单词的指针（内存地址）

int i=0;

fseek(fp,0,SEEK_SET);

if(fp!=NULL)

{

while((ch=fgetc(fp))!=EOF)

//注意这里必须(ch=fgetc(fp)),因为!=优先级高，先算!=结果为1，不加()结果ch=1

{

c_ch++;

len=0;

while(ch>='a'&&ch<='z')

{

word[len++]=ch;

ch=fgetc(fp);

c_ch++;

}

if(len!=0)

{

word[len]='\0';

c_word++;

if(FindInDict(&dict,word)==0)

//if(FindInDict(dict,word)==0)

InsertToDict(&dict,word);

// InsertToDict(dict,word);

}

if(ch=='\n')

c_line++;

}

printf("the number of character is:%d\n", c_ch);

printf("the number of line is:%d\n", c_line + 1);

printf("the number of word is:%d\n", c_word);

FindTop(dict,top,10);

for(i=0;i!=10;++i)

printf("the top %2d word is %-10s, %d\n", i + 1, top[i]->s, top[i]->count);

}

else

perror("fopen:The_Holy_Bible_Res.txt");

system("pause");

return 0;

}

int FindInDict(node **dict,char *s)

{

int index=(s[0]-'a');

node *p=((*dict)+index)->next;

while(p!=NULL)

{

if(strcmp((p->s),s)<0)

p=p->next;

else if(strcmp(p->s,s)>0)

return 0;

else

{

p->count++;

return 1;

}

return 0;

}

void InsertToDict(List *dict,char *s)

{

int index=(s[0]-'a');

node *p=(*dict+index)->next;

node *word=(node *)malloc(sizeof(node));

word->count=1;

strcpy(word->s,s);

word->next=NULL;

if(NULL==p)

{

(*dict+index)->next=word;

}

else

{

if(strcmp(s,p->s)<0)

{

word->next=p;

(*dict+index)->next=word;

return;

}

while(p->next!=NULL)

{

if(strcmp(s,p->next->s)<0)

{

word->next=p->next;

p->next=word;

return;

}

else

p=p->next;

}

if(p->next!=word)

p->next=word;

}

int cmp(const void *a,const void *b) //List数组中任意两个元素的地址

{

List *i=(List*)a; //强制转换

List *j=(List*)b;

return ((*j)->count-(*i)->count);

}

void FindTop(List dict,List top[],int n)

{

node *p=dict;

node *q=p->next;

node *tmp[100000]={0};

int i,index=0;

while(p<dict+26)

{

while(q!=NULL)

{

tmp[index++]=q;

q=q->next;

}

p++;

q=p->next;

}

qsort(tmp,index,sizeof(List),cmp);

for(i=0;i<n;++i)

top[i]=tmp[i];

}

去除标点符号只要一个一个字符读，判断是标点符号就用空格代替；一个一个字符读是因为一行一行的读或者一个数组一个数组的读虽然能提高效率；但是有可能一个单词只读了一半在数组里数组就读满了，或者有些单词一行末尾没写完又转接写到下一行

c语言统计一个文件中的单词，字符和行数的更多相关文章

MySQL数据库中统计一个库中的所有表的行数？
今天公司两个远端的数据库主从同步有点问题,查看下wordpress库下所有表的表的条目? mysql> use information_schema;Database changedmysql& ...
统计一个文件中出现字符'a'的次数
# -*- coding: utf-8 -*- #python 27 #xiaodeng #统计一个文件中出现字符'a'的次数 #http://www.cnblogs.com/hongten/p/ho ...
HashMap 统计一个字符串中每个单词出现的次数
HashMap 统计一个字符串中每个单词出现的次数 import java.util.HashMap; import java.util.Map; public class Test { public ...
js 统计一个字符串中出现的字符最多的字符
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/ ...
C语言统计一个字符串中单词的个数
假定每一个单词用空格隔开. 样例: 输入:how are you! 输出:3 两种方法: 一: #include <stdio.h> #include <string.h> # ...
Linux：从文件中搜索关键字并显示行数（cat,grep函数）
假如有test1.txt的格式如下图所示: 有test2.txt的内容如下: 现需将test2.txt含有的关键字的行搜索出来并显示行数则可以用到命令: cat test1.txt | grep - ...
在Windows下通过命令行或者.bat文件统计一个目录中文件数量
在Windows下面怎样通过命令行统计一个目录中文件的数量,或者说,如果在一个.bat文件中,统计一个目录中的文件数量? 我原来以为是不可能的,要编一个vbs程序什么的,后来到网上找了下,发现还真是可 ...
java算法面试题：编写一个程序，将a.txt文件中的单词与b.txt文件中的单词交替合并到c.txt文件中，a.txt文件中的单词用回车符分隔，b.txt文件中用回车或空格进行分隔。
package com.swift; import java.io.BufferedReader; import java.io.BufferedWriter; import java.io.File ...
shell统计一个文件里某行出现的次数并排序
话说有个aaa.txt文件,文件内容如下: aaaabbbbccccddddeeeeffffmmmmooooaaaaccccaaaabbbbddddaaaammmmbbbbaaaaoooo 然后面试题 ...

随机推荐

微信小程序开发之picker选择器组件用法
picker组件时一个从底部弹起的可滚动的选择器(嵌入页面滚动器组件picker-view查看https://mp.weixin.qq.com/debug/wxadoc/dev/component/p ...
HTTPS、证书与使用Charles抓包
.p1 { margin: 0.0px 0.0px 0.0px 0.0px; font-size: 14.0px; font-family: "Helvetica Neue", & ...
第十三章：Python の网络编程进阶(二)
本課主題 SQLAlchemy - Core SQLAlchemy - ORM Paramiko 介紹和操作上下文操作应用初探堡垒机 SQLAlchemy - Core 连接 URL 通过 cre ...
Effective Java 第三版——18. 组合优于继承
Tips <Effective Java, Third Edition>一书英文版已经出版,这本书的第二版想必很多人都读过,号称Java四大名著之一,不过第二版2009年出版,到现在已经将 ...
go语言前言
1什么是Go? Go是一门开源.并发支持.具有垃圾回收机制.编译性系统编程语言.在静态编译语言的高性能和动态语言的高效开发之间拥有良好平衡点.被称为21世纪的C语言.Go语言已经成为云计算.云存储时代 ...
Spark入门，概述，部署，以及学习（Spark是一种快速、通用、可扩展的大数据分析引擎）
1:Spark的官方网址:http://spark.apache.org/ Spark生态系统已经发展成为一个包含多个子项目的集合,其中包含SparkSQL.Spark Streaming.Graph ...
Latex 学习之旅（一）
学习资料: LaTeX笔记(八)--数学建模专题如何用Markdown写论文? LaTeX排版札记 LaTeX排版札记:part 2-速查手册.导言区.扉页和公式论文格式细节整理汇总 https: ...
flask配置管理
配置管理复杂的项目需要配置各种配置环境,如果设置项缺少可以直接硬编码进来,比如下面的方式: app.config['DEBUG']=True app.config['SECRET_KEY'] = ' ...
java struts学习-拦截器
引言: Struts2拦截器,每个拦截器类只有一个对象实例,即采用单例模式,所有引用这个拦截器的Action都共享这一拦截器类的实例,因此,在拦截器中如果使用类变量,要注意同步问题. • ...
Axios使用说明
vue更新到2.0之后,作者就宣告不再对vue-resource更新,而是推荐的axios,前一段时间用了一下,现在说一下它的基本用法. 首先就是引入axios,如果你使用es6,只需要安装axios ...

c语言统计一个文件中的单词，字符和行数

c语言统计一个文件中的单词，字符和行数的更多相关文章

随机推荐

热门专题