C#统计英文文本中的单词数并排序

思路如下：
1.使用的Hashtable（高效）集合，记录每个单词出现的次数
2.采用ArrayList对Hashtable中的Keys按字母序排列
3.排序使用插入排序（稳定）

public void StatisticsWords(string path)

        {

            if (!File.Exists(path))

            {

                Console.WriteLine("文件不存在！");

                return;

            }

            Hashtable ht = new Hashtable(StringComparer.OrdinalIgnoreCase);

            StreamReader sr = new StreamReader(path, System.Text.Encoding.UTF8);

            string line = sr.ReadLine();

            string[] wordArr = null;

            int num = 0;

            while (line.Length > 0)

            {

                //   MatchCollection mc =  Regex.Matches(line, @"\b[a-z]+", RegexOptions.Compiled | RegexOptions.IgnoreCase);

                //foreach (Match m in mc)

                //{

                //    if (ht.ContainsKey(m.Value))

                //    {

                //        num = Convert.ToInt32(ht[m.Value]) + 1;

                //        ht[m.Value] = num;

                //    }

                //    else

                //    {

                //        ht.Add(m.Value, 1);

                //    }

                //}

                //line = sr.ReadLine();

                wordArr = line.Split(' ');

                foreach (string s in wordArr)

                {

                    if (s.Length == 0)

                        continue;

                    //去除标点

                    line = Regex.Replace(line, @"[\p{P}*]", "", RegexOptions.Compiled);

                    //将单词加入哈希表

                    if (ht.ContainsKey(s))

                    {

                        num = Convert.ToInt32(ht[s]) + 1;

                        ht[s] = num;

                    }

                    else

                    {

                        ht.Add(s, 1);

                    }

                }

                line = sr.ReadLine();

            }

            ArrayList keysList = new ArrayList(ht.Keys);

            //对Hashtable中的Keys按字母序排列

            keysList.Sort();

            //按次数进行插入排序【稳定排序】，所以相同次数的单词依旧是字母序

            string tmp = String.Empty;

            int valueTmp = 0;

            for (int i = 1; i < keysList.Count; i++)

            {

                tmp = keysList[i].ToString();

                valueTmp = (int)ht[keysList[i]];//次数

                int j = i;

                while (j > 0 && valueTmp > (int)ht[keysList[j - 1]])

                {

                    keysList[j] = keysList[j - 1];

                    j--;

                }

                keysList[j] = tmp;//j=0

            }

            //打印出来

            foreach (object item in keysList)

            {

                Console.WriteLine((string)item + ":" + (string)ht[item]);

            }

        }

C#统计英文文本中的单词数并排序的更多相关文章

python统计一个文本中重复行数的方法
python统计一个文本中重复行数的方法这篇文章主要介绍了python统计一个文本中重复行数的方法,涉及针对Python中dict对象的使用及相关本文的操作,具有一定的借鉴价值,需要的朋友可以参考下 ...
python统计英文文本中的回文单词数
1. 要求: 给定一篇纯英文的文本,统计其中回文单词的比列,并输出其中的回文单词,文本数据如下: This is Everyday Grammar. I am Madam Lucija And I a ...
C++语言，统计一篇英文文章中的单词数（用正则表达式实现）
下面的例子展示了如何在C++11中,利用regex_search()统计一篇英文文章中的单词数: #include <iostream> #include <regex> #i ...
统计英文文章中各单词的频率，打印频率最高的十个单词（C语言实现）
一.程序思路及相关代码首先打开文件,代码如下 FILE *fp; char fname[10]; printf("请输入要分析的文件名:\n"); scanf("%s ...
python统计文本中每个单词出现的次数
.python统计文本中每个单词出现的次数: #coding=utf-8 __author__ = 'zcg' import collections import os with open('abc. ...
HashMap 统计一个字符串中每个单词出现的次数
HashMap 统计一个字符串中每个单词出现的次数 import java.util.HashMap; import java.util.Map; public class Test { public ...
Perl-统计文本中各个单词出现的次数（NVDIA2019笔试）
1.原题 2.perl脚本 print "================ Method 1=====================\n"; open IN,'<','an ...
翻译器DIY它———算在英文文本中的单词数，字符和行数
咳咳.这部分应该是序列化编译器DIY的,然而,在这样做DIY第一次使用前flex 为了练练手,对于后者的理解是有帮助. 在word 我经常看到一个字计数功能,因此,它是如何实现,当然,首先想到的是要经 ...
使用hadoop统计多个文本中每个单词数目
程序源码 import java.io.IOException; import java.util.StringTokenizer; import org.apache.hadoop.conf.Con ...

随机推荐

新版Eclipse使用遇到的问题总结
1.SDK下载很慢. 配置SDK代理,速度像飞一样.建议先把20-24下完,不然后面遇到很多问题. 2.support-v7的问题例如res\values\styles.xml:4: error: ...
HTTP接口开发专题二（发送http请求的接口工具类）
import java.io.BufferedReader; import java.io.ByteArrayOutputStream; import java.io.IOException; imp ...
我的Linux之路——windows10用WMware安装CentOS6.9 虚拟机详细步骤
出自:http://blog.51cto.com/13438667/2059926 一.安装环境 windows10操作系统物理机VMware Workstation 软件(可以在网上下载)CentO ...
如何显示当前Mipmap级别？
[如何显示当前Mipmap级别?] 乘以 mainTextureSize/mipTextureSize是为了让mipColorsTexture纹理与mainTexture级别对应.直接用uv是不行的, ...
A* 算法求第k短路径
A*算法是一类贪心算法,其可以用于寻找最优路径.我们可以利用A*算法来求第k短路径. 一条路径可以由两部分组成,第一部分是一个从出发到达任意点的任意路径,而第二部分是从第一部分的末端出发,到终点的最短 ...
JavaScript中的一些小技巧
js 数字操作:1.1 取整:取整有很多方法如: parseInt(a,10); Math.floor(a); a>>0; ~~a; a|0; 前面2种是经常用到的,后面3种算是比较偏的, ...
http和socket之长连接和短连接区别（转）
TCP/IP TCP/IP是个协议组,可分为三个层次:网络层.传输层和应用层. 在网络层有IP协议.ICMP协议.ARP协议.RARP协议和BOOTP协议. 在传输层中有TCP协议与UDP协议. 在应 ...
RTX Server SDK跨服务器如何调用
1. 确认安装RTX Server SDK在开发的机器上必须确认已经安装了RTX Server SDK,并且与RTX Server的版本要一致.该计算机后面我们简称SDK计算机. 2. 步骤2 ...
CentOS 6.5 下安装 Sun JDK 1.7
下载 http://www.oracle.com/technetwork/java/javase/downloads/jdk7-downloads-1880260.html 得到 jdk-7u51-l ...
QuickSort模板
#include <iostream> using namespace std; struct node { int index; char name[20]; }; node data[ ...

C#统计英文文本中的单词数并排序

C#统计英文文本中的单词数并排序的更多相关文章

随机推荐

热门专题