Java统计一篇文章中每个字符出现的个数
大家可以参考下面代码,有什么疑问请留言。。。
import java.io.BufferedReader;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStreamReader;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.Collection;
import java.util.Collections;
import java.util.Comparator;
import java.util.HashMap;
import java.util.HashSet;
import java.util.List;
import java.util.Map;
import java.util.Set; public class CountTheTimesOfCharsAppear {
private static final String filePath = "\\String.txt"; public static void main(String[] args) { Long start = System.nanoTime();
//读取文件
BufferedReader bReader = null;
StringBuffer sBuffer = null; try { bReader = new BufferedReader(new InputStreamReader(new FileInputStream(filePath), "UTF-8")); sBuffer = new StringBuffer(); String line = null;
while ((line = bReader.readLine())!=null) { sBuffer.append(line); } } catch (Exception e) {
// TODO: handle exception
e.printStackTrace();
}finally { if (bReader != null) {
try {
bReader.close();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
} } String data = new String(sBuffer); data.trim(); System.out.println("文件的内容===》"+data); System.out.println(data.length()); //解析文本内容不统计所有文集或者字符出现的次数 //对字符串中的字符进行去重
String newData = RemoveDuplicateChar(data); System.out.println("文件的内容===》"+newData);
System.out.println(newData.length()); List<content> list = new ArrayList<>();
//統計每個字符出現的次數
for(int i=0; i< newData.length();i++) {
int count = 0;
for(int j = 0; j < data.length();j++) { if (newData.charAt(i)== data.charAt(j)) { count++;
}
} list.add(new content(newData.charAt(i),count));
} System.out.println(list);
System.out.println(list.size());
//根據字符出現的次數進行排序
Collections.sort(list, new Comparator<content>() { @Override
public int compare(content o1, content o2) {
// TODO Auto-generated method stub
return o2.getFrequency()-o1.getFrequency();
}
}); System.out.println(list);
System.out.println(list.size()); Long end = System.nanoTime(); System.out.println(end-start);
} //对字符串中的字符进行去重
/**
* Return a String which doesn't contain repetitive characters
* @param data this is the source String to remove the repetitive characters
* @return String
*/
public static String RemoveDuplicateChar(String s) { StringBuffer sb = new StringBuffer();
int i=0;
for(i=0; i<s.length();i++){
char c=s.charAt(i);
if(i==s.indexOf(c)) {
sb.append(c);
}
}
return sb.toString();
} } class content{ private char key;
private int frequency;
public content(char key, int frequency) {
super();
this.key = key;
this.frequency = frequency;
}
public Character getKey() {
return key;
}
public void setKey(char key) {
this.key = key;
}
public int getFrequency() {
return frequency;
}
public void setFrequency(int frequency) {
this.frequency = frequency;
}
@Override
public String toString() {
return "content [key=" + key + ", frequency=" + frequency + "]";
} }
Java统计一篇文章中每个字符出现的个数的更多相关文章
- N个任务掌握java系列之统计一篇文章中单词出现的次数
问题:统计一篇文章中单词出现的次数 思路: (1)将文章(一个字符串存储)按空格进行拆分(split)后,存储到一个字符串(单词)数组中. (2)定义一个Map,key是字符串类型,保存单词:valu ...
- Java统计一个字符串中各个字符出现的次数
相信很多人在工作的时候都会遇到这样一个,如何统计一个字符串中各个字符出现的次数呢,这种需求一把用在数据分析方面,比如根据特定的条件去查找某个字符出现的次数.那么如何实现呢,其实也很简单,下面我贴上代码 ...
- 一篇文章有若干行,以空行作为输入结束的条件。统计一篇文章中单词the(不管大小写,单词the是由空格隔开的)的个数。
#include <iostream>using namespace std; int k = 0;int n = 0;int main() { char c; char a[1000]; ...
- java统计文档中相同字符出现次数(超详细)
public class test { public static void main(String[] args) throws Exception { InputStream file = new ...
- jieba:统计一篇文章中词语数
jieba官方文档 1.jieba分词的四种模式 精确模式.全模式.搜索引擎模式.paddle模式 精确模式:把文本精确的切分开,不存在冗余单词,适合文本分析: 全模式:把文本中所有可能的词语都扫描出 ...
- Python - 统计一篇文章中单词的频率
def frenquence_statistic(file_name): frequence = {} for line in open(file_name,'r').readlines(): wor ...
- js将一篇文章中多个连续的<br>标签替换成两个连续的<br>标签
写本文的目的是今天恰好有一个之前做SEO的同事问我怎样把一篇文章中多个连续的br标签替换成两个连续的br标签,这里就牵涉到SEO层面的问题了. 在做SEO优化的时候,其中有一个需要注意的地方就是尽量减 ...
- 统计一个文件中出现字符'a'的次数
# -*- coding: utf-8 -*- #python 27 #xiaodeng #统计一个文件中出现字符'a'的次数 #http://www.cnblogs.com/hongten/p/ho ...
- Excel 中如何快速统计一列中相同字符的个数(函数法)
https://jingyan.baidu.com/article/6d704a132ea17328da51ca78.html 通过excel快速统计一列中相同字符的个数,如果很少,你可以一个一个数. ...
随机推荐
- BZOJ 2260 商店购物(最小树形图)
不会最小树形图的出门左转 其实如果确定每种商品第一件的购买顺序,那么剩下的商品肯定是以最优惠价格购买的. 如何确定各种商品第一件购买时的最小价值呢? 考虑如果购买了\(a_i\)这种商品,那么就能以\ ...
- HDU 6149 Valley Numer II (状压DP 易错题)
题目大意:给你一个无向连通图(n<=30),点分为高点和低点,高点数量<=15,如果两个高点和低点都直接连边,那么我们称这三个点形成一个valley,每个点最多作为一个valley的组成部 ...
- [USACO17FEB] Why Did the Cow Cross the Road I P (树状数组求逆序对 易错题)
题目大意:给你两个序列,可以序列进行若干次旋转操作(两个都可以转),对两个序列相同权值的地方连边,求最少的交点数 记录某个值在第一个序列的位置,再记录第二个序列中某个值 在第一个序列出现的位置 ,求逆 ...
- JS[获取两个日期中所有的月份]
//------[获取两个日期中所有的月份中] function getMonthBetween(start,end){ var result = []; var s = start.split(&q ...
- ucore_lab1
练习1:理解通过make生成执行文件的过程.(要求在报告中写出对下述问题的回答) 实验过程 静态分析代码. 实验的目录结构如下: . ├── boot ├── kern │ ├── debug │ ...
- java内存管理之内存模型
1,运行时数据区域 1. 程序计数器 (program counter register) 2. Java虚拟机栈 (jvm stack) 3. 本地方法栈 (native method stack) ...
- JDBC连接mysql增删改查整体代码
第一种比较low:用了statment,没有用preparedstatement.另外,插入时,不灵活,不能调用参数,但是如果直接给函数形参的话就会被SQL注入攻击,所以,最好在sql语句中使用?代表 ...
- FreeRTOS系列第13篇---FreeRTOS内核控制
内核控制的一些功能须要移植层提供,为了方便移植.这些API函数用宏来实现,比方上下文切换.进入和退出临界区.禁止和使能可屏蔽中断.内核控制函数还包含启动和停止调度器.挂起和恢复调度器以及用于低功耗模式 ...
- Chisel实验笔记(四)
在<Chisel实验笔记(二)>中.通过编写TestBench文件,然后使用Icarus Verilog.GtkWave能够測试,查看相关波形.比較直观,在<Chisel实验笔记(三 ...
- MAVEN创建并打包web项目
maven项目是由一个maven project和多个maven module组成的,以下简介一下maven webapp的创建和打包,前提是你已经安装配置好maven了. 打开eclipse.依照例 ...