从类似如下的文本文件中读取出所有的姓名,并打印出重复的姓名和重复的次数,并按重复次数排序

1,张三,28

2,李四,35

3,张三,28

4,王五,35

5,张三,28

6,李四,35

7,赵六,28

8,田七,35

package com.swift;

import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.util.ArrayList;
import java.util.Collections;
import java.util.Comparator;
import java.util.List;
import java.util.Map;
import java.util.Map.Entry;
import java.util.TreeMap; import org.apache.poi.xwpf.extractor.XWPFWordExtractor;
import org.apache.poi.xwpf.usermodel.XWPFDocument; public class IO_Sort_Select { public static void main(String[] args) throws IOException {
/*
* 从类似如下的文本文件中读取出所有的姓名,并打印出重复的姓名和重复的次数,并按重复次数排序
*/
File file_s = new File("e:\\neck\\data.docx");
File dir = new File("e:\\neck");
if (!dir.exists() && dir.isDirectory()) {
System.out.println("目录不存在,即将创建...");
dir.mkdirs();
}
File file_t = new File(dir, "data.txt"); List<String> list = new ArrayList<String>();
String text = readFromDocx(file_s);
String[] hang = text.split("\\n");
for (int i = 0; i < hang.length; i++) {
String[] lie = hang[i].split("\\,");
for (int j = 0; j < lie.length; j++) {
if (j == 1) {
list.add(lie[j]);
}
} }
printList(list); Map<String, Integer> map = new TreeMap<String, Integer>();
for (String str : list) {
map.put(str, 0);
}
for(String str:list) {
if(map.containsKey(str)) {
int num=map.get(str);
num++;
map.remove(str);
map.put(str, num);
}
}
List<Entry<String,Integer>> listMap=new ArrayList<Entry<String,Integer>>(map.entrySet());
Collections.sort(listMap, new Comparator<Entry<String,Integer>>(){ @Override
public int compare(Entry<String, Integer> arg0, Entry<String, Integer> arg1) {
int num=arg1.getValue()-arg0.getValue();
return num==0?arg0.getKey().compareTo(arg1.getKey()):num;
}
}); for(Entry<String, Integer> entry:listMap) {
System.out.println("重复的姓名是 :"+entry.getKey()+" 重复的次数是:"+entry.getValue());
}
} private static void printList(List<String> list) {
for (String str : list) {
System.out.println(str);
}
} public static String readFromDocx(File file) throws IOException { FileInputStream fis = new FileInputStream(file);
XWPFDocument docx = new XWPFDocument(fis);
XWPFWordExtractor extractor = new XWPFWordExtractor(docx);
String text = extractor.getText();
return text; } }

上面代码读取的是docx的word文件,直接读取会出现乱码,因word中不仅有文本还有压缩的其他属性等内容,所以要使用poi的jar包进行解析

解析的jar包如下图

这个应该比较全面了,也可以解析excel操作或写入表格等

下载地址:

链接: https://pan.baidu.com/s/1htYPKLA 密码: e36e

下面是读取doc的方法

package com.swift;

import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.util.ArrayList;
import java.util.Collections;
import java.util.Comparator;
import java.util.List;
import java.util.Map;
import java.util.Map.Entry;
import java.util.TreeMap; import org.apache.poi.hwpf.HWPFDocument;
import org.apache.poi.xwpf.extractor.XWPFWordExtractor;
import org.apache.poi.xwpf.usermodel.XWPFDocument; public class IO_Sort_Select { public static void main(String[] args) throws IOException {
/*
* 从类似如下的文本文件中读取出所有的姓名,并打印出重复的姓名和重复的次数,并按重复次数排序
*/
File file_s = new File("e:\\neck\\data.doc");
File dir = new File("e:\\neck");
if (!dir.exists() && dir.isDirectory()) {
System.out.println("目录不存在,即将创建...");
dir.mkdirs();
} List<String> list = new ArrayList<String>();
String text = readFromDoc(file_s);
String[] hang = text.split("\\r");
for (int i = 0; i < hang.length; i++) {
System.out.println(hang.length);
System.out.println(hang[i]);
String[] lie = hang[i].split("\\,");
for (int j = 0; j < lie.length; j++) {
if (j == 1) {
list.add(lie[j]);
}
}
}
printList(list); Map<String, Integer> map = new TreeMap<String, Integer>();
for (String str : list) {
map.put(str, 0);
}
for(String str:list) {
if(map.containsKey(str)) {
int num=map.get(str);
num++;
map.remove(str);
map.put(str, num);
}
}
List<Entry<String,Integer>> listMap=new ArrayList<Entry<String,Integer>>(map.entrySet());
Collections.sort(listMap, new Comparator<Entry<String,Integer>>(){ @Override
public int compare(Entry<String, Integer> arg0, Entry<String, Integer> arg1) {
int num=arg1.getValue()-arg0.getValue();
return num==0?arg0.getKey().compareTo(arg1.getKey()):num;
}
}); for(Entry<String, Integer> entry:listMap) {
System.out.println("重复的姓名是 :"+entry.getKey()+" 重复的次数是:"+entry.getValue());
}
} private static void printList(List<String> list) {
for (String str : list) {
System.out.println(str);
}
} public static String readFromDocx(File file) throws IOException { FileInputStream fis = new FileInputStream(file);
XWPFDocument docx = new XWPFDocument(fis);
XWPFWordExtractor extractor = new XWPFWordExtractor(docx);
String text = extractor.getText();
return text;
}
public static String readFromDoc(File file) throws IOException { FileInputStream fis = new FileInputStream(file);
HWPFDocument doc = new HWPFDocument(fis);
String text = doc.getDocumentText();
return text;
} }

doc读取出来的文本还不能用"\\n"进行行分割,用的是"\\r"才行,要不然只能分割出1行,这点注意,要不会觉得程序莫名其妙不安自己的思路走

java算法面试题:从类似如下的文本文件中读取出所有的姓名,并打印出重复的姓名和重复的次数,并按重复次数排序 ;读取docx 读取doc 使用poi 相关jar包提集提供下载的更多相关文章

  1. Java算法面试题(史上最强、持续更新、吐血推荐)

    文章很长,建议收藏起来,慢慢读! 疯狂创客圈为小伙伴奉上以下珍贵的学习资源: 疯狂创客圈 经典图书 : <Netty Zookeeper Redis 高并发实战> 面试必备 + 大厂必备 ...

  2. java算法面试题:有一个字符串,其中包含中文字符、英文字符和数字字符,请统计和打印出各个字符的个数 按值的降序排序,如果值相同则按键值的字母顺序

    package com.swift; import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; publi ...

  3. java算法面试题

    前言:线上面试题与大家分享,并记录求职道路的酸甜苦辣,特此留念. 李雷和韩梅梅坐前后排,上课想说话怕被老师发现,所以改为传小纸条.为了不被老师发现他们纸条上说的是啥,他们约定了如下方法传递信息:将26 ...

  4. java算法面试题:有数组a[n],用java代码将数组元素顺序颠倒

    package com.swift; import java.util.ArrayList; import java.util.Collections; import java.util.List; ...

  5. java算法面试题:设计一个快速排序。双路快速排序,简单易于理解。

    package com.swift; import java.util.ArrayList; import java.util.Collections; import java.util.Compar ...

  6. java算法面试题:排序都有哪几种方法?请列举。用JAVA实现一个快速排序。选择冒泡快速集合至少4种方法排序

    package com.swift; import java.util.ArrayList; import java.util.Collections; import java.util.Compar ...

  7. java算法面试题:编写一个截取字符串的函数,输入为一个字符串和字节数,输出为按字节截取的字符串,但要保证汉字不被截取半个, 如“我ABC”,4,应该截取“我AB”,输入“我ABC汉DEF”,6,应该输出“我ABC”,而不是“我ABC+汉的半个”。

    package com.swift; import java.util.Scanner; public class Hanzi_jiequ { public static void main(Stri ...

  8. Java算法面试题:编写一个程序,将e:\neck目录下的所有.java文件复制到e:\jpg目录下,并将原来文件的扩展名从.java改为.jpg

    package com.swift; import java.io.File; import java.io.FileFilter; import java.io.FileInputStream; i ...

  9. java算法面试题:编写一个程序,将a.txt文件中的单词与b.txt文件中的单词交替合并到c.txt文件中,a.txt文件中的单词用回车符分隔,b.txt文件中用回车或空格进行分隔。

    package com.swift; import java.io.BufferedReader; import java.io.BufferedWriter; import java.io.File ...

随机推荐

  1. 洛谷P3582 [POI2015]KIN

    题目描述 共有\(m\)部电影,编号为\(1--m\),第\(i\)部电影的好看值为\(w[i]\).在\(n\)天之中(从\(1~n\)编号)每天会放映一部电影,第\(i\)天放映的是第\(f[i] ...

  2. IOS 贝塞尔曲线切割圆角

    写一个UIView扩展 1. .h文件 @interface UIView (Corner) - (void)setCornerWithType:(UIRectCorner)type Radius:( ...

  3. POJ1032 Parliament

    题目来源:http://poj.org/problem?id=1032 题目大意:给定一个正整数N(5<=N<=1000),将N拆为若干个不同的数使得它们的乘积最大(找到一组互不相等,和为 ...

  4. Django 02 url路由配置及渲染方式

    Django 02 url路由配置及渲染方式 一.URL #URL #(Uniform Resoure Locator) 统一资源定位符:对可以从互联网上得到的资源的位置和访问方法的一种简洁的表示,是 ...

  5. Python+Selenium----使用HTMLTestRunner.py生成自动化测试报告1(使用IDLE)

    1.说明 自动化测试报告是一个很重要的测试数据,网上看了一下,使用HTMLTestRunner.py生成自动化测试报告使用的比较多,但是呢,小白刚刚入手,不太懂,看了很多博客,终于生成了一个测试报告, ...

  6. bootstrap栅格系统的实现

    bootstrap提供了一个非常实用的栅格系统,可以实现响应式的网格布局,原理其实很简单,利用了float.百分比的宽度和@media的配合实现响应式,bootstrap默认把一行分为了12列,提供了 ...

  7. Java多线程与并发——死锁与中断线程

    过多的同步有可能出现死锁,死锁的操作一般是在程序运行的时候才有可能出现. 多线程中要进行资源的共享,就需要同步,但同步过多,就可能造成死锁. 死锁例子: package com.vince; /** ...

  8. kettle5.4ODBC和OCI连接配置

    1.kettle 5.4 使用JDBC连接的时候报错(测试不同的数据库,发现只是连接11gRAC 的时候会报JDBC的错误) 具体报错如下 java.sql.SQLException: 建数据库连接出 ...

  9. (转)linux route命令详解

    linux route命令详解 原文:https://www.cnblogs.com/lpfuture/p/5857738.html   &&   http://blog.csdn.n ...

  10. mybatis使用说明

    起步:1.创建一个maven项目工程.2.打开pom.xml配置文件,3.设置源代码编码方式为UTF-8.4.设置编译源代码的JDK版本.最好大于1.6版本.5. 重点--添加Mybatis的相关依赖 ...