使用ChatGPT4识别:用java读取文件中不同字的个数。

解析:该程序将读取名为“file.txt”的文件,并计算文件中每个不同字的出现次数。它使用一些字符串操作来清理单词,并使用HashMap来存储每个单词的出现数。最后,程序打印出不同字的总数。

  1. //ChatGPT4完成的代码和我所需要的有点差异
  2. import java.io.BufferedReader;
  3. import java.io.FileReader;
  4. import java.util.HashMap;
  5. import java.util.Map;
  6. public class CountDistinctWords {
  7. public static void main(String[] args) {
  8. try {
  9. BufferedReader reader = new BufferedReader(new FileReader("file.txt"));
  10. String line = reader.readLine();
  11. Map<String, Integer> wordCount = new HashMap<String, Integer>();
  12. while (line != null) {
  13. String[] words = line.split(" ");
  14. for (String word : words) {
  15. String cleanedWord = word.replaceAll("[^a-zA-Z0-9]", "").toLowerCase();
  16. if (!cleanedWord.isEmpty()) {
  17. if (wordCount.containsKey(cleanedWord)) {
  18. int count = wordCount.get(cleanedWord);
  19. wordCount.put(cleanedWord, count + 1);
  20. } else {
  21. wordCount.put(cleanedWord, 1);
  22. }
  23. }
  24. }
  25. line = reader.readLine();
  26. }
  27. reader.close();
  28. System.out.println("Distinct words: " + wordCount.size());
  29. } catch (Exception e) {
  30. e.printStackTrace();
  31. }
  32. }
  33. }

使用ChatGPT4实现的是读取文件中除去中文的字母,而且用空格间隔的数量。

与我所想的读取文件中不同中文的数量有点差距,但大体方法相同。

主要流程:使用缓冲流读取文件,使用Hashmap来读取每一行的中文,通过正则表达式来过滤出中文,用每一个中文当键,最后只需要读取HashMap的大小即可知道有几个中文。

  1. //根据需求修改后的代码
  2. import java.io.BufferedReader;
  3. import java.io.FileReader;
  4. import java.io.IOException;
  5. import java.util.HashMap;
  6. import java.util.Map;
  7. public class readWordCount {
  8. public static void main(String[] args) {
  9. BufferedReader reader = null;
  10. try {
  11. reader = new BufferedReader(new FileReader("read_word_count/file.txt"));
  12. String line = null;
  13. Map<Character, Integer> wordCount = null;
  14. int count = 0;
  15. wordCount = new HashMap<Character, Integer>();
  16. while (true) {
  17. line = reader.readLine();
  18. if(line == null){
  19. break;
  20. }
  21. line = line.replaceAll("[^\\u4E00-\\u9FA5]", "");
  22. char[] words = line.toString().toCharArray();
  23. for (char word : words) {
  24. if (wordCount.containsKey(word)) {
  25. count = wordCount.get(word);
  26. wordCount.put(word, count + 1);
  27. } else {
  28. wordCount.put(word, 1);
  29. }
  30. }
  31. }
  32. System.out.println("不同中文的个数: " + wordCount.size());
  33. } catch (Exception e) {
  34. e.printStackTrace();
  35. }finally {
  36. try {
  37. reader.close();
  38. } catch (IOException e) {
  39. throw new RuntimeException(e);
  40. }
  41. }
  42. }
  43. }

测试样例:

a b c d dsvsdvsdvsdvdsvd汪汪汪

鲁迅《从百草园到三味书屋》滴滴滴

结果:

不同中文的个数: 13

记录每一个学习瞬间

使用ChatGPT4协助完成读取文件中不同字的数量的更多相关文章

  1. IO流的练习5 —— 读取文件中的字符串,排序后写入另一文件中

    需求:已知s.txt文件中有这样的一个字符串:“hcexfgijkamdnoqrzstuvwybpl” 请编写程序读取数据内容,把数据排序后写入ss.txt中. 分析: A:读取文件中的数据 B:把数 ...

  2. Python 读取文件中unicode编码转成中文显示问题

    Python读取文件中的字符串已经是unicode编码,如:\u53eb\u6211,需要转换成中文时有两种方式 1.使用eval: eval("u"+"\'" ...

  3. json数据处理:读取文件中的json字符串,转为python字典

    方法1: 读取文件中的json字符串, 再用json.loads转为python字典 import json str_file = './960x540/config.json' with open( ...

  4. 利用PushbackReader读取文件中某个字符串之前的内容

    package File; import java.io.FileReader; import java.io.IOException; import java.io.PushbackReader; ...

  5. shell awk读取文件中的指定行的指定字段

    1.awk功能和实用形式 awk指定读取文件中的某一行的某个字段 awk      可以设置条件来输出文件中m行到n行中每行的指定的k字段,使用格式如下 awk    'NR==m,NR==n {pr ...

  6. C语言 读取文件中特定数据

    //读取文件数据 #define _CRT_SECURE_NO_WARNINGS #include<stdio.h> #include<stdlib.h> struct jia ...

  7. Jmeter读取文件中的值《一》

    此篇主要是对应上一章节的呼应,上一篇中讲到将返回值写入文件,这个值如果在下一个接口中用到, 那么我们需要去从文件中读取数据,这是我们该如何操作? 一.测试计划中添加CSV Data Set Confi ...

  8. 学习:erlang读取文件中的terms

    参考:http://diaocow.iteye.com/blog/1766128 1. file:consult(Filename) -> {ok, Terms} | {error, Reaso ...

  9. C# 读取文件中的sql语句 创建数据库以及表结构

    大概思路是: 读取文件 根据文件中行内容为GO 作为分割  一条条放到list中 然后在程序中逐条执行sql语句; 值得一提的是 创建数据库的语句是不允许放到程序事务中执行的 所以目前我是分了两个文本 ...

  10. 在java中读取文件中的内容

    package shi; import java.io.*; public class wenjianIO { public static void main(String agrs[]){ File ...

随机推荐

  1. Leecode 53.最大子数组和(Java 贪心算法、动态规划两种方法)

    想法(没看解析之前想不出来)   -----------------看了解析和答案 1.贪心算法,若当前元素的之前和<0,则丢弃当前元素之前的数列 设一个maxSum作为子序列最大和,一个sum ...

  2. svn备份迁移

    参考链接: SVN版本库的迁移 dump的详细使用 https://www.iteye.com/blog/tdcq-1684344 svn备份与还原_脚本_(dump命令)

  3. Spring5 feamework modules

    一.Spring框架的组成 由 core container(核心容器) Data Access and DataIntegration(数据读取和数据整合) web AOP(面向切面编程) Inst ...

  4. vue中的观察者模式和发布订阅者模式

    观察者模式 目标者对象和观察者对象有相互依赖的关系,观察者对某个对象的状态进行观察,如果对象的状态发生改变,就会通知所有依赖这个对象的观察者, 目标者对象 Subject,拥有方法:添加 / 删除 / ...

  5. SpringBoot笔记--自动配置(高级内容)(中集)

    @Enable*注解 使用该注解,需要导入相应的依赖坐标,其中的groupId标签里面写入Bean的Java文件所在的包的路径下面 spring-enable-other 还需要在SpringBoot ...

  6. D3和X6

    D3 版本 d3已经更新到v7版本,中文文档只更新到v4版本,存在部分api不适用和过时问题 使用d3-darge插件布局,插件适配d3版本为v5,近年未更新 API 使用darge中setNode和 ...

  7. 《深入理解高并发编程:JDK核心技术》-冰河新书上市

    大家好,我是冰河~~ 废话说多了没用,并发编程技术一直是初级程序员进阶高级工程师的前提条件,也是成为大厂程序员的必备技能,更是突破自身技术瓶颈的必经之路. 2022年6月我出版了"冰河技术丛 ...

  8. 【OGF生成函数板子题】牛客编程巅峰赛S2第11场 C 挑选方案问题

    upd 2022-01-26 我找到了个题集 牛客竞赛数学专题班生成函数I(线性递推关系.生成函数概念与公式推导.暴力计算) 目录 题目链接 题面 解题思路 AC代码 题目链接 https://ac. ...

  9. 递推求解DAG最长路径长度及最长路径条数

    说明 在一般图中,求解最长路或最短路只能通过最短路算法解决 但是在DAG中,由于不存在环,因此可以通过递推,以线性复杂度计算处最长路或最短路.当然需要首先对有向图进行Tarjan缩点转化为DAG 例题 ...

  10. [C++STL教程]7.priority_queue优先队列入门学习!零基础都能听懂的教程

    不知不觉C++STL教程系列已经第7期了.之前我们介绍过:vector, queue, stack, set, map等等数据结构. 今天我们来学习一个新的stl容器:priority_queue优先 ...