使用ChatGPT4协助完成读取文件中不同字的数量

使用ChatGPT4识别：用java读取文件中不同字的个数。

解析：该程序将读取名为“file.txt”的文件，并计算文件中每个不同字的出现次数。它使用一些字符串操作来清理单词，并使用HashMap来存储每个单词的出现数。最后，程序打印出不同字的总数。

//ChatGPT4完成的代码和我所需要的有点差异

import java.io.BufferedReader;

import java.io.FileReader;

import java.util.HashMap;

import java.util.Map;

public class CountDistinctWords {

    public static void main(String[] args) {

        try {

            BufferedReader reader = new BufferedReader(new FileReader("file.txt"));

            String line = reader.readLine();

            Map<String, Integer> wordCount = new HashMap<String, Integer>();

            while (line != null) {

                String[] words = line.split(" ");

                for (String word : words) {

                    String cleanedWord = word.replaceAll("[^a-zA-Z0-9]", "").toLowerCase();

                    if (!cleanedWord.isEmpty()) {

                        if (wordCount.containsKey(cleanedWord)) {

                            int count = wordCount.get(cleanedWord);

                            wordCount.put(cleanedWord, count + 1);

                        } else {

                            wordCount.put(cleanedWord, 1);

                        }

                    }

                }

                line = reader.readLine();

            }

            reader.close();

            System.out.println("Distinct words: " + wordCount.size());

        } catch (Exception e) {

            e.printStackTrace();

        }

    }

}

使用ChatGPT4实现的是读取文件中除去中文的字母，而且用空格间隔的数量。

与我所想的读取文件中不同中文的数量有点差距，但大体方法相同。

主要流程：使用缓冲流读取文件，使用Hashmap来读取每一行的中文，通过正则表达式来过滤出中文，用每一个中文当键，最后只需要读取HashMap的大小即可知道有几个中文。

//根据需求修改后的代码

import java.io.BufferedReader;

import java.io.FileReader;

import java.io.IOException;

import java.util.HashMap;

import java.util.Map;

public class readWordCount {

    public static void main(String[] args) {

        BufferedReader reader = null;

        try {

            reader = new BufferedReader(new FileReader("read_word_count/file.txt"));

            String line = null;

            Map<Character, Integer> wordCount = null;

            int count = 0;

            wordCount = new HashMap<Character, Integer>();

            while (true) {

                line = reader.readLine();

                if(line == null){

                    break;

                }

                line = line.replaceAll("[^\\u4E00-\\u9FA5]", "");

                char[] words = line.toString().toCharArray();

                for (char word : words) {

                    if (wordCount.containsKey(word)) {

                        count = wordCount.get(word);

                        wordCount.put(word, count + 1);

                    } else {

                        wordCount.put(word, 1);

                    }

                }

            }

            System.out.println("不同中文的个数: " + wordCount.size());

        } catch (Exception e) {

            e.printStackTrace();

        }finally {

            try {

                reader.close();

            } catch (IOException e) {

                throw new RuntimeException(e);

            }

        }

    }

}

测试样例：

a b c d dsvsdvsdvsdvdsvd汪汪汪

鲁迅《从百草园到三味书屋》滴滴滴

结果：

不同中文的个数: 13

记录每一个学习瞬间

使用ChatGPT4协助完成读取文件中不同字的数量的更多相关文章

IO流的练习5 —— 读取文件中的字符串，排序后写入另一文件中
需求:已知s.txt文件中有这样的一个字符串:“hcexfgijkamdnoqrzstuvwybpl” 请编写程序读取数据内容,把数据排序后写入ss.txt中. 分析: A:读取文件中的数据 B:把数 ...
Python 读取文件中unicode编码转成中文显示问题
Python读取文件中的字符串已经是unicode编码,如:\u53eb\u6211,需要转换成中文时有两种方式 1.使用eval: eval("u"+"\'" ...
json数据处理：读取文件中的json字符串，转为python字典
方法1: 读取文件中的json字符串, 再用json.loads转为python字典 import json str_file = './960x540/config.json' with open( ...
利用PushbackReader读取文件中某个字符串之前的内容
package File; import java.io.FileReader; import java.io.IOException; import java.io.PushbackReader; ...
shell awk读取文件中的指定行的指定字段
1.awk功能和实用形式 awk指定读取文件中的某一行的某个字段 awk 可以设置条件来输出文件中m行到n行中每行的指定的k字段,使用格式如下 awk 'NR==m,NR==n {pr ...
C语言读取文件中特定数据
//读取文件数据 #define _CRT_SECURE_NO_WARNINGS #include<stdio.h> #include<stdlib.h> struct jia ...
Jmeter读取文件中的值《一》
此篇主要是对应上一章节的呼应,上一篇中讲到将返回值写入文件,这个值如果在下一个接口中用到, 那么我们需要去从文件中读取数据,这是我们该如何操作? 一.测试计划中添加CSV Data Set Confi ...
学习：erlang读取文件中的terms
参考:http://diaocow.iteye.com/blog/1766128 1. file:consult(Filename) -> {ok, Terms} | {error, Reaso ...
C# 读取文件中的sql语句创建数据库以及表结构
大概思路是: 读取文件根据文件中行内容为GO 作为分割一条条放到list中然后在程序中逐条执行sql语句; 值得一提的是创建数据库的语句是不允许放到程序事务中执行的所以目前我是分了两个文本 ...
在java中读取文件中的内容
package shi; import java.io.*; public class wenjianIO { public static void main(String agrs[]){ File ...

随机推荐

基于4g智能路由器的充电桩远程监测管理应用
随着我国电动车保有量的持续增加,充电桩的需求也水涨船高,成为城市发展必备的基础设施之一.相较加油站,充电桩分布更广泛,部署场景更多样,与场景的融合程度也更深,诸如各类停车与充电二合一的站点.因此,对于 ...
xlwings读取一整个excel文件xlsx的第一sheet到pandas.DataFrame的方法
为什么不用:pd.read_excel ? 因为 pd 使用 openpyxl 读取excel文件,有时候xlsx文件是由ApachIO产生的读取进去会出错,换个方式,用xlwings(基于pywin ...
appium 遇到连接设备状态是offline
1.查看连接手机设备 adb derivces 时,手机状态是offline状态(无法正常连接). 解决法: 1.adb kill-server 终止adb调试服务 2.adb start-serve ...
AI来实现代码转换！Python转Java，Java转Go不在话下？
今天看到个有趣的网站,给大家分享一下. 该网站的功能很神奇,可以实现编程语言的转化.感觉在一些场景之下还是有点作用的,比如你原来跟我一样是做Java的,因为工作需要突然转Go.这个时候用你Java的经 ...
查看Doris表占用空间
近期想统计下各表占用的存储空间大小,官网文档SHOW-TABLE-STATUS给的语句很简单,但是对于列的含义写的不是很明白,我写入数据验证了一下. Doris版本:1.2 查看当前数据库下所有表的信 ...
给宝宝的AC自动机启蒙指南（宝宝的第一本）
AC自动机根据已有经验,学完虚数会变虚,然后写出的代码就不是人能看的了所以我们来学实树罢(喜) 以上为废话博客背景有限状态自动机首先我们来了解一下自动机是啥. 说的通俗一点,我们可以把自动机看 ...
react之点语法（利用函数组件）
index.js import React, { Component } from 'react' import MyCom from './MyCom'; export default class ...
CentOS7-自动化部署web集群
一.项目要求 1.创建role,通过role完成项目(可能需要多个role) 2.部署nginx调度器(node2主机) 3.部署2台lnmp服务器(node3,node4主机) 4.部署mariad ...
OWASP TOP 10 2021
OWASP TOP 10 2021 2021 年的 TOP 10 中有 3 个新类别.4 个更改了名称和范围的类别以及一些合并. A01. 失效的访问控制 Broken Access Control ...
什么时候需要使用try-catch
代码执行预料不到的情况,或出错的可能性很大时,使用try-catch语句构造一个文件输入流(上传文件时,线上环境的内存情况不确定)出错的可能性很大文件上传写入, 数据库事务的提交,还有摄像头和打印 ...

使用ChatGPT4协助完成读取文件中不同字的数量

使用ChatGPT4协助完成读取文件中不同字的数量的更多相关文章

随机推荐

热门专题