Java基础教程——转换流
转换流
通常,Window默认的编码方式是GBK,Java项目一般建议设为UTF-8编码。这时候读取文件可能出现乱码。事实上实际应用中编码格式不匹配的场景非常多。
转换流可以指定编码方式,用于解决乱码问题。
OutputStreamWriter
InputStreamReader
字符编码:Character Encoding:自然语言的字符,与二进制数之间的对应规则。
文件流读取时使用的编码方式和文件本身编码方式不同时,会造成读取出来时出现乱码。
字符集 :Charset:系统支持的所有字符的集合,包括数字、文字、标点符号、图形符号等。一套字符集至少有一套字符编码。常见字符集有ASCII字符集、GBK字符集、Unicode字符集等。
ASCII字符集 :
|--ASCII(American Standard Code for Information Interchange,美国信息交换标准代码)是基于拉丁字母的一套电脑编码系统,用于显示现代英语,主要包括控制字符(回车键、退格、换行键等)和可显示字符(英文大小写字符、阿拉伯数字和西文符号)。
|--|--基本的ASCII字符集,使用7位(bits)表示一个字符,共128字符。
|--|--ASCII的扩展字符集使用8位(bits)表示一个字符,共256字符,方便支持欧洲常用字符。ISO-8859-1字符集:
|--拉丁码表,别名Latin-1,用于显示欧洲使用的语言,包括荷兰、丹麦、德语、意大利语、西班牙语等。
|--ISO-8859-1使用单字节编码,兼容ASCII编码。GBxxx字符集:GB乃“国标”之意,是为了显示中文而设计的一套字符集。
|--GB2312:简体中文码表。一个小于127的字符的意义与原来相同。但两个大于127的字符连在一起时,就表示一个汉字,大约包含7000多个简体汉字,还有数学符号、希腊字母、日文假名,连在ASCII里本来就有的数字、标点、字母都统统重新编了两个字节长的编码,这便是所谓的"全角"字符,而原来在127号以下的那些就叫"半角"字符了。
|--GBK:最常用的中文码表。是在GB2312标准基础上的扩展规范,使用了双字节编码方案,共收录了21003个汉字,完全兼容GB2312标准,同时支持繁体汉字以及日韩文字等。Windows操作系统默认使用GBK编码。
|--GB18030:最新的中文码表。收录汉字7万多个,采用多字节编码,每个字可以由1个、2个或4个字节组成。支持中国国内少数民族的文字,同时支持繁体汉字以及日韩汉字等。Unicode字符集 :
Unicode编码系统为表达任意语言的任意字符而设计,是业界的一种标准,也称为统一码、标准万国
码。
有三种编码方案,UTF-8、UTF-16和UTF-32。最为常用的UTF-8编码。
|--UTF-8,可以用来表示Unicode标准中任何字符,它是电子邮件、网页及其他存储或传送文字的应用中,优先采用的编码。互联网工程工作小组(IETF)要求所有互联网协议都必须支持UTF-8编码。
UTF-8使用1至4个字节为进行编码(最大可占用6字节),编码规则:
- 128个ASCII字符,一个字节编码。
- 拉丁文等字符,两个字节编码。
- 大部分常用字(含中文),使用三个字节编码,基本等同于GBK。
- 还有一些字符使用四字节编码。
参考【utf-8中的汉字占用多少字节】:https://www.cnblogs.com/zxz1987/articles/6544593.html
看看UTF-8编码占了几个字节:
public class TestCharEncoding {
public static void main(String[] args) throws Exception {
String[] strArr = { "A", "Ω", "壹" };
for (String s : strArr) {
System.out.println("s:" + s.getBytes("utf-8").length);
}
}
}
运行结果
s:1
s:2
s:3
示例代码:转换流可以读写各种编码的文件,而纯字符流则可能读出乱码。
- 使用FileInputStream类读取文件流,
- 利用InputStreamReader将字节流转化为字符流,同时指定文件流的编码方式,
- 再将字符流放入 BufferedReader中进行操作。
File → FileOutputStream → OutputStreamWriter(指定编码) → BufferedWriter
File → FileInputStream → InputStreamReader(指定编码) → BufferedReader
package ahjava.io;
import java.io.*;
public class 转换流 {
public static final String FILE_NAME = "testMessyCode.txt";
public static final String CHARSET_NAME = "gbk";
// File->FileOutputStream->OutputStreamWriter(指定编码)->BufferedWriter
static void write(String msg) throws Exception {
File f = new File(FILE_NAME);
FileOutputStream fos = new FileOutputStream(f);
OutputStreamWriter osw = new OutputStreamWriter(fos, CHARSET_NAME);
BufferedWriter bw = new BufferedWriter(osw);
bw.write(msg);
// 关闭流(写文件的关闭顺序如果不对,会抛异常,读文件没有影响)
bw.close();
osw.close();
fos.close();
}
// File->FileInputStream->InputStreamReader(指定编码)->BufferedReader
static void read() throws Exception {
File f = new File(FILE_NAME);
FileInputStream fis = new FileInputStream(f);
InputStreamReader isr = new InputStreamReader(fis, CHARSET_NAME);
BufferedReader br = new BufferedReader(isr);
String str;
while ((str = br.readLine()) != null) // 逐行读取数据
{
System.out.println(CHARSET_NAME + "读取:" + str);
}
// 关闭流
br.close();
isr.close();
fis.close();
}
static void 纯字符流R_就怕货比货() {
File file = new File(FILE_NAME);
FileReader fr;
try {
fr = new FileReader(file);
BufferedReader br = new BufferedReader(fr);
String str;
while ((str = br.readLine()) != null) {
System.out.println("纯字符流读取:" + str);
}
br.close();
fr.close();
} catch (IOException e) {
e.printStackTrace();
}
}
public static void main(String[] args) throws Exception {
write("乱码?");
纯字符流R_就怕货比货();
read();
}
}
*控制台输入
场景:控制台输入文字,写入文件。
通常建议把Java工程设为UTF-8编码。这时候如果写文件,文件是UTF-8编码。
然而,Windows平台默认的编码方式是GBK,可以通过转换流以GBK的编码方式写文件。
以下代码就是以GBK的编码格式把用户在控制台的输入写入文件。
import java.io.*;
public class 控制台输入 {
public static void main(String[] args) throws IOException {
控制台写入文件();
}
static void 控制台写入文件() throws IOException {
/* 本例从控制台接受输入,然后写入到文件中,直到用户输入"!!!"为止 */
// 输出:FileOutputStream->OutputStreamWriter(指定编码)->BufferedWriter
FileOutputStream fos = new FileOutputStream("控制台写入文件.txt");
OutputStreamWriter osw = new OutputStreamWriter(fos, "GBK");
BufferedWriter bw = new BufferedWriter(osw);
// 输入:System.in(字节流)->InputStreamReader->BufferedReader
// 将控制台输入对象转化成字符流,并建立缓冲流
InputStreamReader isr = new InputStreamReader(System.in);
BufferedReader br = new BufferedReader(isr);
String str = br.readLine(); // 接受从控制台输入的一行字符串
while (!(str.equals("!!!"))) // 如果输入"!!!"则代表输入结束
{
bw.write(str); // 将从控制台输入的字符串写入到文件中
bw.newLine(); // 换新行
str = br.readLine(); // 再从控制台接受输入
}
// 关闭输入相关的流
br.close();
isr.close();
// 关闭输出相关的流
bw.close();
osw.close();
fos.close();
}
}
*想想,“控制台写入文件()”方法,能不能连续调用两次?
Java基础教程——转换流的更多相关文章
- java基础(24):转换流、缓冲流
1. 转换流 在学习字符流(FileReader.FileWriter)的时候,其中说如果需要指定编码和缓冲区大小时,可以在字节流的基础上,构造一个InputStreamReader或者OutputS ...
- java基础 关于转换流
转换流有两种:InputStreamReader:将字节流转换为字符流 OutputStreamWriter:将字符流转换为字节流 什么时候使用转换流?由以下分析: 流对象很多,首先要明确那个流对象. ...
- JAVA基础之转换流和缓冲流
个人理解: 在理解的字符流和字节流的区别后.要是想读取指定的编码格式的文件时,特别是不是默认的格式时,就需要转换流了,需要注意的是字符流是需要清除缓冲区的:当需要快速的进行读取时,则需要缓冲流.存在即 ...
- Java基础 使用转换流进行文件的复制 / RandomAccessFile 类进行文件的复制
笔记: **使用转换流进行文件的复制 文本文件---字节流FileInputStream--> [InputStreamReader] -----字符流BufferedReader------ ...
- Java基础教程——打印流
打印流 打印流可以把原本输出到控制台的信息输出到文件中.PrintStream是字节打印流(还有个对应的字符打印流是PrintWriter,这里不涉及) System类中有个变量: public fi ...
- Java基础教程——缓冲流
缓冲流 "缓冲流"也叫"包装流",是对基本输入输出流的增强: 字节缓冲流: BufferedInputStream , BufferedOutputStream ...
- Java基础教程——字符流
字符流 字节流服务文本文件时,可能出现中文乱码.因为一个中文字符可能占用多个字节. 针对于非英语系的国家和地区,提供了一套方便读写方式--字符流. java.io.Reader java.io.Wri ...
- Java基础教程:面向对象编程[2]
Java基础教程:面向对象编程[2] 内容大纲 访问修饰符 四种访问修饰符 Java中,可以使用访问控制符来保护对类.变量.方法和构造方法的访问.Java 支持 4 种不同的访问权限. default ...
- Java基础教程:JDBC编程
Java基础教程:JDBC编程 1.什么是JDBC JDBC 指 Java 数据库连接,是一种标准Java应用编程接口( JAVA API),用来连接 Java 编程语言和广泛的数据库. JDBC A ...
随机推荐
- ArcGIS API for Javascript的Point clustering使用及默认符号无法显示问题
1.将包含ClusterFeatureLayer.js文件的extras文件夹放在部署的arcgis api目录下,如下图. extras路径 2.使用ClusterFeatureLayer关键代码如 ...
- Java学习的第十九天
1.今天学了接口只能有抽象的常量和方法,接口为interface 承接接口是implements 接口的使用 接口中的方法必须是抽象的,没有构造方法 2.今天没有问题 3.明天学习第六章综合实例 ...
- 调度《Taint(污点) 和 Toleration(容忍)》
节点亲和性(详见这里),是 pod 的一种属性(偏好或硬性要求),它使 pod 被吸引到一类特定的节点.Taint 则相反,它使 节点 能够 排斥 一类特定的 pod. Taint 和 tolerat ...
- nextInt()和nextLine()连用报错
当nextInt(),next(),nextDouble(),nextFloat()方法与nextLine()连用并放在nextLine()前面时,会出现下面的错误: Exception in thr ...
- K8s之实践Pod深入理解
K8s之实践Pod深入理解 1.同一pod下的nginx+php+mysql nginx+php+mysql.yaml文件 --- apiVersion: v1 kind: Secret meta ...
- Dubbo 迈出云原生重要一步 - 应用级服务发现解析
作者 | 刘军(陆龟) Apache Dubbo PMC 概述 社区版本 Dubbo 从 2.7.5 版本开始,新引入了一种基于实例(应用)粒度的服务发现机制,这是我们为 Dubbo 适配云原生基础 ...
- R语言factor类型转numeric
R 语言中为了进行数据分析,比如回归分析,这时候对于数据表格中的factor类型的数据会带来弊端,比如对因子的每一个数据都进行一次回归,这样就显得很复杂,且违背了我们的初衷,需要把factor转换为n ...
- 【填坑往事】Android手机锁屏人脸解锁优化过程实录
背景 写这篇文章,主要是为了以后面试方便.因为我简历上写了,上一份工作的最大亮点是将人脸解锁的速度由1200ms优化到了600ms,所以这些内容已经回答无数遍了.但每次总觉得回答的不完整,或者说总感觉 ...
- html+js+highcharts绘制圆饼图表的简单实例
下面我就为大家带来一篇html+js+highcharts绘制圆饼图表的简单实例.我觉得挺不错的,现在就分享给大家,也给大家做个参考.一起跟随我过来看看吧 实例如下: 1 2 3 4 5 6 7 8 ...
- Vue3教程:用 Vue3 开发小程序,这里有一份实际的代码案例!
前言 寻寻觅觅冷冷清清,凄凄惨惨戚戚. Vue 3 发布以后,最近也在学习和写一些 Vue3 的 demo 和项目,我也一直想着什么时候能在小程序里使用新特性? 于是我翻遍了市面上的小程序框架,如 u ...