35 编码 ASCII Unicode UTF-8 ,字符串的编码、io流的编码
* 编码表:
* 信息在计算机上是用二进制表示的,这种表示法让人理解就很困难。为保证人类和设备,设备和计算机之间能进行正确的信息交换,人们编制的统一的信息交换代码,这就是ASCII码表
*ASCII 用十进制来存储二进制字符。 缺点:字符个数有限(只有字母数字符号,没有中文)
* GB2312 有中文。 缺点:中国自己的,不够通用 *
----升级为 GBK。
* Unicode 多个国家统一编码 缺点:每个字符都占两个字节,资源浪费
* ---升级为 UTF-8
* ANSI:本地编码表 (gbk)
* java的字符默认使用的ANSI(gbk)
ASCII码表可参见:https://www.cnblogs.com/longesang/p/11057351.html
idea修改单个文件的编码格式:
点击右下角,设置的默认编码是utf-8,可以选择想要的格式进行切换。
切换后只有当前文件格式会变,其他文件不会影响
对单独文件的编码修改还可以点击右下角的编码设置区。如果代码内容中包含中文,则会弹出演示中的操作选择。
Reload 表示使用新编码重新加载,新编码不会保存到文件中,重新打开此文件,旧编码是什么依旧还是什么。
Convert 表示使用新编码进行转换,新编码会保存到文件中,重新打开此文件,新编码是什么则是什么。
含有中文的代码文件,Convert 之后可能会使中文变成乱码,所以在转换成请做好备份,不然可能出现转换过程变成乱码,无法还原。

一、字符串的编码,(使用字节流读写,对字符串进行编码转换)
public class EncoderDemo {
public static void main(String[] args) throws IOException {
String s = "你好世界";
// byte[] bys = s.getBytes();
byte[] bys = s.getBytes("GBK"); // byte[] getBytes() 使用平台的默认字符集将此 String 编码为 byte 序列,并将结果存储到一个新的 byte 数组中。
//编码名称大小写不限制,但名字一定要写对否则会报错识别不到。
FileOutputStream fos = new FileOutputStream("a.txt");
fos.write(bys);
fos.close();
}
}
输出
我本地默认编码UTF-8写入GBK

读数据
FileInputStream fis = new FileInputStream("a.txt");
byte[] bys = new byte[1024];
int len = fis.read(bys);
// System.out.println(new String(bys,0,len,"GBK"));
System.out.println(new String(bys,0,len,"UTF-8"));//new String() 数组转字符串
UTF-8

GBK

二、字符流的编码(使用io流的编码来转换)
字符流 = 字节流 + 编码
package 编码问题; import java.io.*; /*
* 字符流 = 字节流 + 编码
*
* */
public class EncoderDemo2 {
public static void main(String[] args) throws IOException {
// method(); //使用io流的编码来转换
OutputStreamWriter osw = new OutputStreamWriter(new FileOutputStream("b.txt"),"GBK");//转换流,将字节转换为字节
String s = "赢取白富美"; osw.write(s);//写的是字符
osw.close();
} //对数据进行转换
private static void method() throws IOException {
FileWriter fw = new FileWriter("b.txt");
String s = "你好世界";
byte[] bys = s.getBytes("GBK"); // byte[] getBytes() 使用平台的默认字符集将此 String 编码为 byte 序列,并将结果存储到一个新的 byte 数组中。 fw.write(new String(bys));//new String() 数组转化为字符串
// fw.write(s);
fw.close();
}
}
35 编码 ASCII Unicode UTF-8 ,字符串的编码、io流的编码的更多相关文章
- 字符编码 ASCII,Unicode和UTF-8的关系
转自:http://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000/00143166410626 ...
- 字符编码 ASCII unicode UTF-8
字符串也是一种数据类型,但是,字符串比较特殊的是还有一个编码问题. 因为计算机只能处理数字,如果要处理文本,就必须先把文本转换为数字才能处理.最早的计算机在设计时采用8个比特(bit)作为一个字节(b ...
- 字符编码(续)---Unicode与ANSI字符串转换以及分辨字符编码形式
Unicode与ANSI字符串转换 我们使用windows函数MultiByteToWideChar将多字节字符串转换为宽字符字符串,如下: int MultiByteToWideChar( UINT ...
- ASCII UNICODE UTF "口水文"
最近接了一个单是需要把非 UTF-8 (No BOM)编码的文件转换成 UTF-8 (No BOM),若此文件是 UTF-8 但带有 BOM ,需要转换成不带 BOM 的.于是开启了一天的阅读.首先花 ...
- IO 流中编码和解码问题
编码表 ASCII : American Standard Code for Information Interchange 使用一个字节的 7 位可以表示 ISO8859-1 : 拉丁码表. 欧洲码 ...
- 字符集、字符编码、国际化、本地化简要总结(UNICODE/UTF/ASCII/GB2312/GBK/GB18030)
PS:要转载请注明出处,本人版权所有. PS: 这个只是基于<我自己>的理解, 如果和你的原则及想法相冲突,请谅解,勿喷. 环境说明 普通的linux 和 普通的windows. ...
- 10.1 io流--ASCII码表
day2.8中提到 /* * +: * 做加法运算 * * 字符参与加法运算,其实是拿字符在计算机中存储的数据值来参与运算的 * 'A' 65(B 66...) * 'a' 97(b 98...) * ...
- 文字编码ASCII,GB2312,GBK,GB18030,UNICODE,UCS,UTF的解析
众所周知,一个文字从输入到显示到存储是有一个固定过程的,其过程为:输入码(根据输入法不同而不同)→机内码(根据语言环境不同而不同,不同的系统语言编码也不一样)→字型码(根据不同的字体而不同)→存储码( ...
- ASCII、Unicode、UTF-8 字符串和编码
字符编码 我们已经讲过了,字符串也是一种数据类型,但是,字符串比较特殊的是还有一个编码问题. 因为计算机只能处理数字,如果要处理文本,就必须先把文本转换为数字才能处理.最早的计算机在设计时采用8个比特 ...
随机推荐
- Python习题集(一)
每天一习题,提升Python不是问题!!有更简洁的写法请评论告知我! 题目 有一个数据list of dict如下 a = [ {"}, {"}, {"}, ] 写入到本 ...
- Dubbo反序列化漏洞(CVE-2019-17564) 重现
1. 下载官方 demo 代码(暴出的漏洞是 http 协议的,故使用 http 的 demo 来重现)https://github.com/apache/dubbo-samples/tree/mas ...
- 【视频+图文】Java经典基础练习题(三):输入3个整数,并将其由小到大输出
目录 一.视频讲解 二.思路分析 总结: 三.代码+详解+结果 四.彩蛋 能解决题目的代码并不是一次就可以写好的 我们需要根据我们的思路写出后通过debug模式找到不足再进行更改 多次测试后才可得到能 ...
- 自定义上下文菜单,contextmenu事件
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
- Python_matplotlib画图时图例说明(legend)放到图像外侧
https://blog.csdn.net/Poul_henry/article/details/82533569 import matplotlib.pyplot as plt import num ...
- Linux命令ip addr详解
熟悉Linux操作系统的同学对于ip addr命令应该不陌生,知道它是用来查看本地IP地址的,除了IP地址,其它额外的信息有必要了解一下. root@test:~# ip addr1: lo: < ...
- 探索学习率设置技巧以提高Keras中模型性能 | 炼丹技巧
学习率是一个控制每次更新模型权重时响应估计误差而调整模型程度的超参数.学习率选取是一项具有挑战性的工作,学习率设置的非常小可能导致训练过程过长甚至训练进程被卡住,而设置的非常大可能会导致过快学习到 ...
- Mayor's posters POJ - 2528 线段树(离散化处理大数?)
题意:输入t组数据,输入n代表有n块广告牌,按照顺序贴上去,输入左边和右边到达的地方,问贴完以后还有多少块广告牌可以看到(因为有的被完全覆盖了). 思路:很明显就是线段树更改区间,不过这个区间的跨度有 ...
- Springmvc与Struts区别?
在一个技术群里看到机器人解释的二者区别,在此Mark下. 一.框架机制 spring mvc 和 struts2的加载机制不同:spring mvc的入口是servlet,而struts2是filte ...
- (17/34)AC自动机/后缀数组/后缀自动机(施工中)
快补题别再摸鱼了(17/34) 1.AC自动机 #define maxnode 1000010 #define maxsize 26 struct ahocT{ int ch[maxnode][max ...