UTF-8的字节占多少个字节?

常用中文字符用utf-8编码占用3个字节(大约2万多字),超大字符集中要占4个字节.在内存中是2个字节,真正写到硬盘上面的是3个字节。
GBK、GB2312汉字占2个字节,用iso8859-1无法表示汉字,只能转为问号。

字节流 字符流;

IO流主要是用于获取在硬盘、内存、键盘中数据;根据处理的数据的数据类型不同可以分为(1)字节流和字符流;

根据流向的不同可以分为:(2)输入流和输出流

根据作用的不同可以分为:(3)节点流和处理流.

它们都有各自的抽象父类:InputStream 和OutputStream;

字符流家族:

InputStream家族

|- FileInputStream

|-FilterInputStream

|-BufferInputStream

|-DatainputStream

|-ByteArrayInputStream

|- ObjectInputStream

|- SequenceInputSteam

|-pipeInputStream

|-StringInputStream

OutPutStream家族

|-FileOutStream

|-FilterOutStream

|-BufferedOutputStream

|-DatainputStream

|-PrintStream

|-ByteArrayOutputStream

|-ObjectOutPutSteam

|-SequenceOutputStream

|-PipeoutputStream

|-StringOutPutStream

上面的族谱可以清楚的看到,InputSteam 是所有输入字节流的抽象父类,OutputStream是所有输出字符流的抽象父类;

ByteArrayInputSteram ,StringBufferInputSteram, FileInputSteram是三种基本的介质流,他们是分别从Byte,String ,File中读取数据.pipedinputStream是在其他线程的共用管道读取数据.

那么同理的,ByteArrayOutputStream、StringBufferOutputSteramFileOutputStream 是两种基本的介质流,它们分别向Byte 数组、和File中写入数据。PipedOutputStream 是向与其它线程共用的管道中写入数据。

字符流家族

字符流以长度为16的char为单位,一般会用来读取文件.

Reader家族

|-InputStreamReader

|-FileReader

|-ObjectReader

|-CharArrayReader

|-BufferdReader

|-SequenceReader

|-PipedReader

|StringReader

Writer家族

|-OutputStream

|-FileWriter

|-CharArrayWriter

|-ObjectWriter

|-BufferedWriter

|-SequenceWriter

|-PipedWriter

|-PrintWirter

|-StringWriter

Reader是所有输入字符流抽象父类,Writer是所有输出字符流的抽象父类;

CharReader、StringReader 是两种基本的介质流,它们分别将Char 数组、String中读取数据。PipedReader 是从与其它线程共用的管道中读取数据。

InputStreamReader是一个连接字节流和字符流的桥梁,它会将字符流转变成字符流.。同理地;CharArrayWriter、StringWriter 是两种基本的介质流,它们分别向Char 数组、String 中写入数据。PipedWriter 是向与其它线程共用的管道中写入数据。

字节流和字符流区别:

(1)      读取方式不一样,字节流是读一个字节返回一个字节;字符流是读1到N个字节返回1到N个字节;

(2)     两者能够处理的数据类型不一样,字节流可以处理所有的类型的数据,MP3,MP4等等,但是字符流只能够处理字符数据。

当需要读取文本文件时会优先考虑使用字符流,其他情况就要使用字节流。

字节流和字符流的转换:

字节流和字符流的转换达到什么效果,转换顾名思义就是字符流和字节流的相互转换以及编码.

当需要字节和字符相互转换或者流的操作需要编码的时候,就需要用到转换流;

例如

InputStreamReader :把字节流转换成字符流;

OutputStreamWriter : 把字符流转转换成字节流.

	InputStreamReader isr = new InputStreamReader(new FileInputStream("e:/test.txt"),"UTF-8");

	OutputStreamWriter osw = new OutputStreamWriter(new FileOutputStream("e:/test.txt"),"UTF-8");

处理流和节点流

处理流是对一个流的连接和封装,实现数据的读写操作。

读取文件的内容,字符流的输出

/**
* 字符流的写出
*/
try(
BufferedOutputStream os=new BufferedOutputStream(new FileOutputStream(new File("test.txt")))){
os.write("saysomething".getBytes());
}
catch (FileNotFoundException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}

字节流的读取:

	public void fileread(){
/**
* 字节流的读取
*/ try(BufferedInputStream is=new BufferedInputStream(new FileInputStream(new File("text.txt")))){
byte[] buffer=new byte[1024];
int len; ByteArrayOutputStream bao=new ByteArrayOutputStream();
while((len=is.read(buffer))!=-1){
bao.write(buffer,0,len);
}
byte[] data=bao.toByteArray();
System.out.println(new String(data));
} catch (FileNotFoundException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}

以上是先把读取到的内容先存放在一个ByteArrayOutputStream中,当读取完文件的内容之后,在一次性的读取ByteArrayOutputStream中的内容,这种做法可以避免因为byte[]的大小是奇数时可能导致存放中文出现乱码的情况.

对于BufferedOutputStream

BufferedOutputStream的数据成员is也是一个位数组,默认为512字节。

当使用write()方法写入数据时实际上会先将数据写到is中,当is已满时才会实现给定的OutputStream对象的write()方法,将is数据写到目的地,而不是每次都对目的地作写入的动作。

 

BufferedWriter和PrintWriter的区别

.printWriter的print和println可以接受任意类型的参数,会自动添加换行,

bufferedwriter的writer方法只能接受字符、字符数组和字符串,对于换行就要显性的调用newLine方法了。

比如:

OutputSteam能够直接的传给PrintWriter接受;

PrintWriter pw=new PrintWriter(new BufferedoutputStreatmen(new FileOutPutStream(“abc.txt”)))

;PrintWriter pw=new PrintWriter(new BufferedWriter(new BufferedOutPutStreamWriter(xxxxx)))

(1)Printwriter相对于用户友好,出现异常也不会抛异常,需要通过checkError来获取到一场;在构造方法这块相对强,传入指定的参数可以做到自动刷新缓存,并且能够使用不同平台的换行符。

它的缺点就是它是无追加模式的,如果文件本身就有内容,那么它要写入文件的话就是要清掉文件的内容再写入。

(2)BufferedWriter就可以实现自定义缓存的大小之余,也可以实现文件内容的追加。当设置append为true的时候它就会在文件的尾部进行追加内容。Append为false则会从第一行开始覆盖(重点!!)写入。

(3)BufferedWriter和BufferOutputStream的默认buffer大小不一样 ,前者是8k chars,后者是8k bytes。

Stream和writer的区别:一个是二进制数,一个是字符数据。

 

javaIO流小结(1)的更多相关文章

  1. Java基础 Java-IO流 深入浅出

    建议阅读 重要性由高到低 Java基础-3 吃透Java IO:字节流.字符流.缓冲流 廖雪峰Java IO Java-IO流 JAVA设计模式初探之装饰者模式 为什么我觉得 Java 的 IO 很复 ...

  2. Java学习日记之 Java-IO流

    Java中的IO流在处理上分为字节流和字符流.字节流和字符流的区别 : 1.字节流读取的时候,读到一个字节就返回一个字节:  字符流使用了字节流读到一个或多个字节(中文对应的字节数是两个,在UTF-8 ...

  3. javaIO流实现读写txt文件

    javaIO流实现文件读写 文件写入: InputStreamReader BufferedReader 文件读取: FileOutputStream package javatest.basic22 ...

  4. JavaIO流中的拷贝

    JavaIO流中对数据的操作尤为重要,掌握了基本的拷贝操作,才能将各种数据源的操作联系起来. 先来看看对文件夹的拷贝吧: /** * 利用递归实现文件夹的拷贝操作 * 分析:判断 * 是文件:调用拷贝 ...

  5. java IO 流小结

    java IO 流小结 java流类图结构 流的分类 按方向 输入流 输出流 按类型 字节流 字符流 结论:只要是处理纯文本数据,就优先考虑使用字符流. 除此之外都使用字节流.

  6. JavaIO 流(1)IO流介绍

    IO流定义: 流的本质是一组单向有序,分起始和终止的数据传输过程.需要导入import java.io.* IO流分类: 按数据类型分为:字节流和字符流 字节流: 按字节进行读取(可以处理任意类型数据 ...

  7. 完美解决JavaIO流报错 java.io.FileNotFoundException: F:\ (系统找不到指定的路径。)

    完美解决JavaIO流报错 java.io.FileNotFoundException: F:\ (系统找不到指定的路径.) 错误原因 读出文件的路径需要有被拷贝的文件名,否则无法解析地址 源代码(用 ...

  8. JavaIO流(输入输出操作)

    Java中执行输出和输入操作,需要通过IO流.例如最常见的System.out.println()就是一个输出流.IO流的类比较多,但核心体系就是由File. InputStream .OutputS ...

  9. javaIO -- 流的体系设计思路、基础分类

    一.流 1. 流的含义 在程序设计中,流是对于数据流动传输的一种抽象描述任何有能力产出数据的数据源,或者有能力接受数据的接收端对象都是一个流. 2. 流的源和目的 数据可能从本地文件读取,或者写入,  ...

随机推荐

  1. Java环境的安装与配置

    Java环境的安装与配置 环境:Java8,win10 推荐oracle官网oracle官网https://www.oracle.com/index.html下载JDK进行安装 选择自己需要的版本下载 ...

  2. 层模型--固定定位(position:fixed)

    fixed:表示固定定位,与absolute定位类型类似,但它的相对移动的坐标是视图(屏幕内的网页窗口)本身. 由于视图本身是固定的,它不会随浏览器窗口的滚动条滚动而变化,除非你在屏幕中移动浏览器窗口 ...

  3. Mysql group_concat函数被截断的问题

    mysql group_concat函数被截断的问题   MySQL的 group_concat 函数默认返回1024个字节长度,超过长度的会被截断.最近程序中就遇到这个问题了. 通过如下命令可以查看 ...

  4. [翻译]jQuery十周年-John Resig

    10th Anniversary of jQuery Today marks the 10th anniversary of the release of jQuery...[原文] 今天是jQuer ...

  5. 项目任务管理(TaskMgr)技术篇

    判定是否为枚举型:type.IsEnum 应用原型:如果是枚举返回字符型,如果是其他类型直接返回: object value = pro1.FieldType.IsEnum ? pro1.GetVal ...

  6. 化简复杂逻辑,编写紧凑的if条件语句

    当业务逻辑很复杂,涉及多个条件的真假,或者多种条件下都会执行同一动作时,如何编写紧凑的if语句呢?本文借由一个实际例子,利用数学的布尔逻辑整理条件,最终产生if语句. 问题 在<X3 重聚> ...

  7. 2、MyBatis.NET学习笔记之CodeSmith使用

    说明:本系列随笔会与CSDN同步发布,当然这里先发,因为这里可以用WLW.但刚才由于误操作,没有重新发上来.只好先在CSDN先发了.重往这里发时图片无法处理,索性直接粘过来吧! 使用框架后一些相关的配 ...

  8. python 性能鸡汤

    转载自:http://www.oschina.net/question/1579_45822 1:使用内建函数input() int() isinstance() issubclass() iter( ...

  9. [BZOJ 3207] 花神的嘲讽计划Ⅰ【Hash + 可持久化线段树】

    题目链接:BZOJ - 3207 题目分析 先使用Hash,把每个长度为 k 的序列转为一个整数,然后题目就转化为了询问某个区间内有没有整数 x . 这一步可以使用可持久化线段树来做,虽然感觉可以有更 ...

  10. java学习面向对象之设计模式之单例模式

    就像上一节当中我们讲到的数组工具集一样,如果我们把他看作一个类,来应用,不阻止他new函数的话,这个类我们在整个过程当中我们只是用他来当一个工具.假如每次用都要new一下产生一个新对象的话,就会显得整 ...