深入分析Java I/O 工作机制
前言 : I/O 问题是Web 应用中所面临的主要问题之一。而且是任何编程语言都无法回避的问题,是整个人机交互的核心。
java 的I/O类操作在java.io 包下,将近80个子类, 大概可以分成四个部分,
- 基于字节操作的I/O接口 :InputStream 和OutputStream
- 基于字符操作的I/O接口:Writer 和 Reader
- 基于磁盘操作的I/O接口:File
- 基于网络操作的I/O接口:Socket
1和2 主要是传输数据的格式,后面两个则是传输数据的方式。 要么数据格式影响I/O操作,要么传输方式影响I/O操作,核心问题大致可以归为这两个 。
基于字节的I/O操作接口
InputStream类层次结构
OutputStream类层次结构
操作数据的方式是可以组合使用的 例如
OutputStream out = new BufferedOutputStream (new ObjectOutputStream (new FileOutputStream ("filename")));
必须要指定数据流最终写入的地方,要么写入到磁盘,要么写到网络中,
基于字符的I/O操作接口
不论是磁盘还是网络传输,最小的存储单元都是字节,而不是字符,所以,I/O操作的都是字节而不是字符,但是为什么会有操作字符的I/O 接口?
我们在程序中通常操作的数据都是字符形式(Java中char占用2字节,C/C++中 char占用1字节),为了操作方便当然会提供一个字符接口,字符到字节必须要经过编码的转换,编码转换又十分耗时,还会出现乱码问题
Writer 类层次结构
Writer 类提供了一个抽象方法write(char cbuf[ ],int off,in len)
Reader 类层次结构
读字符的操作接口是 int read (char cbuf[ ],int off,in len),返回读到的n个字节数,不管是读还是写,他们都只定义了读取或写入的数据字符的方式,即怎么写,怎么读,并没有规定数据要读或写到哪里
字节与字符的转换接口
有时数据持久化和网络传输是以字节进行的,所有需要字节和字符之间的相互转换
InputStreamReader 类是从字节到字符的转化桥梁,从InputStream 到Reader 的过程要指定编码字符集,否则会采用操作系统默认的字符集,就会出现乱码的问题,StreamDecoder就是完成从字节到字符的编码的实现类
try{
StringBuffer str = new StringBuffer();
char [] buf = new char[1024]
FileReader f = new FileReader("filename")
while(f.read(buf)>0){
str.append(buf);
}
str.tostring(); }catch (IOException e){ }
FileReader 就是按照上面的工作方式来读取文件的,FileReader 类继承了InputStreamReader类,实际上是读取文件流,然后通过StreamDecoder 解码成char,这里的解码字符集是默认字符集。
磁盘I/O工作机制
1, 标准访问文件的方式
当应用程序调用read() 接口时候,操作系统检查在内核的高速缓存中有没有需要的数据,如果已经缓存了那么就直接从缓存中取出返回,如果没有,则从磁盘中读取,然后缓存在操作系统的缓存中。
写入的方式是,用户的应用程序调用write() 接口将数据从用户地址空间复制到内核地址空间的缓存中,这时对用户程序来说,写操作就已经完成了,至于什么时候写入到磁盘中去,由操作系统决定,除非显示的调用了sync同步命令。
标准文件访问方式
2, 直接I/O的方式
即应用程序直接访问磁盘数据而不经过操作系统内核数据缓冲区,这样减少了一次从内核缓冲区到用户程序缓存的复制, 这种访问方式通常在对数据的缓存管理由应用程序实现的数据库管理系统中,在数据库管理系统中,系统明确的知道应该缓存哪些数据,应该失效哪些数据,还可以对一些热点数据做预加载,提前将数据加载到内存,可以加速数据访问效率,在这些情况下,如果由操作系统进行缓存就很难做到,操作系统不知道哪些是热点数据,哪些数据只会访问一次就不会再访问,操作系统只是简单的缓存最近一次从磁盘读取的数据,
但是直接I/O的话也会有负面影响: 如果访问的数据不在应用程序缓存中,那么每次数据都要直接从磁盘进行预加载,这种直接加载会十分缓慢,通常直接I/O 与异步I/O结合使用会有比较好的性能。
直接I/O 的方式
3, 同步访问文件的方式
同步访问文件的方式比较容易理解,就是数据读取和写入都是同步操作的,与标准文件访问方式不同的是,只有当数据被成功写到磁盘时才返回给应用程序成功的标志, 这种访问方式的性能比较差,只有在对数据安全性较高的场景中才会使用,而且通常这种操作方式的硬件都是定制的。
同步访问文件的方式
4, 异步访问文件的方式
异步访问文件的方式是当访问数据的线程发出请求之后,线程会接着去处理其他事,而不是阻塞等待,当请求的数据返回之后,继续处理下面的操作, 这种访问文件的方式可以明显的提高应用程序的效率,但是不会改变访问文件的效率
异步访问文件的方式
5, 内存映射的方式
内存映射是指操作系统将内存中的某一块区域与磁盘中的文件关联起来,当要访问内存中的一段数据的时候,转换为访问文件的某一段数据,这种方式的目的同样是减少数据从内核空间缓存到用户空间缓存的数据复制操作,因为这两个数据空间的数据是共享的。
内存映射方式
深入分析Java I/O 工作机制的更多相关文章
- 2 深入分析 Java IO的工作机制(一)
大部分Web应用系统的瓶颈都是I/O瓶颈 2.1 Java的I/O类库的基本架构 Java的I/O操作类在包java.io下,大概有将近80个类,这些类大概可以分成如下4组. 基于字节操作的I/O接口 ...
- 2 深入分析 Java IO的工作机制(二)
2.5 I/O调优 下面总结一些磁盘I/O和网络I/O的常用优化技巧. 2.5.1 磁盘I/O优化 1. 性能检测 应用程序通常都需要访问磁盘来读取数据,而磁盘I/O通常都很耗时,要判断I/O是否是一 ...
- java I/O工作机制
java I/O 的基本架构: 1:基于字节操作的I/O接口 InputStream OutputStream 2:基于字符操作的I/O接口 Writer 和Reader 3:基于磁盘操作的I/O接口 ...
- Java I/O 工作机制(一) —— Java 的 I/O 类库的基本架构
Java 的 I/O 类库的基本架构 Java 的 I/O 操作类在包 java.io 下,有将近 80 个类. 按数据格式分类: 面向字节(Byte)操作的 I/O 接口:InputStream 和 ...
- Java I/O 工作机制(二) —— Java 的 I/O 的交互方式分析
简介: BIO:同步阻塞式IO,服务器实现模式为一个连接一个线程,即客户端有连接请求时服务器端就需要启动一个线程进行处理,如果这个连接不做任何事情会造成不必要的线程开销,当然可以通过线程池机制改善. ...
- Java Web ClassLoader工作机制
一.ClassLoader的作用: 1.类加载机制:父优先的等级加载机制 2.类加载过程 3.将Class字节码重新解析成JVM统一要求的对象格式 二.ClassLoader常用方法 1.define ...
- Java Socket 的工作机制
转载,请加上原文链接: 目录 socket 对象的创建时间 socket 通信可能会造成死锁 socket 对象的创建时间 这里需要一点TCP的知识, TCP状态分析请看 --> TCP转态转换 ...
- 深入分析 Java I/O 的工作机制--转载
Java 的 I/O 类库的基本架构 I/O 问题是任何编程语言都无法回避的问题,可以说 I/O 问题是整个人机交互的核心问题,因为 I/O 是机器获取和交换信息的主要渠道.在当今这个数据大爆炸时代, ...
- 深入分析 Java I/O 的工作机制
I/O 问题可以说是当今互联网 Web 应用中所面临的主要问题之一,因为当前在这个海量数据时代,数据在网络中随处流动.这个流动的过程中都涉及到 I/O 问题,可以说大部分 Web 应用系统的瓶颈都是 ...
随机推荐
- zookeeper应用场景-java
声明,本文是复制别人的文章,感觉还行,原文:http://www.cnblogs.com/xymqx/p/4465610.html 本人热爱技术,跪求有好的技术文章希望大家多多分享,谢谢.... Zo ...
- 代码方式设置WordPress内所有URL链接都在新标签页打开
本文由荒原之梦原创,原文链接:http://zhaokaifeng.com/?p=699 前言: WordPress默认情况下几乎所有URL链接都是在同一个标签页打开.这样的话,读者点击一个链接就会离 ...
- Spring Boot中使用Actuator的/info端点输出Git版本信息
对于Spring Boot的Actuator模块相信大家已经不陌生了,尤其对于其中的/health./metrics等强大端点已经不陌生(如您还不了解Actuator模块,建议先阅读<Sprin ...
- aliyun oss操作汇总
// endpoint以杭州为例,其它region请按实际情况填写 String endpoint = "http://oss-cn-hangzhou.aliyuncs.com"; ...
- 让站点支持MarkDown语法~(转)
Markdown是一种可以使用普通文本编辑器编写的标记语言,通过类似HTML的标记语法,它可以使普通文本内容具有一定的格式.Markdown的语法简洁明了.学习容易,而且功能比纯文本更强,因此有很多人 ...
- 在线OJ使用总结(acm)
赛码网OJ规则 用readLine()代替read_line() 用readLine()代替read_line() 用readLine()代替read_line() 用readLine()代替read ...
- java 匿名对象,内部类,修饰符,代码块
匿名对象是在建对象时只有创建对象的语句方法而没有把对象的地址赋值给变量,匿名对象只能调用一次方法,想再调用时需要再创建一个新的匿名对象 创建普通对象:Person p =new Person(); 创 ...
- Python集合set
集合 set 集合是无序的 集合的值是唯一的 求两个集合的关系: list1 = [1,4,5,7,3,6,7,9] list2 = set([2,6,0,66,22,8,4]) list3 = se ...
- 开源方案搭建可离线的精美矢量切片地图服务-3.Mapbox个性化地图定制入门
1.简介 mapbox是一家非常牛的公司,比如像特斯拉.DJI大疆创新.孤独星球.Airbnb.GitHub.Cisco.Snap.飞猪.Keep.Bosch这些在国内外各自领域中响当当的企业都是它的 ...
- 聚焦“云开发圆桌论坛”,大前端Serverless大佬们释放了这些讯号!
4月14日,由云加社区举办的TVP&腾讯云技术交流日云开发专场,暨"腾讯云-云开发圆桌论坛"在北京.深圳两地同步举行. 当天下午,一场主题为"基于大前端和node ...