BufferedInputStream详解

BufferedInputStream是一个带有缓冲区域的InputStream,它的继承体系如下：

InputStream

|__FilterInputStream

|__BufferedInputStream

首先了解一下FilterInputStream：

FilterInputStream通过装饰器模式将InputStream封装至内部的一个成员变量：

protected volatile InputStream in;

需要注意的是该成员变量使用了volatile关键字进行修饰，这意味着该成员变量的引用的内存可见性为多线程即时可见的。

其它地方FilterInputStream将所有的操作委托给了in这个成员进行操作。

了解了这些过后，来仔细看看BufferedInputStream的成员变量：

//该变量定义了默认的缓冲大小
protected volatile byte buf[]; //缓冲数组，注意该成员变量同样使用了volatile关键字进行修饰，作用为在多线程环境中，当对该变量引用进行修改时保证了内存的可见性。
private static final AtomicReferenceFieldUpdater<BufferedInputStream, byte[]> bufUpdater = AtomicReferenceFieldUpdater.newUpdater(BufferedInputStream.class, byte[].class, "buf")//缓存数组的原子更新器，该成员变量与buf数组的volatile关键字共同组成了buf数组的原子更新功能实现。
protected int count;//该成员变量表示目前缓冲区域中有多少有效的字节。
protected int pos;//该成员变量表示了当前缓冲区的读取位置。
;/*表示标记位置，该标记位置的作用为：实现流的标记特性，即流的某个位置可以被设置为标记，允许通过设置reset()，将流的读取位置进行重置到该标记位置，但是InputStream注释上明确表示，该流不会无限的保证标记长度可以无限延长，即markpos=15,pos=139734，该保留区间可能已经超过了保留的极限（如下）*/
protected int marklimit;/*该成员变量表示了上面提到的标记最大保留区间大小，当pos-markpos> marklimit时，mark标记可能会被清除（根据实现确定）。*/

通过构造函数可以看到：初始化了一个byte数组作为缓冲区域

public BufferedInputStream(InputStream in, int size) {
super(in);
) {
throw new IllegalArgumentException("Buffer size <= 0");
}
buf = new byte[size];
}

这个类中最为重要的方法是fill()方法，它提供了缓冲区域的读取、写入、区域元素的移动更新等。下面着重分析一下该方法：

private void fill() throws IOException {
byte[] buffer = getBufIfOpen();
) ｛
/*如果不存在标记位置（即没有需要进行reset的位置需求）
则可以进行大胆地直接重置pos标识下一可读取位置,但是这样
不是会读取到以前的旧数据吗？不用担心，在后面的代码里☆会实现输入流的新
数据填充*/
;
｝else if (pos >= buffer.length)｛
/* 位置大于缓冲区长度，这里表示已经没有可用空间了 */
) {
/* 表示存在mark位置，则要对mark位置到pos位置的数据予以保留，
以确保后面如果调用reset()重新从mark位置读取会取得成功*/
int sz = pos - markpos;
/*该实现是通过将缓冲区域中markpos至pos部分的移至缓冲区头部实现*/
, sz);
pos = sz;
;
} else if (buffer.length >= marklimit) {
/* 如果缓冲区已经足够大，可以容纳marklimit，则直接重置*/
;
;/* 丢弃所有的缓冲区内容 */
} else {
/* 如果缓冲区还能增长的空间，则进行缓冲区扩容*/
;
/*新的缓冲区大小设置成满足最大标记极限即可*/
if (nsz > marklimit)
nsz = marklimit;
byte nbuf[] = new byte[nsz];
//将原来的较小的缓冲内容COPY至增容的新缓冲区中
, nbuf, 0, pos);
//这里使用了原子变量引用更新，确保多线程环境下内存的可见性
if (!bufUpdater.compareAndSet(this, buffer, nbuf)) {
// Can't replace buf if there was an async close.
// Note: This would need to be changed if fill()
// is ever made accessible to multiple threads.
// But for now, the only way CAS can fail is via close.
// assert buf == null;
throw new IOException("Stream closed");
}
buffer = nbuf;
}
count = pos;
//从原始输入流中读取数据，填充缓冲区
int n = getInIfOpen().read(buffer, pos, buffer.length - pos);
//根据实际读取的字节数更新缓冲区中可用字节数
)
count = n + pos;
}

整个fill的过程，可以看作是BufferedInputStream对外提供滑动读取的功能实现，通过预先读入一整段原始输入流数据至缓冲区中，而外界对BufferedInputStream的读取操作实际上是在缓冲区上进行，如果读取的数据超过了缓冲区的范围，那么BufferedInputStream负责重新从原始输入流中载入下一截数据填充缓冲区，然后外界继续通过缓冲区进行数据读取。这样的设计的好处是：避免了大量的磁盘IO，因为原始的InputStream类实现的read是即时读取的，即每一次读取都会是一次磁盘IO操作（哪怕只读取了1个字节的数据），可想而知，如果数据量巨大，这样的磁盘消耗非常可怕。而通过缓冲区的实现，读取可以读取缓冲区中的内容，当读取超过缓冲区的内容后再进行一次磁盘IO，载入一段数据填充缓冲，那么下一次读取一般情况下就直接可以从缓冲区读取，减少了磁盘IO。减少的磁盘IO大致可以通过以下方式计算（限read()方式）：

length 流的最终大小

bufSize 缓冲区大小

则通过缓冲区实现的输入流BufferedInputStream的磁盘IO数为原始InputStream磁盘IO的

1/(length/bufSize)

read方法解析：该方法返回当前位置的后一位置byte值（int表示）.

public synchronized int read() throws IOException {
if (pos >= count) {
/*表示读取位置已经超过了缓冲区可用范围，则对缓冲区进行重新填充*/
fill();
/*当填充后再次读取时发现没有数据可读，证明读到了流末尾*/
if (pos >= count)
;
}
/*这里表示读取位置尚未超过缓冲区有效范围，直接返回缓冲区内容*/
return getBufIfOpen()[pos++] & 0xff;
}

一次读取多个字节（尽量读，非贪婪)

private int read1(byte[] b, int off, int len) throws IOException {
int avail = count - pos;
) {
/*这里使用了一个巧妙的机制，如果读取的长度大于缓冲区的长度
并且没有markpos，则直接从原始输入流中进行读取，从而避免无谓的
COPY（从原始输入流至缓冲区，读取缓冲区全部数据，清空缓冲区，
重新填入原始输入流数据）*/
) {
return getInIfOpen().read(b, off, len);
}
/*当无数据可读时，从原始流中载入数据到缓冲区中*/
fill();
avail = count - pos;
) return -1;
}
int cnt = (avail < len) ? avail : len;
/*从缓冲区中读取数据，返回实际读取到的大小*/
System.arraycopy(getBufIfOpen(), pos, b, off, cnt);
pos += cnt;
return cnt;
}

以下方法和上面的方法类似，唯一不同的是，上面的方法是尽量读，读到多少是多少，而下面的方法是贪婪的读，没有读到足够多的数据（len）就不会返回，除非读到了流的末尾。该方法通过不断循环地调用上面read1方法实现贪婪读取。

public synchronized int read(byte b[], int off, int len)
throws IOException
{
getBufIfOpen(); // Check for closed stream
) {
throw new IndexOutOfBoundsException();
) {
;
}
;
for (;;) {
int nread = read1(b, off + n, len - n);
)
) ? nread : n;
n += nread;
if (n >= len)
return n;
// if not closed but no bytes available, return
InputStream input = in;
)
return n;
}
}

略过多少字节

public synchronized long skip(long n) throws IOException {
getBufIfOpen(); // Check for closed stream
) {
;
}
long avail = count - pos;
) {
// If no mark position set then don't keep in buffer
//从上面的注释可以知道，这也是一个巧妙的方法，如果没有mark标记，
// 则直接从原始输入流中skip
)
return getInIfOpen().skip(n);
// Fill in buffer to save bytes for reset
fill();
avail = count - pos;
)
;
}
//该方法的实现为尽量原则，不保证一定略过规定的字节数。
long skipped = (avail < n) ? avail : n;
pos += skipped;
return skipped;
}

估计目前可用的字节数，原始流中可用的字节数+缓冲区中可用的字节数

public synchronized int available() throws IOException {
return getInIfOpen().available() + (count - pos);
}

标记位置：

public synchronized void mark(int readlimit) {
marklimit = readlimit;
markpos = pos;
}

重置位置：该实现清晰的表明下一读取位置被推到了以前的标记位置，以实现重新读取区段的功能

public synchronized void reset() throws IOException {
getBufIfOpen(); // Cause exception if closed
)
throw new IOException("Resetting to invalid mark");
pos = markpos;
}

关闭流：首先通过线程安全的方式设置了内部的缓冲区引用为空，然后再对原始输入流进行关闭。

public void close() throws IOException {
byte[] buffer;
while ( (buffer = buf) != null) {
if (bufUpdater.compareAndSet(this, buffer, null)) {
InputStream input = in;
in = null;
if (input != null)
input.close();
return;
}
// Else retry in case a new buf was CASed in fill()
}
}

BufferedInputStream详解的更多相关文章

java中的io系统详解 - ilibaba的专栏 - 博客频道 - CSDN.NET
java中的io系统详解 - ilibaba的专栏 - 博客频道 - CSDN.NET 亲,“社区之星”已经一周岁了! 社区福利快来领取免费参加MDCC大会机会哦 Tag功能介绍—我们 ...
Java反射机制详解
Java反射机制是在运行状态中,对于任意一个类,都能够知道这个类的所有属性和方法:对于任意一个对象,都能够调用它的任意一个方法和属性:这种动态获取的信息以及动态调用对象的方法的功能称为Java语言的反 ...
URLConnection类详解-转
转-http://www.cnblogs.com/shijiaqi1066/p/3753224.html 1. URLConnection概述 URLConnection是一个抽象类,表示指向URL指 ...
Java IO 详解
Java IO 详解初学java,一直搞不懂java里面的io关系,在网上找了很多大多都是给个结构图草草描述也看的不是很懂.而且没有结合到java7 的最新技术,所以自己来整理一下,有错的话请指正, ...
基于JavaSE阶段的IO流详解
1.IO流基本概述在Java语言中定义了许多针对不同的传输方式,最基本的就是输入输出流(俗称IO流),IO流是属于java.io包下的内容,在JavaSE阶段主要学下图所示的: 其中从图中可知,所有 ...
java基础之JDBC一：概述及步骤详解
1. JDBC的简介概述: 就是Java用来操作不同数据库(DBMS)的类库(技术), 本质就是一些类和接口. /* 类: DriverManager 接口: Driver, Connection, ...
Android 多线程之IntentService 完全详解
关联文章: Android 多线程之HandlerThread 完全详解 Android 多线程之IntentService 完全详解 android多线程-AsyncTask之工作原理深入解析(上) ...
Android 多线程之HandlerThread 完全详解
关联文章: Android 多线程之HandlerThread 完全详解 Android 多线程之IntentService 完全详解 android多线程-AsyncTask之工作原理深入解析(上) ...
Properties类使用详解
Java Properties类使用详解概述 Properties 继承于 Hashtable.表示一个持久的属性集,属性列表以key-value的形式存在,key和value都是字符串. Pr ...

随机推荐

ThinkPHP 中使用 PHPMailer 发送邮件支持163和QQ邮箱等
[摘要]ThinkPHP是一个开源的PHP框架, 是为了简化企业级应用开发和敏捷WEB应用开发而诞生的.本文介绍ThinkPHP 中使用 PHPMailer 发送邮件. PHP是自带可以发送邮件的Ma ...
float浮动引起的ul高度崩溃与overflow的关系
今天遇到的问题真的让人不得不吐槽,因为一个很小的问题,花费了半天的时间来才解决这个问题.一直认为自己对Html与Css了解应该算蛮不错的,但是今天遇到的事情让我不得不反省自己的学习心态上的错误 ...
jdbc 安装驱动
在使用JDBC编程时需要连接数据库,导入JAR包是必须的,导入其它的jar包方法同样如此,导入的方法是打开eclipse 1.右击要导入jar包的项目,点properties 2.左边选择java ...
golang中设置Host Header的小Tips
前言笔者最近时间一直在学习和写Ruby和Go,尤其是Go,作为云计算时代的标准语言,写起来还是相当有感觉的,难过其会越来越火. 不过写的过程中,也遇到了一些小问题,本文就是分享关于go语言设置 HT ...
GO语言中的指针
http://www.tizgrape.com/?p=100 Go语言中的指针语法和C++一脉相承,都是用*作为符号,虽然语法上接近,但是实际差异不小. Go使用var定义变量: var v6 *in ...
bzoj 3751: [NOIP2014]解方程同余系枚举
3.解方程(equation.cpp/c/pas)[问题描述]已知多项式方程:a ! + a ! x + a ! x ! + ⋯ + a ! x ! = 0求这个方程在[1, m]内的整数解(n 和 ...
mysql优化21条经验（转）
今天,数据库的操作越来越成为整个应用的性能瓶颈了,这点对于Web应用尤其明显.关于数据库的性能,这并不只是DBA才需要担心的事,而这更是我们程序员需要去关注的事情.当我们去设计数据库表结构,对操作数 ...
【POJ】2155 Matrix
二维树状数组. /* poj2155 */ #include <iostream> #include <string> #include <map> #includ ...
spring中context:property-placeholder/元素转载
spring中context:property-placeholder/元素转载 1.有些参数在某些阶段中是常量比如 :a.在开发阶段我们连接数据库时的连接url,username,passwo ...
Screen-Space Bent Cones (SSBC) in Unity5
噪音少.高度保留了纹理细节博主近期渲染:最近用unity5弄的一些渲染 ---- by wolf96 http://blog.csdn.net/wolf96

BufferedInputStream详解

BufferedInputStream详解的更多相关文章

随机推荐

热门专题