BufferedInputStream实现原理分析

原文地址：http://blog.sina.com.cn/s/blog_67f995260101huxz.html

BufferedInputStream是一个带有缓冲区的输入流，通常使用它可以提高我们的读取效率，现在我们看下BufferedInputStream的实现原理：

BufferedInputStream内部有一个缓冲区，默认大小为8M，每次调用read方法的时候，它首先尝试从缓冲区里读取数据，若读取失败（缓
冲区无可读数据），则选择从物理数据源（譬如文件）读取新数据（这里会尝试尽可能读取多的字节）放入到缓冲区中，最后再将缓冲区中的内容部分或全部返回给
用户.由于从缓冲区里读取数据远比直接从物理数据源（譬如文件）读取速度快，所以BufferedInputStream的效率很高！

在具体看源码之前，我们还需要了解BufferedInputStream的mark操作：void
mark（int markLimit)

当你调用mark方法时，内部会保存一个markPos标志，它的值为目前读取字节流的pos位置，倘若你调用reset方法，这时候会把pos重置为
markPos的值，这样你就可以重读已经读过的字节.好像说的不是很清楚，那我们打个比方：有一段字节流是abcdefg,
当你读取完字母a调用mark方法（此时markPos指向字母b），接着你继续读取字母b，字母c，字母d，然后此时你调用reset方法（内部把
pos重置为markPos)，当你再读取下一个字节的时候，你会发现你读取到的是b而不是字母e，这样通过mark方法我们就是实现了重复读（re-
read
the same bytes)

mark方法中还有个参数markLimit，它的值表示在调用mark方法后reset方法前最多允许读取的字节数（根据我的测试，以及查看源代码发
现，这个最大字节数，其实是由markLimit和buffer.size中较大的那个决定的），如果超过这个限制，则在调用reset方法时会
报：Reseting
to invalid mark 异常

说完了这么多，让我们来赶紧看看源码吧：

// BufferedInputStream主要有这两个构造方法
public BufferedInputStream(InputStream in) {
this(in, defaultBufferSize); // 默认缓冲区为8M
}
public BufferedInputStream(InputStream in, int size) {
super(in);
if (size <= 0) {
throw new IllegalArgumentException("Buffer size <= 0");
}
buf = new byte[size];
}

你需要指定InputStream（装饰模式的体现）以及bufferSize(可选）

当我们调用read()方法时，它在内部做了一下事情：

public synchronized int read() throws IOException {
if (pos >= count) { // 检查是否有可读缓冲数据
fill(); // 没有缓冲数据可读，则从物理数据源读取数据并填充缓冲区
if (pos >= count) // 若物理数据源也没有多于可读数据，则返回-1，标示EOF
return -1;
}
// 从缓冲区读取buffer[pos]并返回（由于这里读取的是一个字节，而返回的是整型，所以需要把高位置0）
return getBufIfOpen()[pos++] & 0xff;
}
private byte[] getBufIfOpen() throws IOException {
byte[] buffer = buf; // buf为内部缓冲区
if (buffer == null)
throw new IOException("Stream closed");
return buffer;
}

其中pos为缓冲区buffer下一个可读的数组下标，我们可以一直从缓冲区里读取数据，直到pos变为count（此时只能从物理数据源读取数据），下面我们就分析下，当缓冲区里没有数据可读时，BufferInputStream是如何处理的：

1.若用户没有开启re-read功能（即未调用mark方法），当pos ==
count时，我们只需要将pos重新置为0，然后从物理源读取数据（假设读到了n个字节），最后把count设置成 n + pos 即可
(其实就是n，因为pos之前被设置成了0）,
当下次你在调用read方法时，就直接从缓冲读取，非常快速（如下图）；

2.若用户调用了mark方法，情况就变得很复杂了，为什么呢？
这意味着我们需要保存从markPos到pos这段数据（以供用户re-read），现在我们分情况讨论：

a.此时pos <
buffer.length，这意味着缓冲区还有多余空间，所以我们可以继续从物理数据源读取数据放入到缓冲区中（如下图）；

b.pos ==
buffer.length，这意味着缓冲区已经没有多余空间，所以只能清空缓冲区内容，但是不要忘了，我们还必须保留原来

markPos到pos那段数据，以供用户re-read，所以我需要这样做：

// 计算需要保留多少字节的数据
int sz = pos - markPos;
// 然后拷贝到缓冲头部
System.arraycopy(buffer, markpos, buffer, 0, sz);
// 重置pos以及markPos
pos=sz;
markPos=0;

接着从缓冲区的sz 到
buffer.length又变成可用区间，用来存放从物理数据源读到的数据（如下图）

到这里似乎问题完美的解决了，其实不然，我们忘记考虑markPos失效问题，以及若pos - markPos ==
buffer.length，那么移了等于白移动，还是没有挪出多余空间，所以实我们应该这样做（后面讨论都是建立在pos ==
buffer.length的基础上）：

2.1 若markPos > 0，那么 pos -
makrPos一定小于缓冲区大小，这样意味着我们按照刚才的算法挪动后，缓冲区就有了空余空间

2.2 若makrPos == 0,
这意味着需要保存的数据满满的充斥着缓冲区，所以这时候我们是无法通过挪动位置来使缓冲区有多余空间的，所以我们只可以清空或扩展缓冲区

2.2.1 当buffer.length >= marklimit时
，此时意味着markPos已经失效，用户不可以在进行re-read，所以此时我们就可以简单释放整个缓冲区了：pos=0,
markPos=-1;

2.2.2
其余情况，意味着markPos还有效，所以我们只能通过扩展缓冲区的方式来使缓冲区有多余空间

说了这么多，我们还是看下相关代码吧：

private void fill() throws IOException {
byte[] buffer = getBufIfOpen(); // 得到当前缓冲区
if (markpos < 0) // 对应情况1
pos = 0;
else if (pos >= buffer.length) // 对应情况2
if (markpos > 0) { // 对应情况2.1
int sz = pos - markpos;
System.arraycopy(buffer, markpos, buffer, 0, sz);
pos = sz;
markpos = 0;
} else if (buffer.length >= marklimit) { // 对应情况2.2.1
markpos = -1;
pos = 0;
} else { // 对应情况2.2.2
int nsz = pos * 2;
if (nsz > marklimit)
nsz = marklimit;
byte nbuf[] = new byte[nsz];
System.arraycopy(buffer, 0, nbuf, 0, pos);
...
}
count = pos;
int n = getInIfOpen().read(buffer, pos, buffer.length - pos);
if (n > 0)
count = n + pos;
}

好了关于BufferedInputStream就说道这里，它的 read(byte b[], int
off, int
len)其实内部实现也大概如此：先从缓冲区读，如果读不到则从物理数据源读取并刷新到缓冲区（可能需要对缓冲区原来内容作必要的挪动或者对缓冲区大小进行扩展）

BufferedInputStream实现原理分析的更多相关文章

【Java编程实战】Metasploit_Java后门运行原理分析以及实现源码级免杀与JRE精简化
QQ:3496925334 文章作者:MG1937 CNBLOG博客ID:ALDYS4 未经许可,禁止转载某日午睡,迷迷糊糊梦到Metasploit里有个Java平台的远控载荷,梦醒后,打开虚拟机, ...
Handler系列之原理分析
上一节我们讲解了Handler的基本使用方法,也是平时大家用到的最多的使用方式.那么本节让我们来学习一下Handler的工作原理吧!!! 我们知道Android中我们只能在ui线程(主线程)更新ui信 ...
Java NIO使用及原理分析（1-4）（转）
转载的原文章也找不到!从以下博客中找到http://blog.csdn.net/wuxianglong/article/details/6604817 转载自:李会军•宁静致远最近由于工作关系要做一 ...
原子类java.util.concurrent.atomic.*原理分析
原子类java.util.concurrent.atomic.*原理分析在并发编程下,原子操作类的应用可以说是无处不在的.为解决线程安全的读写提供了很大的便利. 原子类保证原子的两个关键的点就是:可 ...
Android中Input型输入设备驱动原理分析(一)
转自:http://blog.csdn.net/eilianlau/article/details/6969361 话说Android中Event输入设备驱动原理分析还不如说Linux输入子系统呢,反 ...
转载：AbstractQueuedSynchronizer的介绍和原理分析
简介提供了一个基于FIFO队列,可以用于构建锁或者其他相关同步装置的基础框架.该同步器(以下简称同步器)利用了一个int来表示状态,期望它能够成为实现大部分同步需求的基础.使用的方法是继承,子类通过 ...
Camel运行原理分析
Camel运行原理分析以一个简单的例子说明一下camel的运行原理,例子本身很简单,目的就是将一个目录下的文件搬运到另一个文件夹,处理器只是将文件(限于文本文件)的内容打印到控制台,首先代码如下: ...
NOR Flash擦写和原理分析
NOR Flash擦写和原理分析 1. NOR FLASH 的简单介绍 NOR FLASH 是很常见的一种存储芯片,数据掉电不会丢失.NOR FLASH支持Execute On Chip,即程序可以直 ...
使用AsyncTask异步更新UI界面及原理分析
概述: AsyncTask是在Android SDK 1.5之后推出的一个方便编写后台线程与UI线程交互的辅助类.AsyncTask的内部实现是一个线程池,所有提交的异步任务都会在这个线程池中的工作线 ...

随机推荐

bzero()等的区别
bzero 原型: extern void bzero(void *s, int n); 用法: #include <string.h> 功能:置字节字符串s的前n个字节为零. 说 ...
MVC3路由设置访问后缀 html jsp
C# Code 12345678910111213141516171819202122232425262728293031323334353637383940414243444546 publ ...
spring注解方式 idea报could not autowire，eclipse却没有问题
解决办法1: 从根本上解决: File-Project Structure 页面 Facets下删掉 Spring(直接右键Delete) 这个解答是对的.并不会降低安全性!!因为创建项目的时候,都是 ...
linux内存管理--伙伴系统和内存分配器
3.1页框的管理所有的页框描述符都存放在mem_map数组中. 3.1.1page数据结构 struct page { page_flags_t flags; //标志 atomic_t _coun ...
Java集合之List
List(列表): List的特征是其元素以线性方式存储,集合中可以存放重复对象. List接口主要实现类包括: 1.ArrayList() : 代表长度可以改变的数组.可以对元素进行随机的访问,向A ...
jQuery鼠标悬停图片放大显示
jQuery鼠标悬浮放于图片上之后图片放大显示的效果,即鼠标移到图片上图片突出显示,鼠标移开后恢复原来的模样,你可以在图片滚动效果中加上本特效,相信会更炫一些. <!DOCTYPE html P ...
java bootstrap分页
样式如下 datumMap.total总共多少页 datumMap.page第几页 <nav class="pull-right"> <ul class=&quo ...
BootStrap学习之先导篇——响应式网页
Bootstrap学习之前,要知道响应式网页的原理. 1.什么是响应式网页? 一个页面,可以根据浏览设备的不同,以及特性的不同,而自动改变布局.大小等.使得在不同的设备上上都可以呈现优秀的界面. 优点 ...
Swift 新语言开发
全书文件夹: 一.Welcome to Swift 二.Language Guide 三.Language Reference /* 译者的废话: 几个小时前熬夜看了WWDC,各种激动,今年非常有料啊 ...
Timus 1796. Amusement Park 聪明题
On a sunny Sunday, a group of children headed by their teacher came to an amusement park. Aunt Frosy ...

BufferedInputStream实现原理分析

BufferedInputStream实现原理分析的更多相关文章

随机推荐

热门专题