关于对inputstream流的复制

今天因为项目需要，获取到一个inputstream后，可能要多次利用它进行read的操作。由于流读过一次就不能再读了，所以得想点办法。

而InputStream对象本身不能复制，因为它没有实现Cloneable接口。此时，可以先把InputStream转化成ByteArrayOutputStream，后面要使用InputStream对象时，再从ByteArrayOutputStream转化回来就好了。代码实现如下：

InputStream input = httpconn.getInputStream();
ByteArrayOutputStream baos = new ByteArrayOutputStream();
byte[] buffer = new byte[1024];
int len;
while ((len = input.read(buffer)) > -1 ) {
baos.write(buffer, 0, len);
}
baos.flush();
InputStream stream1 = new ByteArrayInputStream(baos.toByteArray());
//TODO:显示到前台
InputStream stream2 = new ByteArrayInputStream(baos.toByteArray());
//TODO:本地缓存

InputStream input =  httpconn.getInputStream();

ByteArrayOutputStream baos = new ByteArrayOutputStream();

byte[] buffer = new byte[1024];

int len;

while ((len = input.read(buffer)) > -1 ) {

	baos.write(buffer, 0, len);

}

baos.flush();	           

InputStream stream1 = new ByteArrayInputStream(baos.toByteArray());

//TODO:显示到前台

InputStream stream2 = new ByteArrayInputStream(baos.toByteArray());

//TODO:本地缓存

这种适用于一些不是很大的流，因为缓存流是会消耗内存的，还有一种方法是用到了流的mark 和 reset方法。
其实InputStream本身提供了三个接口： 第一个，InputStream是否支持mark，默认不支持。

public boolean markSupported() {
return false;
}

public boolean markSupported() {

   return false;

}

第二个，mark接口。该接口在InputStream中默认实现不做任何事情。

public synchronized void mark(int readlimit) {}

public synchronized void mark(int readlimit) {}

第三个，reset接口。该接口在InputStream中实现，调用就会抛异常。

public synchronized void reset() throws IOException {
throw new IOException("mark/reset not supported");
}

public synchronized void reset() throws IOException {

   throw new IOException("mark/reset not supported");

}

从三个接口定义中可以看出，首先InputStream默认是不支持mark的，子类需要支持mark必须重写这三个方法。 第一个接口很简单，就是标明该InputStream是否支持mark。 mark接口的官方文档解释： “在此输入流中标记当前的位置。对 reset 方法的后续调用会在最后标记的位置重新定位此流，以便后续读取重新读取相同的字节。  readlimit 参数告知此输入流在标记位置失效之前允许读取许多字节。  
mark 的常规协定是：如果方法 markSupported 返回 true，则输入流总会在调用 mark 之后记住所有读取的字节，并且无论何时调用方法 reset ，都会准备再次提供那些相同的字节。但是，如果在调用 reset 之前可以从流中读取多于 readlimit 的字节，则根本不需要该流记住任何数据。” 
reset接口的官方文档解释：   将此流重新定位到对此输入流最后调用 mark 方法时的位置。   reset 的常规协定是：  
 如果方法 markSupported 返回 true，则：   如果创建流以来未调用方法 mark，或最后调用 mark 以来从该流读取的字节数大于最后调用 mark 时的参数，则可能抛出 IOException。   如果未抛出这样的 IOException，则将该流重新设置为这种状态：最近调用 mark 以来（或如果未调用 mark，则从文件开始以来）读取的所有字节将重新提供给 read 方法的后续调用方，后接可能是调用 reset 时的下一输入数据的所有字节。   如果方法 markSupported 返回 false，则：   对 reset 的调用可能抛出 IOException。   如果未抛出 IOException，则将该流重新设置为一种固定状态，该状态取决于输入流的特定类型和其创建方式的固定状态。提供给 read 方法的后续调用方的字节取决于特定类型的输入流。    
 简而言之就是：  调用mark方法会记下当前调用mark方法的时刻，InputStream被读到的位置。  调用reset方法就会回到该位置。  举个简单的例子：

String content = "BoyceZhang!";
InputStream inputStream = new ByteArrayInputStream(content.getBytes());
// 判断该输入流是否支持mark操作
if (!inputStream.markSupported()) {
System.out.println("mark/reset not supported!");
}
int ch;
boolean marked = false;
while ((ch = inputStream.read()) != -1) {
//读取一个字符输出一个字符
System.out.print((char)ch);
//读到 'e'的时候标记一下
if (((char)ch == 'e')& !marked) {
inputStream.mark(content.length()); //先不要理会mark的参数
marked = true;
}
//读到'!'的时候重新回到标记位置开始读
if ((char)ch == '!' && marked) {
inputStream.reset();
marked = false;
}
}
//程序最终输出：BoyceZhang!Zhang!

String content = "BoyceZhang!";

InputStream inputStream = new ByteArrayInputStream(content.getBytes());

// 判断该输入流是否支持mark操作

if (!inputStream.markSupported()) {

    System.out.println("mark/reset not supported!");

}

int ch;

boolean marked = false;

while ((ch = inputStream.read()) != -1) {

    //读取一个字符输出一个字符

    System.out.print((char)ch);

    //读到 'e'的时候标记一下

     if (((char)ch == 'e')& !marked) {

        inputStream.mark(content.length());  //先不要理会mark的参数

         marked = true;

     }  

     //读到'!'的时候重新回到标记位置开始读

      if ((char)ch == '!' && marked) {

          inputStream.reset();

          marked = false;

      }

}

//程序最终输出：BoyceZhang!Zhang!

看了这个例子之后对mark和reset接口有了很直观的认识。 但是mark接口的参数readlimit究竟是干嘛的呢？ 我们知道InputStream是不支持mark的。要想支持mark子类必须重写这三个方法，我想说的是不同的实现子类，mark的参数readlimit作用不尽相同。 常用的FileInputStream不支持mark。 1. 对于BufferedInputStream，readlimit表示：InputStream调用mark方法的时刻起，在读取readlimit个字节之前，标记的该位置是有效的。如果读取的字节数大于readlimit，可能标记的位置会失效。 
在BufferedInputStream的read方法源码中有这么一段：

} else if (buffer.length >= marklimit) {
markpos = -1; /* buffer got too big, invalidate mark */
pos = 0; /* drop buffer contents */
} else { /* grow buffer */

} else if (buffer.length >= marklimit) {

     markpos = -1;   /* buffer got too big, invalidate mark */

     pos = 0;        /* drop buffer contents */

     } else {            /* grow buffer */

为什么是可能会失效呢？ 因为BufferedInputStream读取不是一个字节一个字节读取的，是一个字节数组一个字节数组读取的。 例如，readlimit=35，第一次比较的时候buffer.length=0（没开始读）<readlimit 然后buffer数组一次读取48个字节。这时的read方法只会简单的挨个返回buffer数组中的字节，不会做这次比较。直到读到buffer数组最后一个字节（第48个）后，才重新再次比较。这时如果我们读到buffer中第47个字节就reset。mark仍然是有效的。虽然47>35。 
2. 对于InputStream的另外一个实现类：ByteArrayInputStream，我们发现readlimit参数根本就没有用，调用mark方法的时候写多少都无所谓。

public void mark(int readAheadLimit) {
mark = pos;
}
public synchronized void reset() {
pos = mark;
}

public void mark(int readAheadLimit) {

   mark = pos;

}

public synchronized void reset() {

   pos = mark;

}

因为对于ByteArrayInputStream来说，都是通过字节数组创建的，内部本身就保存了整个字节数组，mark只是标记一下数组下标位置，根本不用担心mark会创建太大的buffer字节数组缓存。 
3. 其他的InputStream子类没有去总结。原理都是一样的。 
所以由于mark和reset方法配合可以记录并回到我们标记的流的位置重新读流，很大一部分就可以解决我们的某些重复读的需要。  这种方式的优点很明显：不用缓存整个InputStream数据。对于ByteArrayInputStream甚至没有任何的内存开销。  当然这种方式也有缺点：就是需要通过干扰InputStream的读取细节，也相对比较复杂。

关于对inputstream流的复制的更多相关文章

Java实现inputstream流的复制
获取到一个inputstream后,可能要多次利用它进行read的操作.由于流读过一次就不能再读了,而InputStream对象本身不能复制,而且它也没有实现Cloneable接口,所以得想点办法. ...
IO流，字节流复制文件，字符流+缓冲复制文件
JAVAIO如果按流向分:输入流和输出流两种输入流的基类:InputStream Reader 输出流的基类:OutputStream Writer 如果按数据单元划分:字节流和字符流字节 ...
Java基础知识强化之IO流笔记39：字符流缓冲流之复制文本文件案例01
1. 字符流缓冲流之复制文本文件案例需求:把当前项目目录下的a.txt内容复制到当前项目目录下的b.txt中数据源: a.txt -- 读取数据 -- 字符转换流 -- InputStreamRe ...
InputStream流无法重复读取的解决办法
前言:今天工作的需要需要读取aws云上S3桶里面的PDF数据,第一步能够正常的获取PDF文件的InputStream流,然后,我为了测试使用了IOUtils.toString(is)将流System. ...
Java io流完成复制粘贴功能
JAVA 中io字节输入输出流完成复制粘贴功能: public static void main(String[] args) throws Exception{ // 创建输入流要读 ...
Java基础知识强化之IO流笔记41：字符流缓冲流之复制文本文件案例02（使用 [ newLine() / readLine() ] ）（重要）
1. 使用字符流缓冲流的特殊功能 [ newLine() / readLine() ] 需求:把当前项目目录下的a.txt内容复制到当前项目目录下的b.txt中数据源: a.txt -- 读取数据 ...
java学习笔记之字符流文件复制
字符文件复制 FileReader fr =new FileReader("b.txt");//绑定源文件 FileWriter fw= new FileWriter(" ...
JAVA IO流 InputStream流 Read方法
read()首先我们来看这个没有参数的read方法,从(来源)输入流中(读取的内容)读取数据的下一个字节到(去处)java程序内部中,返回值为0到255的int类型的值,返回值为字符的ACSII值(如 ...
Java之字符流操作-复制文件
package test_demo.fileoper; import java.io.*; /* * 字符输入输出流操作,复制文件 * 使用缓冲流扩展,逐行复制 * */ public class F ...

随机推荐

NPOI 操作Excel
关于NPOI NPOI是POI项目的.NET版本,是由@Tony Qu(http://tonyqus.cnblogs.com/)等大侠基于POI开发的,可以从http://npoi.codeplex. ...
Setup Spark source code environment
1. Install Java and set JAVA_HOME 2. Install Eclipse Juno Java IDE, Scala plugin and Scala Test 3. D ...
spirng线程池的配置与使用
1.在xml中配置线程池  <bean id="taskExecutor" class="org.springframewo ...
ubuntu下firefox浏览器flash player插件的安装
自从装了双系统后,ubuntu下的音乐软件只能选择网页播放器了,这无疑是需要播放插件的,这个插件就是falsh player. 当初使用usb启动盘安装的,在安装的过程中还会报找不到CD-rom的错, ...
Objective-C学习笔记－第二天(1)
Objective-C中,调用方法采用的是一种消息传递机制. 参考文章:http://blog.csdn.net/xingyevc/article/details/39397873 如果向某个对象传递 ...
E1_1 用邻接矩阵存储有向图，并输出各顶点的出度和入度
参考书:图论算法理论.实现及应用(北京大学出版社) 输入数据:(test.txt) 程序: /* 邻接矩阵存储有向图 */ #include <cstring> #include < ...
codeforces 711D Directed Roads（DFS）
题目链接:http://codeforces.com/problemset/problem/711/D 思路:由于每个点出度都为1,所以没有复杂的环中带环.DFS遍历,若为环则有2^k-2种,若为链则 ...
LayaAir引擎——（一）
LayaAir是LayaBox推出的Html5游戏引擎,支持 ActionScript3.TypeScript.JavaScript,开源,并且商用免费. LayaAir IDE 是一款使用Lay ...
LInux内核分析——计算机是如何工作的进行
万子惠 + 原创作品转载请注明出处 + <Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-1000029000 " 实 ...
java学习第十一天
第十二次课目标一维数组(创建访问) 一.概念与特点 1.概念相同数据类型的有序集合[] 数组名: 容器的名字元素: 下标变量,数组名[下标] 长度: length 下标: 位置.索引 ...

关于对inputstream流的复制

关于对inputstream流的复制的更多相关文章

随机推荐

热门专题