Java IO读写大文件的几种方式及测试
读取文件大小:1.45G
第一种,OldIO:
- public static void oldIOReadFile() throws IOException{
- BufferedReader br = new BufferedReader(new FileReader("G://lily_947.txt"));
- PrintWriter pw = new PrintWriter("G://oldIO.tmp");
- char[] c = new char[100*1024*1024];
- for(;;){
- if(br.read(c)!=-1){
- pw.print(c);
- }else{
- break;
- }
- }
- pw.close();
- br.close();
- }
耗时70.79s
第二种,newIO:
- public static void newIOReadFile() throws IOException{
- FileChannel read = new RandomAccessFile("G://lily_947.txt","r").getChannel();
- FileChannel writer = new RandomAccessFile("G://newIO.tmp","rw").getChannel();
- ByteBuffer bb = ByteBuffer.allocate(200*1024*1024);
- while(read.read(bb)!=-1){
- bb.flip();
- writer.write(bb);
- bb.clear();
- }
- read.close();
- writer.close();
- }
耗时47.24s
第三种,RandomAccessFile:
- public static void randomReadFile() throws IOException{
- RandomAccessFile read = new RandomAccessFile("G://lily_947.txt","r");
- RandomAccessFile writer = new RandomAccessFile("G://random.tmp","rw");
- byte[] b = new byte[200*1024*1024];
- while(read.read(b)!=-1){
- writer.write(b);
- }
- writer.close();
- read.close();
- }
耗时46.65
第四种,MappedByteBuffer:
- public static void mappedBuffer() throws IOException{
- FileChannel read = new FileInputStream("G://lily_947.txt").getChannel();
- FileChannel writer = new RandomAccessFile("G://buffer.tmp","rw").getChannel();
- long i = 0;
- long size = read.size()/30;
- ByteBuffer bb,cc = null;
- while(i<read.size()&&(read.size()-i)>size){
- bb = read.map(FileChannel.MapMode.READ_ONLY, i, size);
- cc = writer.map(FileChannel.MapMode.READ_WRITE, i, size);
- cc.put(bb);
- i+=size;
- bb.clear();
- cc.clear();
- }
- bb = read.map(FileChannel.MapMode.READ_ONLY, i, read.size()-i);
- cc.put(bb);
- bb.clear();
- cc.clear();
- read.close();
- writer.close();
- }
耗时:36
前三种读法对应的资源占用图如下:
相对于最后一种内存直接映射方式前面的测试其实无意义,基本秒杀。。。。。
对于很大的文件直接分块映射时内存会不够,这是因为MappedByteBuffer未被释放造成的,sun未提供直接回收MappedByteBuffer区域的方法,这个时候有两种方法解决,第一种比较愚笨的:
- System.gc();
- System.runFinalization();
- try {
- Thread.sleep(3000);
- } catch (InterruptedException e) {
- e.printStackTrace();
- }
第二种网上找来的,利用反射调用clean方法:
- public static void unmap(final MappedByteBuffer buffer) {
- if (buffer == null) {
- return;
- }
- AccessController.doPrivileged(new PrivilegedAction<Object>() {
- public Object run() {
- try {
- Method getCleanerMethod = buffer.getClass().getMethod("cleaner", new Class[0]);
- if (getCleanerMethod != null) {
- getCleanerMethod.setAccessible(true);
- Object cleaner = getCleanerMethod.invoke(buffer, new Object[0]);
- Method cleanMethod = cleaner.getClass().getMethod("clean", new Class[0]);
- if (cleanMethod != null) {
- cleanMethod.invoke(cleaner, new Object[0]);
- }
- }
- } catch (Exception e) {
- e.printStackTrace();
- }
- return null;
- }
- });
- }
以上两种方法感觉都别扭,还有就是可以自己分割成物理文件再循环调用,这个也不太美观。
速度也会减慢好多。
当逐行读写大于2G的文本文件时推荐使用以下代码
void largeFileIO(String inputFile, String outputFile) {
try {
BufferedInputStream bis = new BufferedInputStream(new FileInputStream(new File(inputFile)));
BufferedReader in = new BufferedReader(new InputStreamReader(bis, "utf-8"), 10 * 1024 * 1024);//10M缓存
FileWriter fw = new FileWriter(outputFile);
while (in.ready()) {
String line = in.readLine();
fw.append(line + "");
}
in.close();
fw.flush();
fw.close();
} catch (IOException ex) {
ex.printStackTrace();
}
Java IO读写大文件的几种方式及测试的更多相关文章
- java 从网上下载文件的几种方式
package com.github.pandafang.tool; import java.io.BufferedOutputStream; import java.io.File; import ...
- C/C++读写excel文件 的几种方式
因为有些朋友问代码的问题,将OLE读写的代码分享在这个地方,大家请自己看. http://blog.csdn.net/fullsail/article/details/8449448 C++读取Exc ...
- IO之复制文件的四种方式
1. 使用FileStreams复制 这是最经典的方式将一个文件的内容复制到另一个文件中. 使用FileInputStream读取文件A的字节,使用FileOutputStream写入到文件B. 这是 ...
- Linux就这个范儿 第15章 七种武器 linux 同步IO: sync、fsync与fdatasync Linux中的内存大页面huge page/large page David Cutler Linux读写内存数据的三种方式
Linux就这个范儿 第15章 七种武器 linux 同步IO: sync.fsync与fdatasync Linux中的内存大页面huge page/large page David Cut ...
- java指定编码的按行读写txt文件(几种读写方式的比较)
转: java指定编码的按行读写txt文件(几种读写方式的比较) 2018年10月16日 20:40:02 Handoking 阅读数:976 版权声明:本文为博主原创文章,未经博主允许不得转载. ...
- java io读写文件
java io读写文件相关阅读:http://www.cnblogs.com/wing011203/archive/2013/05/03/3056535.html public class DemoI ...
- java(IO)读写文件乱码转换UTF-8问题
java(IO)读写文件乱码转换UTF-8问题 读取文件 String Content = ""; // 文件很长的话建议使用StringBuffer try { FileInpu ...
- Java:IO流与文件基础
Java:IO流与文件基础 说明: 本章内容将会持续更新,大家可以关注一下并给我提供建议,谢谢啦. 走进流 什么是流 流:从源到目的地的字节的有序序列. 在Java中,可以从其中读取一个字节序列的对象 ...
- IO流----操作文件的9种方法代码实现
IO流----操作文件的9种方法代码实现: 1:使用字节流读写数据: 四种方式: method1: 每次读写一个字节,边读边写: /* * 复制文本文件. * * 数据源:从哪里来 ...
随机推荐
- Hadoop基础教程之高级编程
从前面的学习中,我们了解到了MapReduce整个过程需要经过以下几个步骤: 1.输入(input):将输入数据分成一个个split,并将split进一步拆成<key, value>. 2 ...
- 配置Tomcat的服务端口
- Java科普之算法剖析
本文来自http://blog.csdn.net/liuxian13183/ ,引用必须注明出处! 从小白晋升,一路走来:从helloworld,到JFrame,再到Android:从城外小子,到内城 ...
- WordPress主题制作教程2:导航菜单制作
实现自定义菜单,需要用到的函数是wp_nav_menu(); 在主题目录下的functions.php的 <?php ….. ?> 之间,添加以下菜单注册代码,这样你就可以在主题文件中使用 ...
- lines---hdu5124(离散化+数组模拟)
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=5124 就是有n条在x轴的线段,给你线段的左右端点,每条线段都会覆盖点,求出最多被覆盖多少次: #inc ...
- list、set、map的特点
java 集合(list.set.map)的特点 集合相关的类有一大堆,一般也只用到常用的方法增删改查,而且它它们的方法名也基本一样,所以一直都不知道什么时候用什么集合, 今天趁有空特意从网上整理资料 ...
- 289. Game of Life
题目: According to the Wikipedia's article: "The Game of Life, also known simply as Life, is a ce ...
- 传统三层结构和MVC之于贫血模式和充血模式以及领域建模
相信很多人跟我一样,一开始在使用贫血模式的三层结构:抽象出来一个贫血的实体封装,然后把对模型的所有操作,分离出来,分离到BLL层去,然后DALL层负责把这些操作和数据库产生映射,负责读写删改的操作 ...
- 转:Maven介绍(创建工程项目以及下载所需要的jar包)
http://blog.csdn.net/guanghua2009/article/details/6644111 目前我还不太会用maven,慢慢学吧 目前就是用来下载自己要的jar包,先根据这篇转 ...
- 深度学习框架Caffe —— Deep learning in Practice
因工作交接需要, 要将caffe使用方法及整体结构描述清楚. 鉴于也有同学问过我相关内容, 决定在本文中写个简单的tutorial, 方便大家参考. 本文简单的讲几个事情: Caffe能做什么? 为什 ...