Java IO读写大文件的几种方式及测试
读取文件大小:1.45G
第一种,OldIO:
- public static void oldIOReadFile() throws IOException{
- BufferedReader br = new BufferedReader(new FileReader("G://lily_947.txt"));
- PrintWriter pw = new PrintWriter("G://oldIO.tmp");
- char[] c = new char[100*1024*1024];
- for(;;){
- if(br.read(c)!=-1){
- pw.print(c);
- }else{
- break;
- }
- }
- pw.close();
- br.close();
- }
耗时70.79s
第二种,newIO:
- public static void newIOReadFile() throws IOException{
- FileChannel read = new RandomAccessFile("G://lily_947.txt","r").getChannel();
- FileChannel writer = new RandomAccessFile("G://newIO.tmp","rw").getChannel();
- ByteBuffer bb = ByteBuffer.allocate(200*1024*1024);
- while(read.read(bb)!=-1){
- bb.flip();
- writer.write(bb);
- bb.clear();
- }
- read.close();
- writer.close();
- }
耗时47.24s
第三种,RandomAccessFile:
- public static void randomReadFile() throws IOException{
- RandomAccessFile read = new RandomAccessFile("G://lily_947.txt","r");
- RandomAccessFile writer = new RandomAccessFile("G://random.tmp","rw");
- byte[] b = new byte[200*1024*1024];
- while(read.read(b)!=-1){
- writer.write(b);
- }
- writer.close();
- read.close();
- }
耗时46.65
第四种,MappedByteBuffer:
- public static void mappedBuffer() throws IOException{
- FileChannel read = new FileInputStream("G://lily_947.txt").getChannel();
- FileChannel writer = new RandomAccessFile("G://buffer.tmp","rw").getChannel();
- long i = 0;
- long size = read.size()/30;
- ByteBuffer bb,cc = null;
- while(i<read.size()&&(read.size()-i)>size){
- bb = read.map(FileChannel.MapMode.READ_ONLY, i, size);
- cc = writer.map(FileChannel.MapMode.READ_WRITE, i, size);
- cc.put(bb);
- i+=size;
- bb.clear();
- cc.clear();
- }
- bb = read.map(FileChannel.MapMode.READ_ONLY, i, read.size()-i);
- cc.put(bb);
- bb.clear();
- cc.clear();
- read.close();
- writer.close();
- }
耗时:36
前三种读法对应的资源占用图如下:
相对于最后一种内存直接映射方式前面的测试其实无意义,基本秒杀。。。。。
对于很大的文件直接分块映射时内存会不够,这是因为MappedByteBuffer未被释放造成的,sun未提供直接回收MappedByteBuffer区域的方法,这个时候有两种方法解决,第一种比较愚笨的:
- System.gc();
- System.runFinalization();
- try {
- Thread.sleep(3000);
- } catch (InterruptedException e) {
- e.printStackTrace();
- }
第二种网上找来的,利用反射调用clean方法:
- public static void unmap(final MappedByteBuffer buffer) {
- if (buffer == null) {
- return;
- }
- AccessController.doPrivileged(new PrivilegedAction<Object>() {
- public Object run() {
- try {
- Method getCleanerMethod = buffer.getClass().getMethod("cleaner", new Class[0]);
- if (getCleanerMethod != null) {
- getCleanerMethod.setAccessible(true);
- Object cleaner = getCleanerMethod.invoke(buffer, new Object[0]);
- Method cleanMethod = cleaner.getClass().getMethod("clean", new Class[0]);
- if (cleanMethod != null) {
- cleanMethod.invoke(cleaner, new Object[0]);
- }
- }
- } catch (Exception e) {
- e.printStackTrace();
- }
- return null;
- }
- });
- }
以上两种方法感觉都别扭,还有就是可以自己分割成物理文件再循环调用,这个也不太美观。
速度也会减慢好多。
当逐行读写大于2G的文本文件时推荐使用以下代码
void largeFileIO(String inputFile, String outputFile) {
try {
BufferedInputStream bis = new BufferedInputStream(new FileInputStream(new File(inputFile)));
BufferedReader in = new BufferedReader(new InputStreamReader(bis, "utf-8"), 10 * 1024 * 1024);//10M缓存
FileWriter fw = new FileWriter(outputFile);
while (in.ready()) {
String line = in.readLine();
fw.append(line + "");
}
in.close();
fw.flush();
fw.close();
} catch (IOException ex) {
ex.printStackTrace();
}
Java IO读写大文件的几种方式及测试的更多相关文章
- java 从网上下载文件的几种方式
package com.github.pandafang.tool; import java.io.BufferedOutputStream; import java.io.File; import ...
- C/C++读写excel文件 的几种方式
因为有些朋友问代码的问题,将OLE读写的代码分享在这个地方,大家请自己看. http://blog.csdn.net/fullsail/article/details/8449448 C++读取Exc ...
- IO之复制文件的四种方式
1. 使用FileStreams复制 这是最经典的方式将一个文件的内容复制到另一个文件中. 使用FileInputStream读取文件A的字节,使用FileOutputStream写入到文件B. 这是 ...
- Linux就这个范儿 第15章 七种武器 linux 同步IO: sync、fsync与fdatasync Linux中的内存大页面huge page/large page David Cutler Linux读写内存数据的三种方式
Linux就这个范儿 第15章 七种武器 linux 同步IO: sync.fsync与fdatasync Linux中的内存大页面huge page/large page David Cut ...
- java指定编码的按行读写txt文件(几种读写方式的比较)
转: java指定编码的按行读写txt文件(几种读写方式的比较) 2018年10月16日 20:40:02 Handoking 阅读数:976 版权声明:本文为博主原创文章,未经博主允许不得转载. ...
- java io读写文件
java io读写文件相关阅读:http://www.cnblogs.com/wing011203/archive/2013/05/03/3056535.html public class DemoI ...
- java(IO)读写文件乱码转换UTF-8问题
java(IO)读写文件乱码转换UTF-8问题 读取文件 String Content = ""; // 文件很长的话建议使用StringBuffer try { FileInpu ...
- Java:IO流与文件基础
Java:IO流与文件基础 说明: 本章内容将会持续更新,大家可以关注一下并给我提供建议,谢谢啦. 走进流 什么是流 流:从源到目的地的字节的有序序列. 在Java中,可以从其中读取一个字节序列的对象 ...
- IO流----操作文件的9种方法代码实现
IO流----操作文件的9种方法代码实现: 1:使用字节流读写数据: 四种方式: method1: 每次读写一个字节,边读边写: /* * 复制文本文件. * * 数据源:从哪里来 ...
随机推荐
- css属性
文本: color 颜色 line-height 行高 direction 文本方向 letter-spacing 字符间距 text-align 对齐方式 text-decoration 文本修饰 ...
- RMI、Hessian、Burlap、Httpinvoker、WebService的比较
RMI.Hessian.Burlap.Httpinvoker.WebService的比较 2(转) [2]Java远程调用方法性能比较 [IT168技术]现在,Java远程调用方法很多,各种方 ...
- ie6 js报错unterminated string constant
原因1:读取js文件时选用的编码不匹配导致该错误. 解决办法: 方法1:修改js的存储编码.可以使用note++打开js文件,再用UTF-8编 码方式保存并取代原来的js文件即可,并且在. <s ...
- Seajs demo
index.html <!doctype html> <html lang="en"> <head> <meta charset=&quo ...
- Data Base MongoVue 破解治标不治本
MongoVue 破解治标不治本 ---------解决燃眉之急 注册表中查找B1159E65-821C3-21C5-CE21-34A484D54444中的子项4FF78130 ,删除其下的三个子项 ...
- 【ACM】魔方十一题
0. 前言打了两年的百度之星,都没进决赛.我最大的感受就是还是太弱,总结起来就是:人弱就要多做题,人傻就要多做题.题目还是按照分类做可能效果比较好,因此,就有了做几个系列的计划.这是系列中的第一个,解 ...
- Oracle EBS 寄售业务总结
总述: 须通过一揽子采购协议(BPA)明确采购方与供应商之间的寄售关系,及各种协议条款: 通过来源补充规则(Sourcing Rules)明确物料的供应商以及分配规则: 通过合格供应商列表(ASL)明 ...
- Linux同步机制(二) - 条件变量,信号量,文件锁,栅栏
1 条件变量 条件变量是一种同步机制,允许线程挂起,直到共享数据上的某些条件得到满足. 1.1 相关函数 #include <pthread.h> pthread_cond_t cond ...
- UVa 12627 (递归 计数 找规律) Erratic Expansion
直接说几个比较明显的规律吧. k个小时以后,红气球的个数为3k. 单独观察一行: 令f(r, k)为k个小时后第r行红气球的个数. 如果r为奇数,f(r, k) = f((r+1)/2, k-1) * ...
- jquery常用代码集锦
1. 如何修改jquery默认编码(例如默认GB2312改成 UTF-8 ) 1 2 3 4 5 $.ajaxSetup({ ajaxSettings : { contentT ...