C# IO操作(四)大文件拷贝(文件流的使用)、文件编码
大文件拷贝(文件流的使用)、文件编码
首先说一下大文件拷贝和文件流,因为计算机的内存资源是有限的,面对几个G甚至更大的文件,需要通过程序来完成拷贝,就需要用到文件流(因为我们无法做到把文件一次性加载到内存中;事实上,内存也不允许这么干),所以在C#中出现了内存流这个东西。先看下面的内容,File类中的常用读取文件方法会将文件内容一次性全部加载到内存中:
string sPath = @"C:\Users\Chens-PC\Desktop\Nginx.txt";
//File类的ReadAllBytes()方法会将文本内容一次性读取到内存中,然后以byte数组返回(同时关闭文件)。
byte[] bteData = File.ReadAllBytes(sPath);
//File类的ReadAllLines()方法会将文本内容一次性逐行读取到内存中,然后以string数组返回(同时关闭文件),它的重载能指定读取时使用的编码。
string[] strData = File.ReadAllLines(sPath);
//File类的ReadAllText()方法会将文本内容一次性读取到内存中,然后以string字符串返回(同时关闭文件),它的重载能指定读取时使用的编码。
string sData = File.ReadAllText(sPath);
注:上面的代码,在传参时为Encoding.Default(表示与当前操作系统编码一致,一般是简体中文ANSI),而DotNet新建文本文件编码为UTF-8.
在进行大文件拷贝之前,先说一下,如果使用文件流(FileStream):
#region 通过文件流写文件
string sMsg = "风儿吹来了童年的一幅画 你陪着我在那过家家 竹林是我们的家 竹叶是你送我的花 抬头见你笑得那么的无暇";
using (FileStream fsWrite = new FileStream("msg.txt", FileMode.Create, FileAccess.Write))
{
byte[] bteData = System.Text.Encoding.UTF8.GetBytes(sMsg);
fsWrite.Write(bteData, , bteData.Length);
fsWrite.Flush();
}
Console.WriteLine("文件写入完毕!");
#endregion
#region 通过文件流读文件
using (FileStream fsRead = new FileStream("msg.txt", FileMode.Open, FileAccess.Read))
{
byte[] bteData = new byte[fsRead.Length];
fsRead.Read(bteData, , bteData.Length);
//将byte[]数组转换成字符串时才需要指定编码。
string s = System.Text.Encoding.UTF8.GetString(bteData);
Console.WriteLine(s);
}
#endregion
1.大文件拷贝:
思路:考虑到大文件的拷贝要边读边写,故要创建2个文件流(一个读,一个写),案例的代码如下(winform照样适用):
#region 大文件拷贝
string sSource = @"F:\系统\cn_windows_7_ultimate_with_sp1_x86_dvd_618763.iso";
string sTarget = @"E:\C#练习第一天\windows_7.iso"; CopyBigFile(sSource, sTarget);
Console.ReadKey();
#endregion
private static void CopyBigFile(string sSource, string sTarget)
{
using (FileStream fsRead=new FileStream(sSource,FileMode.Open,FileAccess.Read))
{
using (FileStream fsWrite=new FileStream(sTarget,FileMode.Create,FileAccess.Write))
{
//定义缓冲区
byte[] bteData = new byte[ * * ];
int r = fsRead.Read(bteData, , bteData.Length);
while (r>)
{
fsWrite.Write(bteData, , r);
double d = * (fsWrite.Position / (double)fsRead.Length);
Console.WriteLine("{0}%", d);
r = fsRead.Read(bteData, , bteData.Length);
}
Console.WriteLine("复制大文件成功");
}
}
}
说明:
快速创建文件流的方式:(不要在循环中创建文件流,放在循环外,效率问题)
FileStream fsRead=File.OpenRead(sPath); //快速创建读取流
FileStream fsWrite=File.OpenWrite(sPath); //快速创建写入流
FileStream fs=File.Open(sPath,FileMode.OpenOrCreate); //创建文件流
上面的3个方法只是微软对(大文件拷贝中创建文件流方法的封装,简化代码编写的方式)。
最后再来讨论文件读写乱码的问题(文件编码):
下面是常用的文本文件编码:
1.GB2312编码:兼容ASCII码表,英文字符用1个字节表示(字节用正数来表示),中文用2个字节表示(字节用负数来表示)。
2.GBK编码:兼容GB2312编码。中文用2个字节表示(第1个字节用负数,第2个字节用紧跟其后的正数)。
3.Unicode:国际码表,中英文都占2个字节。
4.UTF-8:国际码表,英文占1个字节,中文占3个字节。
因为各种编码存储数据格式不一致,如果读写编码不同就会乱码,解决乱码的途径就是让读写操作时保证编码一致即可。
文件编码的BOM头:
时常在读取文件时用文件的编码,有时前面会多一个问号,这是因为BOM头造成的File.ReadAllBytes().(不准确,有的编码带BOM头,有的则不带)
2.StreamReader与StreamWriter:
应用场景:在使用FileStream进行大文件拷贝的时候,因为中文占2个字节,那么有可能产生读汉字读一半的情况,进而产生乱码。
StreamReader,逐行读取文本文件。ReadLine()、EndOfStream. 注意:指定编码!
ReadToEnd用于从当前位置一直读到最后,内容大的话会占内存;每次调用都往下走,不能无意中调用了两次.
ReadLine读取一行,如果到了末尾,则返回null.
StreamWriter,逐行写入文本文件。
WriteLine,将字符串写入文件中的当前行。
3.压缩流GZipStream:
//GZipStream就是对FileStream的又一个包装
//将文本文件1.txt压缩
//1.创建读取文本文件的流
using (FileStream fsRead = File.OpenRead("1.txt"))
{
//2.创建写入文本文件的流
using (FileStream fsWrite = File.OpenWrite("yasuo.txt"))
{
//3.创建压缩流
using (GZipStream zipStream = new GZipStream(fsWrite, CompressionMode.Compress))
{
//4.每次读取1024byte
byte[] byts = new byte[];
int len = ;
while ((len = fsRead.Read(byts, , byts.Length)) > )
{
//通过压缩流写入文件
zipStream.Write(byts, , len);
}
}
}
}
Console.WriteLine("ok");
Console.ReadKey();
2>解压:
using (FileStream fsRead = File.OpenRead("yasuo.txt"))
{
using (GZipStream gzipStream = new GZipStream(fsRead, CompressionMode.Decompress))
{
using (FileStream fsWrite = File.OpenWrite("jieya.txt"))
{
byte[] byts = new byte[];
int len = ;
while ((len = gzipStream.Read(byts, , byts.Length)) > )
{
fsWrite.Write(byts, , len);
}
}
}
}
Console.WriteLine("ok");
Console.ReadKey();
C# IO操作(四)大文件拷贝(文件流的使用)、文件编码的更多相关文章
- IO流,字节流复制文件,字符流+缓冲复制文件
JAVAIO如果按流向分:输入流和输出流两种 输入流的基类:InputStream Reader 输出流的基类:OutputStream Writer 如果按数据单元划分:字节流和字符流 字节 ...
- Java IO和Java NIO在文件拷贝上的性能差异分析
1. 在JAVA传统的IO系统中,读取磁盘文件数据的过程如下: 以FileInputStream类为例,该类有一个read(byte b[])方法,byte b[]是我们要存储读取到用户空间的缓冲区 ...
- Java IO和Java NIO 和通道 在文件拷贝上的性能差异分析
1. 在JAVA传统的IO系统中,读取磁盘文件数据的过程如下: 以FileInputStream类为例,该类有一个read(byte b[])方法,byte b[]是我们要存储读取到用户空间的缓冲区 ...
- 文件拷贝, 使用 BIO,NIO的对比,四种写法性能分析。
测试环境: jdk 1.7 + 2G内存 测试代码基本上复制了: http://blog.csdn.net/tabactivity/article/details/9317143 1 2 3 4 5 ...
- 提高生产力:文件和IO操作(ApacheCommonsIO-汉化分享)
复制.移动.删除.比较.监控.文件读写 等文件和IO操作是编程中比较常用的功能. 幸运的是,Apache Commons IO等开源组件已经帮我们实现了. 我们可以不用重复 ...
- 利用pom配置实现静态文件拷贝
java项目有时候需要将一些静态文件拷贝到生成的test-class文件夹或者其他地方,虽然手动拷贝可以做到,但是很麻烦.今天主要讲解如何利用pom.xml进行动态的拷贝. 具体的配置信息如下,在de ...
- php--------文件夹文件拷贝和复制
php开发中常常对文件进行操作,文件夹和文件的拷贝,复制等. /** * 文件夹文件拷贝 * * @param string $src 来源文件夹 * @param string $dst 目的地文件 ...
- Linux系统下远程文件拷贝scp命令
在Linux系统下,不同机器上实现文件拷贝 一.将本地文件拷贝到远程机器: scp /home/administrator/news.txt root@192.168.6.129:/etc/squid ...
- PHP文件夹文件拷贝/复制函数 dir_copy($src = '', $dst = '')
/* * 文件夹文件拷贝 * * @param string $src 来源文件夹 * @param string $dst 目的地文件夹 * @return bool */ function dir ...
- 【转】Java中的IO操作
在使用io操作之前,先看一下java中的文件类File如何使用.File包括文件和目录,对文件和目录的操作是新建目录mkdir,新建文件createNewFile,删除文件和目录delete,以及其他 ...
随机推荐
- 网站WAF的检测
[wafw00f]: 项目地址: https://github.com/sandrogauci/wafw00f WAFW00F是识别和指纹Web应用防火墙(WAF)产品,其工作原理是首先通过发送一个正 ...
- eclipse代码左虚线对齐设置
前言 : 前阵子看到同事的eclipse左边有虚线对齐.有点好奇~刚开始以为是装了神马插件, 于是百度了下, 貌似没有找着. 一怒之下,逗比了半个小时,终于探索出来了~~ 设置如下 : 点击confi ...
- vs2005升级到vs2010相关问题
1.项目编译失败,报 Resgen.exe 退出 ,错误代码2 处理方式: http://jingyan.baidu.com/article/90895e0fe80c6064ed6b0b6b.html ...
- JavaScript正则表达式快速判断技巧
这里是JS的正则的一点心得,并不是最完整的规则汇总,更侧重实际运用中的快速判断,初学者接触正则之后往往会被一堆星号括号给弄晕,有了一些速判技巧就能从整体上把握从而不慌乱. JS正则快速判断技巧的核心就 ...
- 产生不重复的随机数TGUID
uses ActiveX; procedure TForm1.BtnNewClick(Sender: TObject);var ID: TGUID; S: string;begin if CoC ...
- paip.输入法编程---词频顺序order by py
paip.输入法编程---词频顺序order by py 作者Attilax , EMAIL:1466519819@qq.com 来源:attilax的专栏 地址:http://blog.csdn ...
- Android 通用获取Ip的方法(判断手机是否联网的方法)!!!
大家好,我们这一节讲一下,Android获取Ip的一些方法,在我们开发中,有判断手机是否联网,或者想获得当前手机的Ip地址,当然WIFI连接的和 我们3G卡的Ip地址当然是不一样的. 首先我尝试了如下 ...
- 使用Twisted进行socket编程
你的协议处理类通常是twisted.internet.protocol.Protocol的子类.许多协议处理继承于该类或者比该类更加方便的该类的子类.一个protocol类的实例可能反复连接,也可能在 ...
- 如何选择一个 Linux Tracer (2015)
http://www.oschina.net/translate/choosing-a-linux-tracer
- 特殊用途语言特性——默认参数、内联函数和constexptr函数
1 默认实参 某些函数有这样一些参数,在函数的很多次调用中它们都被赋予一个相同的值,此时,我们把这个反复出现的值称为函数的默认实参.调用含有默认实参的函数时,可以包含该实参,也可以省略该实参. 我们可 ...