NodeJS不仅能做网络编程,而且能够操作文件。

拷贝

小文件拷贝

var fs = require('fs');
function copy(src, dst) {
fs.writeFileSync(dst, fs.readFileSync(src));
}
function main(path) {
copy(path[0], path[1]);
}
main(process.argv.slice(2));
  • process是一个全局变量,可通过process.argv获得命令行参数。
  • argv[0]固定等于NodeJS执行程序的绝对路径,argv[1]固定等于主模块的绝对路径,因此第一个命令行参数从argv[2]这个位置开始。
  • 使用fs.readFileSync从源路径读取文件内容,并使用fs.writeFileSync将文件内容写入目标路径;

大文件拷贝

  • 这种一次性把所有文件内容都读取到内存中后再一次性写入磁盘的方式不适合拷贝大文件,内存会爆仓。
  • 对于大文件,只能读一点写一点,直到完成拷贝。
var fs = require('fs');

function copy(src, dst) {
fs.createReadStream(src).pipe(fs.createWriteStream(dst));
}
function main(path) {
copy(path[0], path[1]);
} main(process.argv.slice(2));
  • fs.createReadStream创建了一个源文件的只读数据流,并使用fs.createWriteStream创建了一个目标文件的只写数据流
  • pipe方法把两个数据流连接了起来。

常用API

Buffer(数据块)

  • JS语言自身只有字符串数据类型,没有二进制数据类型,因此NodeJS提供了一个与String对等的全局构造函数Buffer来提供对二进制数据的操作。
  • 除了可以读取文件得到Buffer的实例外,还能够直接构造:

    var bin = new Buffer([ 0x68, 0x65, 0x6c, 0x6c, 0x6f ]);
  • Buffer与字符串类似,除了可以用.length属性得到字节长度外,还可以用[index]方式读取指定位置的字节:

    bin[0]; // => 0x68;
  • Buffer与字符串能够互相转化, 可以使用指定编码将二进制数据转化为字符串:

    var str = bin.toString('utf-8'); // => "hello"
  • 或者反过来,将字符串转换为指定编码下的二进制数据:

    var bin = new Buffer('hello', 'utf-8'); // => <Buffer 68 65 6c 6c 6f>
  • Buffer与字符串有一个重要区别
    • 字符串是只读的,并且对字符串的任何修改得到的都是一个新字符串,原字符串保持不变。
    • Buffer更像是可以做指针操作的C语言数组。例如,可以用 [index]方式直接修改某个位置的字节。bin[0] = 0x48;
    • .slice方法也不是返回一个新的Buffer,而更像是返回了指向原Buffer中间的某个位置的指针
[ 0x68, 0x65, 0x6c, 0x6c, 0x6f ]
^ ^
| |
bin bin.slice(2)
    • 因此对.slice方法返回的Buffer的修改会作用于原Buffer
var bin = new Buffer([ 0x68, 0x65, 0x6c, 0x6c, 0x6f ]);
var sub = bin.slice(2); sub[0] = 0x65;
console.log(bin); // => <Buffer 68 65 65 6c 6f>
    • 如果想要拷贝一份Buffer,得首先创建一个新的Buffer,并通过.copy方法把原Buffer中的数据复制过去。这个类似于申请一块新的内存,并把已有内存中的数据复制过去
var bin = new Buffer([ 0x68, 0x65, 0x6c, 0x6c, 0x6f ]);
var dup = new Buffer(bin.length); bin.copy(dup);
dup[0] = 0x48;
console.log(bin); // => <Buffer 68 65 6c 6c 6f>
console.log(dup); // => <Buffer 48 65 65 6c 6f>

Stream(数据流)

  • 当内存中无法一次装下需要处理的数据时,或者一边读取一边处理更加高效时,就需要用到数据流。
  • NodeJS中通过各种Stream来提供对数据流的操作。
  • Stream基于事件机制工作,所有Stream的实例都继承于NodeJS提供的EventEmitter
  • 以大文件拷贝程序为例, 为数据来源创建一个只读数据流,copy函数中
var rs = fs.createReadStream(pathname);

rs.on('data', function (chunk) {
doSomething(chunk);
}); rs.on('end', function () {
cleanUp();
});
  • 上边的代码中data事件会源源不断地被触发,不管doSomething函数是否处理得过来。代码可以继续做如下改造,
var rs = fs.createReadStream(src);

rs.on('data', function (chunk) {
rs.pause();
doSomething(chunk, function () {
rs.resume();
});
}); rs.on('end', function () {
cleanUp();
});
  • 给doSomething函数加上了回调,因此可以在处理数据前暂停数据读取,并在处理数据后继续读取数据。

  • 可以为数据目标创建一个只写数据流

var rs = fs.createReadStream(src);
var ws = fs.createWriteStream(dst); rs.on('data', function (chunk) {
ws.write(chunk);
}); rs.on('end', function () {
ws.end();
});
  • 把doSomething换成了往只写数据流里写入数据后,以上代码看起来就像是一个文件拷贝程序了。
  • 但是如果写入速度跟不上读取速度的话,只写数据流内部的缓存会爆仓;可以根据.write方法的返回值来判断传入的数据是写入目标了,还是临时放在了缓存了,并根据drain事件来判断什么时候只写数据流已经将缓存中的数据写入目标,可以传入下一个待写数据了。
var rs = fs.createReadStream(src);
var ws = fs.createWriteStream(dst); rs.on('data', function (chunk) {
if (ws.write(chunk) === false) {
rs.pause();
}
}); rs.on('end', function () {
ws.end();
}); ws.on('drain', function () {
rs.resume();
});

File System(文件系统)

  • NodeJS通过fs内置模块提供对文件的操作。fs模块提供的API基本上可以分为以下三类:

    • 文件属性读写: 常用的有fs.statfs.chmodfs.chown等等。

    • 文件内容读写: 常用的有fs.readFilefs.readdirfs.writeFilefs.mkdir等等。

    • 底层文件操作: 常用的有fs.openfs.readfs.writefs.close等等。

  • NodeJS最精华的异步IO模型在fs模块里有着充分的体现, 以fs.readFile为例:

fs.readFile(pathname, function (err, data) {
if (err) {
// Deal with error.
} else {
// Deal with data.
}
}); //基本上所有fs模块API的回调参数都有两个。第一个参数在有错误发生时等于异常对象,第二个参数始终用于返回API方法执行结果。
  • fs模块的所有异步API都有对应的同步版本; 同步API除了方法名的末尾多了一个Sync之外,异常对象与执行结果的传递方式也有相应变化。同样以fs.readFileSync为例:
try {
var data = fs.readFileSync(pathname);
// Deal with data.
} catch (err) {
// Deal with error.
}

Path(路径)

  • NodeJS提供了path内置模块来简化路径相关操作,并提升代码可读性。

  • path.normalize: 将传入的路径转换为标准路径;除了解析路径中的.与..外,还能去掉多余的斜杠。如果有程序需要使用路径作为某些数据的索引,但又允许用户随意输入路径时,就需要使用该方法保证路径的唯一性。

 var path = require('path');
var cache = {}; function store(key, value) {
cache[path.normalize(key)] = value;
} store('foo/bar', 1);
store('foo//baz//../bar', 2);
console.log(cache); // => { "foo/bar": 2 } // 标准化之后的路径里的斜杠在Windows系统下是\,而在Linux系统下是/。如果想保证任何系统下都使用/作为路径分隔符的话,需要用.replace(/\\/g, '/')再替换一下标准路径。
  • path.join: 将传入的多个路径拼接为标准路径。
path.join('foo/', 'baz/', '../bar'); // => "foo/bar"
  • path.extname: 需要根据不同文件扩展名做不同操作时
 path.extname('foo/bar.js'); // => ".js"

node.js整理 02文件操作-常用API的更多相关文章

  1. node.js整理 03文件操作-遍历目录和文本编码

    遍历目录 递归算法 遍历目录时一般使用递归算法,否则就难以编写出简洁的代码. 递归算法与数学归纳法类似,通过不断缩小问题的规模来解决问题 function factorial(n) { if (n = ...

  2. node.js整理 04网络操作

    简介 var http = require('http'); http.createServer(function (req, res) { res.writeHead(200, {'Content- ...

  3. php中文件操作常用函数有哪些

    php中文件操作常用函数有哪些 一.总结 一句话总结:读写文件函数 判断文件或者目录是否存在函数 创建目录函数 file_exists() mkdir() file_get_content() fil ...

  4. 使用Node.JS监听文件夹变化

    使用Node.JS监听文件夹改变有许多应用场合,比如: 构建自动编绎工具 当源文件改变时,自动运行build过程,比如当你写CoffeeScript文件或SASS CSS文件时,保存之后可即时生成对应 ...

  5. C#文件操作常用相关类(Directory类、File类、Path类)

    1.文件操作常用相关类 1)File //操作文件,静态类,对文件整体操作.拷贝.删除.剪切等 2)Directory //操作目录(文件夹),静态类 3)DirectoryInfo //文件夹的一个 ...

  6. node.js编译less文件

    大多数文章对于到底怎样编译less文件并没有一个详细的说明,清一色的grunt命令,看得也是晕晕的,所以也就有了这篇手记的存在. 步入正题 1.安装配置好sublime text3(包括各种实用插件) ...

  7. Linux文件操作常用命令整理

    收集.整理日常系统管理或维护当中的,常用到的一些关于文件操作的命令或需求,后续会慢慢补充.完善! 查看.生成指定目录的目录树结构?   [root@DB-Server ~]#tree   #当前目录 ...

  8. node.js整理 05进程管理

    简介 NodeJS可以感知和控制自身进程的运行环境和状态,也可以创建子进程并与其协同工作,这使得NodeJS可以把多个程序组合在一起共同完成某项工作,并在其中充当胶水和调度器的作用 常用API Pro ...

  9. node 学习笔记 - fs 文件操作

    本文同步自我的个人博客:http://www.52cik.com/2015/12/03/learn-node-fs.html 最近看到群里不少大神都开始玩 node 了,我感觉跟他们步伐越来越大了, ...

随机推荐

  1. 20145213《Java程序设计》第一周学习总结

    20145213<Java程序设计>第一周学习总结 教材学习内容总结 期待了一个寒假,终于见识到了神秘的娄老师和他的Java课.虽说算不上金风玉露一相逢,没有胜却人间无数也是情理之中,但娄 ...

  2. Spring自动装配与扫描注解

    1 javabean的自动装配 自动注入,减少xml文件的配置信息. <?xml version="1.0" encoding="UTF-8"?> ...

  3. 求sqrt()底层效率问题(二分/牛顿迭代)

    偶然看见一段求根的神代码,于是就有了这篇博客: 对于求根问题,通常我们可以调用sqrt库函数,不过知其然需知其所以然,我们看一下求根的方法: 比较简单方法就是二分咯: 代码: #include< ...

  4. iOS - 富文本AttributedString

    最近项目中用到了图文混排,所以就研究了一下iOS中的富文本,打算把研究的结果分享一下,也是对自己学习的一个总结. 在iOS中或者Mac OS X中怎样才能将一个字符串绘制到屏幕上呢?         ...

  5. Java系列笔记(3) - Java 内存区域和GC机制

    目录 Java垃圾回收概况 Java内存区域 Java对象的访问方式 Java内存分配机制 Java GC机制 垃圾收集器 Java垃圾回收概况 Java GC(Garbage Collection, ...

  6. windows服务 - C# U盘升级

    1.左侧工具栏里有Timer控件,但是如果调用的是系统时间,就需要添加System.timer.timer空间下的控件.   2.服务编写之后,还不能由SCM(服务控制管理器)进行管理,需要给该服务添 ...

  7. volatile关键字与线程间通信

    >>Java内存模型 现在计算机普遍使用多处理器进行运算,并且为了解决计算机存储设备和处理器的运算速度之间巨大的差距,引入了高速缓存作为缓冲,缓存虽然能极大的提高性能,但是随之带来的缓存一 ...

  8. 在ubuntu上搭建开发环境10---英文版ubuntu安装中文输入法

    之前安装 ubuntu时候选择安装英文版,但是在查资料的时候难免的要输入中文所以自己弄了一下中文输入法的安装 我安装的是fcitx小企鹅输入法 下面介绍一下安装的过程.....   ubuntu默认的 ...

  9. Delphi之DLL知识学习2---静态链接和动态链接

    静态连接 静态链接是指Delphi 编译器把要调用的函数和过程编译成可执行代码.函数的代码可存留在应用程序的 .dpr文件或一单元中.当链接用户的应用程序时,这些函数与过程便成为最终的可执行文件的一部 ...

  10. ExcelReport第三篇:扩展元素格式化器

    导航 目   录:基于NPOI的报表引擎——ExcelReport 上一篇:ExcelReport源码解析 概述 上篇中已介绍了ExcelRepor的架构,本篇将通过例子讲述如何扩展元素格式化器以满足 ...