node 读取多个文件、合并多个文件、读写多个文件

一、读取文件

1、找文件中匹配的内容

let fs = require('fs')

let content = fs.readFileSync('/Users/**/desktop/Test.txt', 'utf-8')

console.log(content.match(/\uD83C[\uDF00-\uDFFF]|\uD83D[\uDC00-\uDE4F]/g))

2、读取文件并合并两个文件内容

var fs = require('fs');

let content = fs.readFileSync('/Users/**/desktop/mark.log', 'utf-8')

fs.appendFile('/Users/caofan/desktop/Test.txt', content, function (err) {

    if (err) throw err;

    console.log('The "data to append" was appended to file!');

});

3.按行读取单个文件

var readline = require('readline');

var fs = require('fs');

var os = require('os');

var fReadName = '/Users/**/desktop/title/title_20171101.log';

var fWriteName = './emoji1.csv';

var fRead = fs.createReadStream(fReadName);

var fWrite = fs.createWriteStream(fWriteName);

var enableWriteIndex = true;

var objReadline = readline.createInterface({

    input: fRead

});

var index = 1;

var matchArr = [];

objReadline.on('line', (line)=>{

    if (enableWriteIndex) {

        if(line.match(/\uD83C[\uDF00-\uDFFF]|\uD83D[\uDC00-\uDE4F]/g)){

            matchArr.push(index)

            var tmp = line;

            fWrite.write(tmp + os.EOL);

            // if (matchArr.length <= 10) {      //输出匹配的前10条

            //     console.log(line)

            //     // fs.writeFileSync(fWriteName, line+ '\n', 'utf8');

            //     var tmp = 'line' + matchArr.length + ':' + line;

            //     fWrite.write(tmp + os.EOL);   //  将匹配的前10条写入另一个文件

            // }

        }

        index ++;

    }

});

fRead.on('end', ()=>{

    enableWriteIndex = false;

    console.log(matchArr.length)  // 总共匹配的条数

});

objReadline.on('close', ()=>{

});

4. 合并目录下的多个文件到另一个文件

var fs = require("fs");

var path = require('path');

//配置远程路径

var remotePath = "./emoji";  // 相对路径

//读取文件目录

fs.readdir(remotePath,function(err,files){

    if(err){

        console.log(err);

        return;

    }

    files.forEach(function(filename){

        var filedir = path.join(remotePath,filename);

        fs.stat(filedir,function(err, stats){

            if (err) throw err;

            if(stats.isFile()){

                if(/emoji/.test(filename)) {

                     console.log(filename)

                     let content = fs.readFileSync(path.join(remotePath,filename), 'utf-8')

                     fs.appendFile('/Users/**/desktop/Test.txt', content)

                }

            } else if(stats.isDirectory()){

                return false

            }

        });

    });

});

5. 读取文件目录下的所有文件，匹配内容输出到新的文件

var fs = require('fs');

var readline = require('readline');

var path = require('path');

var os = require('os');

//解析需要遍历的文件夹

var filePath = path.resolve('/Users/**/desktop/title');

//调用文件遍历方法

fileDisplay(filePath);

var fWriteName = './emojis2.csv';

var matchArr = [];

var index = 1;

function fileDisplay(filePath){

    //根据文件路径读取文件，返回文件列表

    fs.readdir(filePath,function(err,files){

        if(err){

            console.warn(err)

        }else{

            //遍历读取到的文件列表

            files.forEach(function(filename){

                //获取当前文件的绝对路径

                var filedir = path.join(filePath,filename);

                //根据文件路径获取文件信息，返回一个fs.Stats对象

                fs.stat(filedir,function(eror,stats){

                    if(eror){

                        console.warn('获取文件stats失败');

                    }else{

                        var isFile = stats.isFile();//是文件

                        var isDir = stats.isDirectory();//是文件夹

                        if(isFile){

                            if(/title_201711/.test(filename)) {

                                var fRead = fs.createReadStream(filedir);

                                var fWrite = fs.createWriteStream(fWriteName);

                                var enableWriteIndex = true;

                                var objReadline = readline.createInterface({      // 按行读取

                                    input: fRead

                                });

                                objReadline.on('line', (line)=>{

                                    if (enableWriteIndex) {

                                        if(/[\]\{\}<>\[@【】「」#\*\^]/.test(line)){

                                            matchArr.push(index)

                                            if (matchArr.length <= 10000) {

                                                var tmp = line;

                                                console.log(line)

                                                fWrite.write(tmp + os.EOL);

                                            }

                                        }

                                        index ++;

                                    }

                                });

                                objReadline.on('close', ()=>{

                                    console.log(matchArr.length)

                                   // console.log(index)

                                });

                            }

                        }

                        if(isDir){

                            fileDisplay(filedir);//递归，如果是文件夹，就继续遍历该文件夹下面的文件

                        }

                    }

                })

            });

        }

    });

当然，这些功能都能通过shell命令行实现。只是有时utf8编码问题导致正则在命令行匹配不到准确数据，所以在 node 中实现。

node 读取多个文件、合并多个文件、读写多个文件的更多相关文章

将Halcon导出的多个dxf文件合并成一个分图层的dxf文件
Halcon中可以通过concat_obj合并多个XLD,并且可以通过write_contour_xld_dxf再将XLD保存为.dxf文件.但是,保存后的.dxf文件用AutoCAD打开后发现,它们 ...
【转】Python编程: 多个PDF文件合并以及网页上自动下载PDF文件
1. 多个PDF文件合并1.1 需求描述有时候,我们下载了多个PDF文件, 但希望能把它们合并成一个PDF文件.例如:你下载的数个PDF文件资料或者电子发票,你可以使用python程序合并成一个PDF ...
Hadoop MapReduce编程 API入门系列之小文件合并（二十九）
不多说,直接上代码. Hadoop 自身提供了几种机制来解决相关的问题,包括HAR,SequeueFile和CombineFileInputFormat. Hadoop 自身提供的几种小文件合并机制 ...
Hive merge（小文件合并）
当Hive的输入由非常多个小文件组成时.假设不涉及文件合并的话.那么每一个小文件都会启动一个map task. 假设文件过小.以至于map任务启动和初始化的时间大于逻辑处理的时间,会造成资源浪费.甚至 ...
xBIM 多个IFC文件合并
目录 xBIM 应用与学习 (一) xBIM 应用与学习 (二) xBIM 基本的模型操作 xBIM 日志操作 XBIM 3D 墙壁案例 xBIM 格式之间转换 xBIM 使用Linq 来优化查询 x ...
如何将两个PDF文件合并到一个页面中
在目前职场办公中,很多使用的文件格式是PDF文件格式,由于工作的需要,经常需要将PDF文件合并在一起,但由于PDF文件不能直接编辑修改,不能OFFICE,WPS那样,通过复制粘贴将两者合并,那如何解决 ...
MR案例：小文件合并SequeceFile
SequeceFile是Hadoop API提供的一种二进制文件支持.这种二进制文件直接将<key, value>对序列化到文件中.可以使用这种文件对小文件合并,即将文件名作为key,文件 ...
POI读写Word docx文件
使用POI读写word docx文件目录 1 读docx文件 1.1 通过XWPFWordExtractor读 1.2 通过XWPFDocument读 2 写docx ...
使用POI读写word docx文件
目录 1 读docx文件 1.1 通过XWPFWordExtractor读 1.2 通过XWPFDocument读 2 写docx文件 2.1 直接通过XWPF ...

随机推荐

Java Script注意事项
1.HTML中,打错标点符号或输入格式不对(多输等号或少加括号等) 会导致字体颜色不对劲 2.写Java Script时通常的做法是把函数放入 <head> 部分中,或者放在页面底部. ...
Sublime Text 许可证
----- BEGIN LICENSE Alexander Single User License EA7E- 51F47F09 4EAB1285 7827EFF0 8B1207DC A76A6EA3 ...
python 调用阿里云服务器api创建服务器
首先安装阿里云SDK pip install aliyun-python-sdk-core pip install aliyun-python-sdk-ecs 可以配合jenkins传递参数 #!/u ...
【LeetCode每天一题】Find First and Last Position of Element in Sorted Array(找到排序数组中指定元素的开始和结束下标)
Given an array of integers nums sorted in ascending order, find the starting and ending position of ...
CMB面试准备-基础
1.简述 private. protected. public. internal 修饰符的访问权限 private : 在类的内部才可以访问. protected : 保护成员,该类内部和继承类中可 ...
Linux学习笔记：常用100条命令（一）
linux常用命令 1.关机 shutdown -h now 立刻关机 poweroff shutdown -r now 立刻重启 reboot logout 注销 2.进入图形界面 startx 3 ...
R安装package报ERROR: a 'NAMESPACE' file is required
R安装package报错: [root@Hadoop-NN-01 mysofts]# R CMD INSTALL trimcluster_0.1-1.tar.gz * installing to li ...
JS--理解call、apply和bind
call.apply和bind call,apply是Function原型中的方法,它们的作用一样,区别在于传入参数的方式不同. call(thisArg, arg1, arg2...) 传入的参数不 ...
JavaScript setInterval（定时/延时调用函数）
setInterval是一个实现定时调用的函数,可按照指定的周期(以毫秒计)来调用函数或计算表达式.setInterval方法会不停地调用函数,直到 clearInterval被调用或窗口被关闭. 由 ...
mybatis之注解式开发
注解: 注解是用于描述代码的代码.例如:@Test(用于描述方法进行junit测试),@Override(用于描述方法的重写),@Param(用于描述属性的名称) 注解的使用风格:@xxx(属性),使 ...

node 读取多个文件、合并多个文件、读写多个文件

node 读取多个文件、合并多个文件、读写多个文件的更多相关文章

随机推荐

热门专题