node.js整理 07例子

需求

一个简单的静态文件合并服务器，该服务器需要支持类似以下格式的JS或CSS文件合并请求。

http://assets.example.com/foo/??bar.js,baz.js

在以上URL中，??是一个分隔符，之前是需要合并的多个文件的URL的公共部分，之后是使用,分隔的差异部分。因此服务器处理这个URL时，返回的是以下两个文件按顺序合并后的内容。

/foo/bar.js

/foo/baz.js

另外，服务器也需要能支持类似以下格式的普通的JS或CSS文件请求。

http://assets.example.com/foo/bar.js

第一次迭代

设计方案

          +---------+   +-----------+   +----------+

request -->|  parse  |-->|  combine  |-->|  output  |--> response

           +---------+   +-----------+   +----------+

//服务器会首先分析URL，得到请求的文件的路径和类型（MIME）。然后，服务器会读取请求的文件，并按顺序合并文件内容。最后，服务器返回响应，完成对一次请求的处理;另外，服务器在读取文件时需要有个根目录，并且服务器监听的HTTP端口最好也不要写死在代码里，因此服务器需要是可配置的。

实现

var fs = require('fs'),

    path = require('path'),

    http = require('http');

var MIME = {

    '.css': 'text/css',

    '.js': 'application/javascript'

};

function combineFiles(pathnames, callback) {

    var output = [];

    (function next(i, len) {

        if (i < len) {

            fs.readFile(pathnames[i], function (err, data) {

                if (err) {

                    callback(err);

                } else {

                    output.push(data);

                    next(i + 1, len);

                }

            });

        } else {

            callback(null, Buffer.concat(output));

        }

    }(0, pathnames.length));

}

function main(argv) {

    var config = JSON.parse(fs.readFileSync(argv[0], 'utf-8')),

        root = config.root || '.',

        port = config.port || 80;

    http.createServer(function (request, response) {

        var urlInfo = parseURL(root, request.url);

        combineFiles(urlInfo.pathnames, function (err, data) {

            if (err) {

                response.writeHead(404);

                response.end(err.message);

            } else {

                response.writeHead(200, {

                    'Content-Type': urlInfo.mime

                });

                response.end(data);

            }

        });

    }).listen(port);

}

function parseURL(root, url) {

    var base, pathnames, parts;

    if (url.indexOf('??') === -1) {

        url = url.replace('/', '/??');

    }

    parts = url.split('??');

    base = parts[0];

    pathnames = parts[1].split(',').map(function (value) {

        return path.join(root, base, value);

    });

    return {

        mime: MIME[path.extname(pathnames[0])] || 'text/plain',

        pathnames: pathnames

    };

}

main(process.argv.slice(2));

注意
- 使用命令行参数传递JSON配置文件路径，入口函数负责读取配置并创建服务器。
- 入口函数完整描述了程序的运行逻辑，其中解析URL和合并文件的具体实现封装在其它两个函数里。
- 解析URL时先将普通URL转换为了文件合并URL，使得两种URL的处理方式可以一致。
- 合并文件时使用异步API读取文件，避免服务器因等待磁盘IO而发生阻塞。
把以上代码保存为server.js，之后就可以通过node server.js config.json命令启动程序

第二次迭代

第一次迭代之后，已经有了一个可工作的版本，满足了功能需求。接下来从性能的角度出发，看看代码还有哪些改进余地。
把map方法换成for循环或许会更快一些，但第一版代码最大的性能问题存在于从读取文件到输出响应的过程当中。以处理/??a.js,b.js,c.js这个请求为例，看看整个处理过程中耗时在哪儿。

 发送请求       等待服务端响应         接收响应

---------+----------------------+------------->

         --                                        解析请求

           ------                                  读取a.js

                 ------                            读取b.js

                       ------                      读取c.js

                             --                    合并数据

                               --                  输出响应

第一版代码依次把请求的文件读取到内存中之后，再合并数据和输出响应。这会导致以下两个问题：
- 当请求的文件比较多比较大时，串行读取文件会比较耗时，从而拉长了服务端响应等待时间。
- 由于每次响应输出的数据都需要先完整地缓存在内存里，当服务器请求并发数较大时，会有较大的内存开销。
对于第一个问题，很容易想到把读取文件的方式从串行改为并行。但是别这样做，因为对于机械磁盘而言，因为只有一个磁头，尝试并行读取文件只会造成磁头频繁抖动，反而降低IO效率。而对于固态硬盘，虽然的确存在多个并行IO通道，但是对于服务器并行处理的多个请求而言，硬盘已经在做并行IO了，对单个请求采用并行IO无异于拆东墙补西墙。因此，正确的做法不是改用并行IO，而是一边读取文件一边输出响应，把响应输出时机提前至读取第一个文件的时刻。这样调整后，整个请求处理过程变成下边这样。

发送请求 等待服务端响应 接收响应

---------+----+------------------------------->

         --                                        解析请求

           --                                      检查文件是否存在

             --                                    输出响应头

               ------                              读取和输出a.js

                     ------                        读取和输出b.js

                           ------                  读取和输出c.js

实现

function main(argv) {

    var config = JSON.parse(fs.readFileSync(argv[0], 'utf-8')),

        root = config.root || '.',

        port = config.port || 80;

    http.createServer(function (request, response) {

        var urlInfo = parseURL(root, request.url);

        validateFiles(urlInfo.pathnames, function (err, pathnames) {

            if (err) {

                response.writeHead(404);

                response.end(err.message);

            } else {

                response.writeHead(200, {

                    'Content-Type': urlInfo.mime

                });

                outputFiles(pathnames, response);

            }

        });

    }).listen(port);

}

function outputFiles(pathnames, writer) {

    (function next(i, len) {

        if (i < len) {

            var reader = fs.createReadStream(pathnames[i]);

            reader.pipe(writer, { end: false });

            reader.on('end', function() {

                next(i + 1, len);

            });

        } else {

            writer.end();

        }

    }(0, pathnames.length));

}

function validateFiles(pathnames, callback) {

    (function next(i, len) {

        if (i < len) {

            fs.stat(pathnames[i], function (err, stats) {

                if (err) {

                    callback(err);

                } else if (!stats.isFile()) {

                    callback(new Error());

                } else {

                    next(i + 1, len);

                }

            });

        } else {

            callback(null, pathnames);

        }

    }(0, pathnames.length));

}

第二版代码在检查了请求的所有文件是否有效之后，立即就输出了响应头，并接着一边按顺序读取文件一边输出响应内容。并且，在读取文件时，第二版代码直接使用了只读数据流来简化代码。

第三次迭代

接下来需要从稳定性的角度重新审视一下代码
从工程角度上讲，没有绝对可靠的系统。即使第二次迭代的代码经过反复检查后能确保没有bug，也很难说是否会因为NodeJS本身，或者是操作系统本身，甚至是硬件本身导致服务器程序在某一天挂掉。因此一般生产环境下的服务器程序都配有一个守护进程，在服务挂掉的时候立即重启服务。一般守护进程的代码会远比服务进程的代码简单，从概率上可以保证守护进程更难挂掉。如果再做得严谨一些，甚至守护进程自身可以在自己挂掉时重启自己，从而实现双保险。
因此在本次迭代时，先利用NodeJS的进程管理机制，将守护进程作为父进程，将服务器程序作为子进程，并让父进程监控子进程的运行状态，在其异常退出时重启子进程。

var cp = require('child_process');

var worker;

function spawn(server, config) {

    worker = cp.spawn('node', [ server, config ]);

    worker.on('exit', function (code) {

        if (code !== 0) {

            spawn(server, config);

        }

    });

}

function main(argv) {

    spawn('server.js', argv[0]);

    process.on('SIGTERM', function () {

        worker.kill();

        process.exit(0);

    });

}

main(process.argv.slice(2));

此外，服务器代码本身的入口函数也要做以下调整。

function main(argv) {

    var config = JSON.parse(fs.readFileSync(argv[0], 'utf-8')),

        root = config.root || '.',

        port = config.port || 80,

        server;

    server = http.createServer(function (request, response) {

        ...

    }).listen(port);

    process.on('SIGTERM', function () {

        server.close(function () {

            process.exit(0);

        });

    });

}

可以把守护进程的代码保存为daemon.js，之后可以通过node daemon.js config.json启动服务，而守护进程会进一步启动和监控服务器进程。
为了能够正常终止服务，让守护进程在接收到SIGTERM信号时终止服务器进程。而在服务器进程这一端，同样在收到SIGTERM信号时先停掉HTTP服务再正常退出。至此，服务器程序就靠谱很多了。

第四次迭代

解决了服务器本身的功能、性能和可靠性的问题后，接着需要考虑一下代码部署的问题，以及服务器控制的问题。
一般而言，程序在服务器上有一个固定的部署目录，每次程序有更新后，都重新发布到部署目录里。而一旦完成部署后，一般也可以通过固定的服务控制脚本启动和停止服务。因此服务器程序部署目录可以做如下设计。

- deploy/

    - bin/

        startws.sh

        killws.sh

    + conf/

        config.json

    + lib/

        daemon.js

        server.js

在以上目录结构中，分类存放了服务控制脚本、配置文件和服务器代码。
按以上目录结构分别存放对应的文件之后，接下来看看控制脚本怎么写。首先是start.sh。

#!/bin/sh

if [ ! -f "pid" ]

then

    node ../lib/daemon.js ../conf/config.json &

    echo $! > pid

fi

然后是killws.sh。

#!/bin/sh

if [ -f "pid" ]

then

    kill $(tr -d '\r\n' < pid)

    rm pid

fi

后续迭代

服务器程序正式上线工作后，接下来或许会发现还有很多可以改进的点。比如服务器程序在合并JS文件时可以自动在JS文件之间插入一个;来避免一些语法问题，比如服务器程序需要提供日志来统计访问量，比如服务器程序需要能充分利用多核CPU，等等。

建议

要熟悉官方API文档。并不是说要熟悉到能记住每个API的名称和用法，而是要熟悉NodeJS提供了哪些功能，一旦需要时知道查询API文档的哪块地方。
要先设计再实现。在开发一个程序前首先要有一个全局的设计，不一定要很周全，但要足够能写出一些代码。
要实现后再设计。在写了一些代码，有了一些具体的东西后，一定会发现一些之前忽略掉的细节。这时再反过来改进之前的设计，为第二轮迭代做准备。
要充分利用三方包。NodeJS有一个庞大的生态圈，在写代码之前先看看有没有现成的三方包能节省不少时间。
不要迷信三方包。任何事情做过头了就不好了，三方包也是一样。三方包是一个黑盒，每多使用一个三方包，就为程序增加了一份潜在风险。并且三方包很难恰好只提供程序需要的功能，每多使用一个三方包，就让程序更加臃肿一些。因此在决定使用某个三方包之前，最好三思而后行。

node.js整理 07例子的更多相关文章

Node.js笔记07——不使用generator自定义一个项目，深入了解项目结构
一.初始化项目新建项目 git init manager 新建view文件夹,建几个静态文件夹新建app.js 快速初始化项目依赖 npm init -y 安装express npm instal ...
node.js整理 06异步编程
回调异步编程依托于回调来实现,但不能说使用了回调后程序就异步化了 function heavyCompute(n, callback) { var count = 0, i, j; for (i = ...
node.js整理 05进程管理
简介 NodeJS可以感知和控制自身进程的运行环境和状态,也可以创建子进程并与其协同工作,这使得NodeJS可以把多个程序组合在一起共同完成某项工作,并在其中充当胶水和调度器的作用常用API Pro ...
node.js整理 01代码的组织和部署
模块 require(函数) 用于在当前模块中加载和使用别的模块,传入一个模块名,返回一个模块导出对象. 模块名可使用相对路径(以./开头),或者是绝对路径(以/或C:之类的盘符开头:注意单个模块名默 ...
node.js初识07
之前有说过,nodejs是没有web容器的,阿帕奇是自带的web容器,如果希望node达到阿帕奇的效果,即http://127.0.0.1:3000/a/b/c.html 出现这样的链接访问页面,所 ...
node.js整理 04网络操作
简介 var http = require('http'); http.createServer(function (req, res) { res.writeHead(200, {'Content- ...
node.js整理 03文件操作-遍历目录和文本编码
遍历目录递归算法遍历目录时一般使用递归算法,否则就难以编写出简洁的代码. 递归算法与数学归纳法类似,通过不断缩小问题的规模来解决问题 function factorial(n) { if (n = ...
node.js整理 02文件操作－常用API
NodeJS不仅能做网络编程,而且能够操作文件. 拷贝小文件拷贝 var fs = require('fs'); function copy(src, dst) { fs.writeFileSync ...
从零开始学习渗透Node.js应用程序
本文来源于i春秋学院,未经允许严禁转载 0x01 介绍简单的说 Node.js 就是运行在服务端的 JavaScript.Node.js 是一个基于Chrome JavaScript 运行时建立的一 ...

随机推荐

JavaScript高级程序设计学习笔记--基本概念
1.语句 ECMAScript中的语句以一个分号结尾:如果省略分号,则由解析器确定语句的结尾,如下例所示: var sum=a+b //即使没有分号也是有效的语句--推荐 var diff=a-b; ...
开始使用 Fresco
如果你仅仅是想简单下载一张网络图片,在下载完成之前,显示一张占位图,那么简单使用 SimpleDraweeView 即可. 在加载图片之前,你必须初始化Fresco类.你只需要调用Fresco.ini ...
db2中报SQLCODE=-530, SQLSTATE=23503错误
今天在写一个增加操作时,报错信息如下:SQLCODE=-530, SQLSTATE=23503,该sqlcode说明:“对特定的约束名指定了无效的外健值”. 项目中用的框架是SSH,新增的主对象有多个 ...
VAssistX的VA Snippet Editor的类注释和函数注释
title:类注释shortcut:=== /******************************************************** [DateTime]:$YEAR$.$M ...
JUnit笔记
mysql 三个表连接查询
权限表(permission)10 字段名称类型约束描述 authorityid integer Pk not null 权限流水号id PK userNameId int not nul ...
orcad candence 快捷键小结
谈谈我的编程之路---WAMP(三)
WAMP的一些配置与使用心得(APACHE)说实话,我感觉apache的配置真的还是蛮复杂的,感觉好像又在学一种语言,让我用比较庞大的概念来讲述这些东西,我也没办法做到就以实际应用出发出发,简单的说一 ...
iOS开发－正则表达式的使用方法
前言:在表单验证中,我们经常会使用到正则,因为我们需要用它来判断用户输入的字符是否为合法的,如果是不合法的,那么应该提示用户输入错误,并不让提交至服务器.我们也可以通过正则表达式,从用户输入的字符串中 ...
MVC缓存02,使用数据层缓存,添加或修改时让缓存失效
在"MVC缓存01,使用控制器缓存或数据层缓存"中,在数据层中可以设置缓存的有效时间.但这个还不够"智能",常常希望在编辑或创建的时候使缓存失效,加载新的数据. ...

node.js整理 07例子

需求

第一次迭代

第二次迭代

第三次迭代

第四次迭代

后续迭代

建议

node.js整理 07例子的更多相关文章

随机推荐

热门专题