node.js是单进程应用,要充分利用多核cpu的性能,就需要用到多进程架构。

作为web服务器,不能多个进程创建不同的socket文件描述符去accept网络请求, 有经验的同学知道,如果端口被占用了,再跑一个监听该端口的服务就会报EADDRINUSE异常。那么问题来了,多进程架构如何去解决这个问题?

我们把多进程架构设计成典型的master-workers架构, 一个master, 多个worker。

master-workers架构如下图所示:

我们可以在master进程代理accept请求然后分配给worker处理。但客户端进程连接到master进程,master进程连接到worker进程需要用掉两个文件描述符,会浪费掉一倍数量的文件描述符。

所以交由worker来accept请求会是更好的方案。

master先创建一个server监听端口,然后通过进程间通信,把socket文件描述符传递给所有的worker进程, worker进程用传递过来的socket文件描述符封装成server(感官上好像是把一个server对象发送给另一个进程,其实是把相应的句柄封装后,通过JSON.stringify()序列化再发送, 接收端进程还原成相应的句柄。)

然后,还有一个问题,假如其中一个worker进程异常退出了怎么办, 这个时候,worker进程应该要通知到master进程,然后master进程重新fork一个worker进程。

先上master的代码:

 "use strict"

 const fork = require('child_process').fork;
const cpus = require('os').cpus();
let server = require('net').createServer((socket)=>{
// ‘connection’ 监听器
socket.end('Handled by master \n');
console.error('Handled by master \n'); //不应该在master accept请求
}); server.listen(8001); let workers = {}; function createWorker(ser) {
let worker = fork('./worker.js'); worker.on('message', function(msg, handle) {
// 收到子进程通知需要创建新的worker(子进程退出前通知父进程)
if(msg ==='new_worker') {
let ser = handle;
createWorker(ser);
// 关掉
ser.close();
}
}) worker.on('exit', function(code, signal){
delete workers[worker.pid];
}); // 句柄转发
let result = worker.send('server', ser, (err)=> {err&&console.error(err)});
console.info('send server to child result:', result);
workers[worker.pid] = worker;
} for(let i=0; i<cpus.length; i++) {
createWorker(server);
} // 关掉,不再accept端口请求
server.close(); /*
code <number> The exit code if the child exited on its own.
signal <string> The signal by which the child process was terminated.
*/
process.on('exit', function(code, signal) {
console.log(`master exit, code:${code}, signal:${signal}`);
for(let pid in workers) {
workers[pid].kill();
}
}) process.on('uncaughtException', function(error) {
console.error('master | uncaughtException, error:', error);
process.exit(1);
}) //一些常用的退出信号的处理:
// kill pid 默认是SIGTERM信号
// 控制台 ctrl-c 是SIGINT信号
const killSignalList = ['SIGTERM', 'SIGINT'];
killSignalList.forEach((SIGNAL)=>{
process.on(SIGNAL, function(){
console.log(`${SIGNAL} signal`);
process.exit(1);
})
})

master进程根据cpu核数fork相应数量的worker进程, fork成功后马上把server句柄发送给worker进程, fork所有worker进程后, 就把server关掉,不再接收请求。 master进程退出前会调用worker的kill()方法杀掉所有worker进程。

worker代码如下:

 const http = require('http');

 const server = http.createServer(function(req, res) {
// ‘request’ 监听器
res.end('handled by worker \n');
// throw new Error('error');
}) let worker;
process.on('message', function(msg, handle){
if(msg === 'server') {
worker = handle;
worker.on('connection', function(socket){
server.emit('connection', socket);
})
} }) process.on('uncaughtException', function(err) {
console.error('uncaughtException err:', err.message, ', worker进程将重启');
// 通知master创建新的worker
process.send('new_worker', worker);
// 停止接收新的连接
worker.close(function() {
// 所有已有连接断开后,退出进程
process.exit(1);
});
});

worker进程有个细节处理的地方: 异常退出前,先通知master进程创建新的worker, 然后等待所有已有连接断开后再退出进程。

关于进程间的句柄发送功能, 有兴趣的同学可以再去了解一下, 子进程对象send(message,[sendHandle])方法可以发送的句柄类型有:

  • net.Socket,  TCP套接字。
  • net.Server,  TCP服务器,任意建立在TCP服务上的应用层服务都可以享受到它带来的好处。
  • net.Native, C++层面的TCP套接字或IPC通道。
  • dgram.Socket,  UDP套接字。
  • dgram.Native, C++层面的UDP套接字

多个worker进程监听同一个套接字,会导致惊群现象, 有请求过来时cpu会唤醒所有的worker进程, 最终只有一个进程accept到请求, 其它进程accept请求失败,这种情况会产生一些不必要的开销。 如何避免惊群现象,我另外写一篇文章具体说一下。

node.js多进程架构的更多相关文章

  1. 关于Node.js后端架构的一点后知后觉

    前言 上周有幸和淘宝前端团队的七念老师做了一些NodeJS方面上的交流(实际情况其实是他电话面试了我╮(╯-╰)╭),我们主要聊到了我参与维护的一个线上NodeJS服务,关于它的现状和当下的不足.他向 ...

  2. node.js express架构安装部署

    安装-g:表示全局安装(必须以安装node.js) npm install -g express-generator 创建一个express架构的项目文件夹express testWebApp 在pa ...

  3. 【nodejs原理&源码赏析(4)】深度剖析cluster模块源码与node.js多进程(上)

    [摘要] 集群管理模块cluster浅析 示例代码托管在:http://www.github.com/dashnowords/blogs 一. 概述 cluster模块是node.js中用于实现和管理 ...

  4. 【nodejs原理&源码赏析(4)】深度剖析cluster模块源码与node.js多进程(上)

    目录 一. 概述 二. 线程与进程 三. cluster模块源码解析 3.1 起步 3.2 入口 3.3 主进程模块master.js 3.4 子进程模块child.js 四. 小结 示例代码托管在: ...

  5. Node.js 多进程

    我们都知道 Node.js 是以单线程的模式运行的,但它使用的是事件驱动来处理并发,这样有助于我们在多核 cpu 的系统上创建多个子进程,从而提高性能. 每个子进程总是带有三个流对象:child.st ...

  6. 【nodejs原理&源码赏析(6)】深度剖析cluster模块源码与node.js多进程(下)

    [摘要] cluster模块详解 示例代码托管在:http://www.github.com/dashnowords/blogs 阅读本章需要先阅读本系列前两章内容预热一下. 一. 引言 前两篇博文中 ...

  7. 【nodejs原理&源码赏析(6)】深度剖析cluster模块源码与node.js多进程(下)

    目录 一. 引言 二.server.listen方法 三.cluster._getServer( )方法 四.跨进程通讯工具方法Utils 五.act:queryServer消息 六.轮询调度Roun ...

  8. 深入理解 Node.js 进程与线程

    原文链接: https://mp.weixin.qq.com/s?__biz=MzAxODE2MjM1MA==&mid=2651557398&idx=1&sn=1fb991da ...

  9. Node.js:多进程

    ylbtech-Node.js:多进程 1.返回顶部 1. Node.js 多进程 我们都知道 Node.js 是以单线程的模式运行的,但它使用的是事件驱动来处理并发,这样有助于我们在多核 cpu 的 ...

随机推荐

  1. H5与CSS3常用设置

    1.设置div铺满全屏 对于一个div1,要使其属性height:100%生效,需要使其所有父元素,有确定的属性height.要铺满全屏,就是从html开始,所有的height为100%. 2.垂直居 ...

  2. commix工具配合命令注入

    commix简介 commix是一款由python编写,开源自动化检测系统命令注入工具  https://github.com/commixproject/commix commix 参数 选项: - ...

  3. maven项目部署到tomcat方法

    今天记录下,maven项目部署到服务器的过程 1.首先在ide中里将自己的maven项目打包 mvn clean install 2. 看是否需要修改war包的名字,如果要修改,就用命令 mv xxx ...

  4. 带你上手一款下载超 10 万次的 IDEA 插件

    作者 | 倪超(银时) 阿里云开发者工具产品专家 本文整理自 11 月 7 日社群分享,每月 2 场高质量分享,点击加入社群. 导读:Cloud Toolkit 是本地 IDE 插件,帮助开发者更高效 ...

  5. Java序列化与反序列化三连问:是什么?为什么要?如何做?

    Java序列化与反序列化是什么? Java序列化是指把Java对象转换为字节序列的过程,而Java反序列化是指把字节序列恢复为Java对象的过程: 序列化:对象序列化的最主要的用处就是在传递和保存对象 ...

  6. win10系统任务栏点击没有反应

    今天碰到了一个神奇的bug任务栏上的图标怎么也没反应,鼠标点击不了,win+R命令行也出来不了. 经过一番研究,发现CTRL+ALT+DEL,可以打开任务管理器.所以来了一番操作: 1.先打开任务管理 ...

  7. java多线程与线程并发一:线程基础回顾

    本文章内容整理自:张孝祥_Java多线程与并发库高级应用视频教程 线程简单来讲就是程序正在做的事情.多线程即一个程序同时做多件事情,一个线程就是一件事情. 在java中创建线程的方法有两种. 方法一是 ...

  8. php如何在mysql里批量插入数据

    假如说我有这样一个表,我想往这个表里面插入大量数据 CREATE TABLE IF NOT EXISTS `user_info` ( `id` int(11) NOT NULL AUTO_INCREM ...

  9. [LC]26题 Remove Duplicates from Sorted Array (删除排序数组中的重复项)(双指针法)(原地实现)

    ①中文题目 给定一个排序数组,你需要在原地删除重复出现的元素,使得每个元素只出现一次,返回移除后数组的新长度. 不要使用额外的数组空间,你必须在原地修改输入数组并在使用 O(1) 额外空间的条件下完成 ...

  10. CSS复合选择器是什么?复合选择器是如何工作

    复合选择器介绍 复合选择器其实很好理解,说白了就跟我们生活中的有血缘关系家庭成员一样,通过标签或者class属性或id属性,去找对应的有血缘关系的某个选择器,具体的大家往下看哦. 如果是初学者对基本的 ...