ThreadLocal变量的说法来自于Java,这是在多线程模型下出现并发问题的一种解决方案。

ThreadLocal变量作为线程内的局部变量,在多线程下可以保持独立,它存在于

线程的生命周期内,可以在线程运行阶段多个模块间共享数据。那么,ThreadLocal变量

又如何与node.js扯上关系呢?

在node.js领域,由于没有线程的概念,所以笔者更愿意称 ThreadLocal为 “AsyncContext Bound”, 实现地址: github

node模型

node的运行模型无需再赘言: “事件循环 + 异步执行”,可是node开发工程师比较感兴趣的点

大多集中在 “编码模式”上,即异步代码同步编写,由此提出了多种解决回调地狱的解决方案:

  • yield
  • thunk
  • promise
  • await

可是如果从代码执行流程的微观视角中跳出来,宏观上看待node服务器处理每个HTTP请求,就会

发现这其实是多线程web服务器的另一种体现,虽然设计上并不像多线程模型那么直观。在单核cpu中

每一时刻node服务器只能处理一个请求,可是node在当前请求中执行异步调用时,就会“中断”进入下一个

事件循环处理另一个请求,直到上一个请求的异步任务事件触发执行对应回调,继续执行该请求的后续逻辑。

这在某种程度上类似于CPU的时间片抢占机制,微观上的顺序执行,宏观上却是同步执行。

node在单进程单线程(js执行线程)中“模拟”了常见的多线程处理逻辑,虽然在单个node进程中无法

充分利用CPU的多核及超线程特性,可是却避免了多线程模型下的临界资源同步和线程上下文

切换的问题,同时内存资源开销相对较小,因此在I/O密集型的业务下使用node开发web服务

往往有着意想不到的好处。

可是在node开发中需要追踪每个请求的调用链路,通过获取请求头的traceId字段在每一级

的调用链路中传递该字段,包括“http请求、dubbo调用、dao操作、redis和日志打点”等操作。

这样通过追踪traceId,就可以分析请求所经过的所有中间链路,评估每个环节的时延与瓶颈,

更容易进行性能优化和错误排查。

那么,如何在业务代码中无侵入性的获取到相关的traceId呢?这就引出了本文的ThreadLocal变量。

传统的日志追踪模式

需手动传递traceId给日志中间件:

var koa = require('koa');
var app = new koa();
var Logger = {
info(msg,traceId){
console.log(msg,traceId);
}
};
let business = async function(ctx){
let v = await new Promise((res)=>{
setTimeout(()=>{
Logger.info('service执行结束',ctx.request.headers['traceId'])
res(123);
},1000);
});
ctx.body = 'hello world';
Logger.info('请求返回',ctx.request.headers['traceId'])
}; app.use(async(ctx,next)=>{
ctx.request.headers['traceId'] = Date.now() + Math.random();
await next();
}); app.use(async(ctx,next)=>{
await business(ctx);
}); app.listen(8080);

在business业务处理函数中,在service执行结束和body返回后都进行日志打点,同时手动

传递请求头traceId给日志模块,方便相关系统追踪链路。

目前这样编码无法规范化日志接口,同时也对开发人员造成了很大的困扰。对于业务开发人员他们

理应不关心如何进行链路追踪,而目前的编码则直接侵入了业务代码中,这块功能应该由日志模块

Logger来实现,可是在与请求上下文没有任何联系的Logger模块如何获取每个请求的traceId呢?

这就需要依靠node.js中的ThreadLocal变量。文章开头提到,多线程下ThreadLocal变量是与

每个线程的生命周期对应的,那么如果在node.js的“单线程+异步调用+事件循环”的特性下实现

类似的ThreadLocal变量,不就可以在每个请求的异步回调执行时获取到对应的ThreadLocal变量,

拿到相关的上下文信息吗?

ThreadLocal的node实现

单纯实现web服务器的中间链路请求追踪其实并不复杂,使用全局变量Map并通过每个请求的唯一标识

存储上下文信息,当执行到该请求的下一个异步调用时便通过在全局Map中获取到与该请求绑定的ThreadLocal

变量,不过这是在应用层面的一种投机行为,是与请求紧耦合的简易实现。

最彻底的方案则是在node应用层实现一种栈帧,在该栈帧内重写所有的异步函数,并添加各个

hook在异步函数的各个生命周期执行,实现异步函数执行上下文与栈帧的映射,这便是最为

彻底的ThreadLocal实现,而不是仅仅停留在与HTTP请求的映射过程中。

目前已经有zone.js库实现了node应用层栈帧的可控编码,同时可以在该栈帧存活阶段绑定

相关数据,我们便可以利用这种特性实现类似多线程下的ThreadLocal变量。

我们的目标是实现无侵入的编写包含链路追踪的业务代码,如下所示:

app.use(async(ctx,next)=>{
let v = await new Promise((res)=>{
setTimeout(()=>{
Logger.info('service执行结束')
res(123);
},1000);
});
ctx.body = 'hello world';
Logger.info('请求返回')
});

相比较,Logger.info中不需要手动传递traceId变量,由日志模块通过访问ThreadLocal变量获取。

通过zone.js提供的创建Zone(对应于栈帧)功能,我们不仅可以获取当前请求(类似于多线程下的单个线程)的

ThreadLocal变量,还可以获取上一个请求的相关信息。

require('zone.js');
var koa = require('koa');
var app = new koa();
var Logger = {
info(msg){
console.log(msg,Zone.current.get('traceId'));
}
}; var koaZoneProperties = {
requestContext: null
};
var koaZone = Zone.current.fork({
name: 'koa',
properties: koaZoneProperties
});
let business = async function(ctx){
let v = await new Promise((res)=>{
setTimeout(()=>{
Logger.info('service执行结束')
res(123);
},1000);
});
ctx.body = 'hello world';
Logger.info('请求返回')
};
koaZone.run(()=>{
app.use(async(ctx,next)=>{
console.log(koaZone.get('requestContext'))
ctx.request.headers['traceId'] = Date.now();
await next();
}); app.use(async(ctx,next)=>{
await new Promise((resolve)=>{
let koaMidZone = koaZone.fork({
name: 'koaMidware',
properties: {
traceId: ctx.request.headers['traceId']
}
}).run(async()=>{
// 保存请求上下文至parent zone
koaZoneProperties.requestContext = ctx;
await business(ctx);
resolve();
});
});
}); app.listen(8080);
});

创建了两个有继承关系的zone(栈帧),koaZone的requestContext属性存储上一个请求的上下文信息;

koaMidZone的traceId属性存储traceId变量,这是一个ThreadLocal变量。

Logger.info中通过Zone.current.get('traceId') 获取当前“线程”的

ThreadLocal变量,无需开发人员手动传递traceId变量。

关于zone.js的其他用法,读者有兴趣可以自行研究。本文主要利用zone.js保存一个执行栈帧

内的多个异步函数的执行上下文与特定数据(即ThreadLocal变量)的映射。

说明

目前,这套模型已在线上业务中用来追踪各级链路,各级中间件包括dubbo client、dubbo provider、

配置中心等都依赖ThreadLocal变量实现数据透传和调用传递,因此可以放心使用。

node.js与ThreadLocal的更多相关文章

  1. Node.js 应用全链路追踪技术——[全链路信息获取]

    全链路追踪技术的两个核心要素分别是 全链路信息获取 和 全链路信息存储展示. Node.js 应用也不例外,这里将分成两篇文章进行介绍:第一篇介绍 Node.js 应用全链路信息获取, 第二篇介绍 N ...

  2. node.js学习(三)简单的node程序&&模块简单使用&&commonJS规范&&深入理解模块原理

    一.一个简单的node程序 1.新建一个txt文件 2.修改后缀 修改之后会弹出这个,点击"是" 3.运行test.js 源文件 使用node.js运行之后的. 如果该路径下没有该 ...

  3. 利用Node.js的Net模块实现一个命令行多人聊天室

    1.net模块基本API 要使用Node.js的net模块实现一个命令行聊天室,就必须先了解NET模块的API使用.NET模块API分为两大类:Server和Socket类.工厂方法. Server类 ...

  4. Node.js:进程、子进程与cluster多核处理模块

    1.process对象 process对象就是处理与进程相关信息的全局对象,不需要require引用,且是EventEmitter的实例. 获取进程信息 process对象提供了很多的API来获取当前 ...

  5. Node.js:理解stream

    Stream在node.js中是一个抽象的接口,基于EventEmitter,也是一种Buffer的高级封装,用来处理流数据.流模块便是提供各种API让我们可以很简单的使用Stream. 流分为四种类 ...

  6. Node.js:Buffer浅谈

    Javascript在客户端对于unicode编码的数据操作支持非常友好,但是对二进制数据的处理就不尽人意.Node.js为了能够处理二进制数据或非unicode编码的数据,便设计了Buffer类,该 ...

  7. node.js学习(二)--Node.js控制台(REPL)&&Node.js的基础和语法

    1.1.2 Node.js控制台(REPL) Node.js也有自己的虚拟的运行环境:REPL. 我们可以使用它来执行任何的Node.js或者javascript代码.还可以引入模块和使用文件系统. ...

  8. Node.js npm 详解

    一.npm简介 安装npm请阅读我之前的文章Hello Node中npm安装那一部分,不过只介绍了linux平台,如果是其它平台,有前辈写了更加详细的介绍. npm的全称:Node Package M ...

  9. Node.js入门(一)

    一.Node.js本质上是js的运行环境. 二.可以解析js代码(没有浏览器安全级的限制): 提供系统级的API:1.文件的读写 2.进程的管理 3.网络通信 三.可以关注的四个网站: 1.https ...

随机推荐

  1. linux下安装vld

    将vld-0.10.1下载并传到/home/wangxiaolan/tar 1.进行解压 tar zxvf vld-0.10.tgz 2.进入 cd vld-0.10.1 3.usr/local/ph ...

  2. JSF基础

    JSF基础 1)JSF(JavaServer Faces)一种基于Java的Web应用的用户界面软件框架. 旨在降低web应用开发难度.减轻开发人员编写和维护web应用的负担. 一个基于JSF框架构建 ...

  3. Hibernate二级缓存简述及基于Spring4,Hibernate5,Ehcache3的二级缓存配置

    Hibernate L2缓存 缓存的分类 L2缓存工作原理 放入二级缓存的数据 Ehcache 依赖 ehcache.xml 常用的memoryStoreEvictionPolicy(缓存算法) eh ...

  4. python爬虫入门(三)XPATH和BeautifulSoup4

    XML和XPATH 用正则处理HTML文档很麻烦,我们可以先将 HTML文件 转换成 XML文档,然后用 XPath 查找 HTML 节点或元素. XML 指可扩展标记语言(EXtensible Ma ...

  5. MySQL下载安装配置和Navicat for MySQL的安装配置

    MySQL 一.下载 地址:MySQL :: Download MySQL Installer 选择那个几百M的msi文件下载 二.安装 第一步: 安装许可 双击安装文件,在如下图所示界面中勾选&qu ...

  6. IDEA安装教程

    1.下载安装程序A,链接:https://pan.baidu.com/s/1IAsGDbApfyNsHuS7_m0rdw 密码:fthp 2.下载一个配置程序B,下载安装之后,暂时不用管,之后会用到. ...

  7. 【淘宝客】根据淘客联盟精选清单(淘宝天猫内部优惠券)随机显示淘宝天猫优惠券dome

    也许大家在生活中经常淘宝看到[淘宝天猫内部优惠券]的网站,或者在微博中经常有博主发券,让大家生活中购物便宜许多,作为一个站长,我们也希望自己的网站也能有这样的一个功能,现在就分享给大家,还是免后台哦. ...

  8. RocketMQ部分数据消费不了问题排查

    问题现象 今天忽然收到RocketMQ预警信息如下: 提醒有部分数据没有消费,产生堆积情况. 打开RocketMq-Console-Ng查看如下图形式: 备注:第一反应是Consumer Group内 ...

  9. 基于.net的分布式系统限流组件

    在互联网应用中,流量洪峰是常有的事情.在应对流量洪峰时,通用的处理模式一般有排队.限流,这样可以非常直接有效的保护系统,防止系统被打爆.另外,通过限流技术手段,可以让整个系统的运行更加平稳.今天要与大 ...

  10. C++相关:C++的IO库

    前言 基本的IO库设施 istream(输入流类型),提供输入操作. ostream(输出流类型),提供输出操作. cin,一个istream对象,从标准输入读取数据. cout,一个ostream对 ...