当我们安装node的C/C++原生模块时，涉及到使用node-gyp对C/C++原生模块的编译工作（configure、build）。这个过程，需要nodejs的头文件以及静态库参与（后续称库文件）对C/C++项目编译和链接。库文件从哪里下载，会有一定逻辑进行处理，本文将从源码入手进行分析。

编写简单的原生模块

为了方便进行分析，我们首先创建一个原生模块（关于如何编写原生模块的细节不再本文讨论）。

hello_world.cc

#include <node.h>

void Method(const v8::FunctionCallbackInfo<v8::Value>& args) {

  v8::Isolate* isolate = args.GetIsolate();

  args.GetReturnValue().Set(v8::String::NewFromUtf8(

      isolate, "world").ToLocalChecked());

}

void Initialize(v8::Local<v8::Object> exports) {

  NODE_SET_METHOD(exports, "hello", Method);

}

NODE_MODULE(NODE_GYP_MODULE_NAME, Initialize)

binding.gyp

{

  "targets": [

    {

      "target_name": "hello_world",

      "sources": [ "hello_world.cc" ]

    }

  ]

}

index.js

const binding = require('./build/Release/hello_world');

console.log(binding.hello());

package.json

...

  "scripts": {

    "build": "node-gyp configure && node-gyp build",

    "run:demo": "node index.js"

  },

...

整体结构

按照如下命令依次运行：

$ npm run build

// 使用node-gyp配置并构建

$ npm run run:demo

// 运行Demo

输出如下：

D:\Projects\node-addon-demo>npm run run:demo

> node-addon-demo@1.0.0 run:demo

> node index.js

world

从源码分析node-gyp下载库文件的路径

首先要直接给出一个结论，库文件并不是每次都要从网络上下载，库文件下载后会缓存在本地一个目录，在Windows上为C:\Users\用户\AppData\Local\node-gyp\Cache中，并按照nodejs的版本进行存储：

本人电脑安装的node版本为14.15.0，且曾经已经缓存了对应的库文件。

为了便于分析，我们首先删除该缓存文件，并且在原有的npm命令加上--verbose，输出更加详细的日志：

$ npm run build --verbose

于是，我们可以从众多的输出中，看到一个关键信息：

从日志中可以看出，node-gyp在构建过程中，会创建缓存目录，然后从指定URL下载指定版本的headers文件。

我们利用GrepWin（一款Windows下超好用的文本内容搜索工具，官网），在node-gyp目录中搜索created nodedir这个关键词，因为可以看到gyp http GET上面出现了这个关键词。那么现在有一个新的问题，node-gyp目录在哪儿？其实，从上面的日志往上查看，能够找到：

这里是调用的我们全局安装的npm依赖的node-gyp，于是我们定位到node-gyp所在目录进行搜索：

进入该文件，我们找到：

找到关键词搜索后，继续往后续代码查阅，能够看到一个download函数的调用，入参最后一位是url，此时已经是成型的url，所以接下来我们需要确定，release.tarballUrl这个值，究竟是什么时候确定的。

tarballUrl如何得到

继续向上翻阅代码，能够在入口处看到这个release是如何生成的：

进入代码后，能够找到一段核心的构建：

通过上述代码流程，我们总结出来，tarballUrl的baseUrl取决于是否存在overrideDistUrl，若存在，则直接使用；否则使用默认URL：https://nodejs.org/dist。

再查看overrideDistUrl的传入点：

也就是说，gyp对象的opts属性存在dist-url或disturl时，就会使用该值作为库文件下载的baseUrl。

如何构建gyp.opts

首先检查该函数的调用点：

发现configure和install.js都使用了该函数，且都是入口处进行的调用的：

configure.js

function configure (gyp, argv, callback) {

  var python

  var buildDir = path.resolve('build')

  var configNames = ['config.gypi', 'common.gypi']

  var configs = []

  var nodeDir

  var release = processRelease(argv, gyp, process.version, process.release)

  ......

}

module.exports = configure

install.js

function install (fs, gyp, argv, callback) {

  var release = processRelease(argv, gyp, process.version, process.release)

  ......

}

module.exports = function (gyp, argv, callback) {

  return install(fs, gyp, argv, callback)

}

可以看到confiigure.js和install.js都作为函数形式导出，也就是说，gyp这个对象是在这两个模块在被导入并以函数形式调用时被传入的。那么接下来我们需要看这两个模块在何处使用的。

在上文我们查看当前执行的node-gyp目录的时候，我们就看到过：

gyp verb cli [

gyp verb cli   'D:\\Programs\\nodejs\\node.exe',

gyp verb cli   'D:\\Programs\\nodejs\\global_modules\\node_modules\\npm\\node_modules\\node-gyp\\bin\\node-gyp.js',

gyp verb cli   'configure'

gyp verb cli ]

入口函数是：node-gyp根目录/bin/node-gyp.js。所以，我们将node-gyp以项目的形式添加到IDEA中，尝试以相同的形式调用这些命令，通过开启DEBUG模式，来一探究竟。

在bin/node-gyp.js中的最下方进行了一个名为run的函数调用：

// bin/node-gyp.js

// ......

// 还有很多省略的代码......

// start running the given commands!

run()

根据注释可以，run()执行所提供的命令。翻阅该函数：

总体分为两步：

从对象prog的todo这个数组中取出首个command命令对象，不存在判定为所有命令执行完成。
从对象prog的命令数组（commands）中找到对应命令名称（command.name），通过代码可知，该命令实际上对应一个函数。传入参数（command.args）完成该函数的调用。

那么这个prog是什么呢？通过向上阅读代码，可以知道来自于上层目录提供的模块：

而上层所指代的模块是通过package.json的main字段可知是lib/node-gyp.js：

// 根目录下的package.json

"main": "./lib/node-gyp.js",

进入该文件的gyp函数，返回的是类Gyp的实例，而Gyp实例的构造过程如下：

使用self变量指代Gyp实例，并创建devDir和commands字段。
遍历上方的commands字符串数组，给self（也就是Gyp实例）的commands属性中，逐步添加对应命令名称的函数，函数的实现是：require和command同名的js模块，这些模块又本身是以函数形式导出的，最终是调用对应模块函数。举例说明：当遍历到command为configure的时候，就是如下的形式：

  self.commands['configure'] = function (argv, callback) {

    log.verbose('command', 'configure', argv)

    return require('./configure')(self, argv, callback)

  }

那么在进行node-gyp configure时的调用栈就如下：

执行node-gyp configure:

=> run()

...

...

=> gyp.commands['configure'](argv, cb);

=> require('./configure')(self, argv, cb); // self就是Gyp实例

前文我们已经知道了configure.js这个模块导出的就是一个函数：

// configure.js

function configure (gyp, argv, callback) {

  var python

  var buildDir = path.resolve('build')

  var configNames = ['config.gypi', 'common.gypi']

  var configs = []

  var nodeDir

  // 这个gyp，就是入参gyp，也就是上面的gyp实例

  var release = processRelease(argv, gyp, process.version, process.release)

  ... ...

}

... ...

module.exports = configure

所以，我们终于知道processRelease的入参的gyp，就是上面的gyp实例。那么gyp实例中的opts属性，是哪儿来的呢？使用IDEA的Debug进行断点调式，调试bin/node-gyp.js：

可以看到，在执行parseArgv这个函数前，gyp实例里面还不存在opts属性，而执行后，又在使用opts属性的devdir。也就是说，parseArgv这个函数一定构建了opts，接下来我们重点分析这个函数。

入口的argv就是我们的运行时入参：

"dev": "node ./bin/node-gyp.js configure"

首先会经过nopt函数，看样子，是对命令行参数以及短命令的处理：

然后是该函数其他的部分：

主要分为两个部分：

对argv的解析
对环境变量的解析

对argv的解析不涉及设置opts属性，我们重点看对环境变量的解析：

  // support for inheriting config env variables from npm

  var npmConfigPrefix = 'npm_config_'

  Object.keys(process.env).forEach(function (name) {

    if (name.indexOf(npmConfigPrefix) !== 0) {

      return

    }

    var val = process.env[name]

    if (name === npmConfigPrefix + 'loglevel') {

      log.level = val

    } else {

      // add the user-defined options to the config

      name = name.substring(npmConfigPrefix.length)

      // gyp@741b7f1 enters an infinite loop when it encounters

      // zero-length options so ensure those don't get through.

      if (name) {

        this.opts[name] = val

      }

    }

  }, this)

处理流程为：

判断环境变量的名称（name），如果不是以npm_config_开头，则跳过该次处理，否则进入下一步。
如果变量名是npm_config_loglevel（npm的日志等级变量），则使用该日志等级作为node-gyp在使用npm时候的日志变量（这是对日志等级的特殊处理）。
否则（一般处理），截断该变量的名，例如name = 'npm_config_my_key'，则得到my_key，设置到opts中：opts['my_key'] = 变量值。

至此，我们已经知道了，opts属性的值来源于上述的解析。

那么，回到我们一开始的目的，我们知道了要实现从指定的地方下载node的库文件，只要opts里面存在dist-url或是disturl即可。有些读者可能会说，那这样就行了呀：

实际上，并不行：

解析结束后，会发现，gyp.opts中是不存在dist-url字段的，只有dist_url。这一切的缘由，都是因为，npm在处理环境变量的时候，会将-替换为下划线_（config | npm Docs (npmjs.com)）。

好在，node-gyp还能够处理opts中的disturl字段。所以我们只需要在使用npm来使用node-gyp的时候，加入参数--disturl。现在，让我们回到我们一开始的node-addon-demo，添加设置变量的参数：

  "scripts": {

    "build": "node-gyp configure && node-gyp build",

    "build:custom": "npm run build --verbose --disturl=this_is_my_custom_url",

    "run:demo": "node index.js"

  },

上述build:custom就是我们新加的配置，通过运行，果然，加载的是我们制定的url：

gyp verb created nodedir C:\Users\w4ngzhen\AppData\Local\node-gyp\Cache\14.15.0

// 这里报错忽略，因为使用的是一个无效的url: 'this_is_my_custom_url'

// 主要是为了验证确实是改变了

gyp http GET this_is_my_custom_url/v14.15.0/node-v14.15.0-headers.tar.gz

gyp WARN install got an error, rolling back install

gyp verb command remove [ '14.15.0' ]

node-gyp的直接使用和npm使用的区别

那么，有的细心的读者可能会说，明明这里通过npm使用的时候会转为下划线，那在node-gyp的官方github，说是可以使用dist-url这个参数呢？。

nodejs/node-gyp: Node.js native addon build tool (github.com)

实际上，官方文档给出的参数，需要你直接使用node-gyp方式进行设置，也就是说，--dist-url这个参数必须紧跟node-gyp的命令：

node-gyp configure --dist-url=xxx

像是上面的npm run ${使用node-gyp的脚本名} --dist-url=xxx，这个dist-url是作为npm的参数来被识别，而非node-gyp。所以，对于demo，我们还可以如下：

  "scripts": {

    "build": "node-gyp configure --dist-url=this_is_my_custom_url && node-gyp build --dist-url=this_is_my_custom_url",

    "build:custom": "npm run build --verbose",

    "run:demo": "node index.js"

  },

注意，这一次，我把--dist-url是放在和node-gyp命令的参数的。但是，我们知道有些npm包，内部就直接使用node-gyp进行配置编译的操作，这个过程没法通过--dist-url紧跟node-gyp命令方式，所以只能在例如.npmrc文件中配置兼容的不会被下划线处理的disturl。

总结

要想让node-gyp下载node库文件的时候，能够走指定的镜像，可以通过配置--dist-url或是--disturl的方式，但配置dist-url形式参数只能是参数紧跟node-gyp的形式：

node-gyp configure --dist-url=xxx

而不能是如下的形式：

// 你的package.json scripts字段

"build": "node-gyp configure"

// 然后在命令行调用

npm run build --dist-url=xxx //

因为此时--dist-url参数是npm的参数，且会被处理为npm_config_dist_url下划线形式，进而在gyp.opts只有dist_url属性。

所以，最安全的方式是使用disturl参数：

情况1：

node-gyp configure --disturl=xxx

情况2：

// 你的package.json scripts字段

"build": "node-gyp configure"

// 然后在命令行调用

npm run build --disturl=xxx

情况1下，disturl是作为node-gyp的参数进行解析，能够被设置到opts中。

情况2，disturl是作为npm的参数被加入到npm环境变量：npm_config_disturl，此时，node-gyp解析process.env的时候，也能解析到disturl进而设置到opts。

从源码分析node-gyp指定node库文件下载地址的更多相关文章

比特币源码分析--C++11和boost库的应用
比特币源码分析--C++11和boost库的应用我们先停下探索比特币源码的步伐,来分析一下C++11和boost库在比特币源码中的应用.比特币是一个纯C++编写的项目,用到了C++11和bo ...
Hadoop2源码分析－YARN 的服务库和事件库
1.概述在<Hadoop2源码分析-YARN RPC 示例介绍>一文当中,给大家介绍了YARN 的 RPC 机制,以及相关代码的演示,今天我们继续去学习 YARN 的服务库和事件库,分享 ...
Java集合源码分析之LinkedList
1. LinkedList简介 public class LinkedList<E> extends AbstractSequentialList<E> implements ...
Java Collections 源码分析
Java Collections API源码分析侯捷老师剖析了不少Framework,如MFC,STL等.侯老师有句名言: 源码面前,了无秘密这句话还在知乎引起广泛讨论. 我对教授程序设计的一点想 ...
Akka源码分析-Akka Typed
对不起,akka typed 我是不准备进行源码分析的,首先这个库的API还没有release,所以会may change,也就意味着其概念和设计包括API都会修改,基本就没有再深入分析源码的意义了. ...
Spring源码分析专题 —— IOC容器启动过程（上篇）
声明 1.建议先阅读<Spring源码分析专题 -- 阅读指引> 2.强烈建议阅读过程中要参照调用过程图,每篇都有其对应的调用过程图 3.写文不易,转载请标明出处前言关于 IOC 容器 ...
深入理解 Node.js 中 EventEmitter源码分析(3.0.0版本)
events模块对外提供了一个 EventEmitter 对象,即:events.EventEmitter. EventEmitter 是NodeJS的核心模块events中的类,用于对NodeJS中 ...
This Node源码分析
看军哥博客有Rtos的源码分析,手痒耍宝把自己读的源码笔记分享出来.愿与众君互相讨论学习 namespace ros { namespace names { void init(const M_str ...
kubelet分析-csi driver注册分析-Node Driver Registrar源码分析
kubernetes ceph-csi分析目录导航 Node Driver Registrar分析 node-driver-registrar是一个sidecar容器,通过Kubelet的插件注册机制 ...

随机推荐

jQuery中的表单对象属性过滤选择器（四、八）：:enabled、:disabled、:checked、:selected
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> <html> <hea ...
三大操作系统对比使用之·Windows10
时间:2018-10-29 记录:byzqy 本篇是一篇个人对Windows系统使用习惯.技巧和应用推荐的文档,在此记录.分享和后续查询备忘. 打开终端: Win+R,调出"运行" ...
三.Go微服务--令牌桶实现原理
1. 前言在上一篇文章 Go微服务: 令牌桶当中简单的介绍了令牌桶实现的原理,然后利用 /x/time/rate 这个库 10 行代码写了一个基于 ip 的 gin 限流中间件,那这个功能是怎么实 ...
centos7 wget安装Tomcat7
2021-07-15 1.环境介绍操作系统:centos7 jdk版本:jdk1.8.0.211 tomcat版本:tomcat7.0.109 2. 检查系统中是否已经安装 jdk ,如未安装, 请 ...
快速排序（C++）
快速排序快速排序是面试中经常问到的排序算法基本思想:通过一趟排序将待排序记录分割成独立的两部分,其中一部分记录的关键字均比另一部分记录的关键字小, 则可分别对这两部分记录继续进行排序,以达到整个序 ...
Appium自动化（3） - adb无线连接手机的方法
如果你还想从头学起Appium,可以看看这个系列的文章哦! https://www.cnblogs.com/poloyy/category/1693896.html 前言除了USB方式连接Andro ...
iNeuOS工业互联平台，PLC监测与控制应用过程案例。新闻:.NET 6 RC1 正式发布
目录 1. 概述... 1 2. 平台演示... 2 3. 应用过程... 2 1. 概述 iNeuOS工业互联网操作系统主要使用.netcore 3. ...
Oracle列值拼接
最近在学习的过程中,发现一个挺有意思的函数,它可实现对列值的拼接.下面我们来看看其具体用法. 用法: 对其作用,官方文档的解释如下: For a specified measure, LISTAGG ...
k8s nodes节点 notready问题
1.在master查看node状态 [root@master1 ~]# kubectl get nodes NAME STATUS ROLES AGE VERSION master1 Ready co ...
Java数学函数的使用
Java的Math类中提供了一系列关于数学运算的静态方法,常见的运算整理如下[1] 算数运算 Math.sqrt() // 平方根 Math.cbrt() // 立方根 Math.pow(a, b) ...

从源码分析node-gyp指定node库文件下载地址