详说 NUMA

标签（空格分隔）： Cloud2.0

测试条件

两台机器:

CPU:

Intel(R) Xeon(R) CPU E5-2620 v3 @ 2.40GHz X 24

Intel(R) Xeon(R) CPU E5-2680 v2 @ 2.80GHz X 40

背景知识

![300px-NUMA.svg.png-10.1kB][1]

简要的说一下NUMA架构，更多的资料请google，本文只针对NUMA做一些特定点的测试，论证网上很多关于NUMA的流言蜚语.

测试过程

NUMA 结构下，某个CPU SOCKET NODE 无内存的情况下，会使用交换分区还是使用其他 NODE 的内存 ?

NUMA 信息如下, 看到 node 0 和 node 1 的内存都还剩下42G 左右，那在 cpu0 上占用64G 的内存，剩下的22G会不会使用到交换分区，还是使用 node 1 的内存呢？

root@ip-10-21-184-4:/home/zhangbo3# numactl --hardware

available: 2 nodes (0-1)

node 0 cpus: 0 1 2 3 4 5 6 7 8 9 20 21 22 23 24 25 26 27 28 29

node 0 size: 64141 MB

node 0 free: 42625 MB

node 1 cpus: 10 11 12 13 14 15 16 17 18 19 30 31 32 33 34 35 36 37 38 39

node 1 size: 64509 MB

node 1 free: 43405 MB

node distances:

node   0   1

  0:  10  20

  1:  20  10

使用 stress 将某个 CPU 的内存沾满，总共 64G

root@ip-10-21-184-4:/home/zhangbo3# stress -m 1 --vm-bytes 64G --vm-keep

stress: info: [23651] dispatching hogs: 0 cpu, 0 io, 1 vm, 0 hdd

查看内存使用情况

root@ip-10-21-184-4:/home/zhangbo3# numastat -p 23652

Per-node process memory usage (in MBs) for PID 23652 (stress)

                           Node 0          Node 1           Total

                  --------------- --------------- ---------------

Huge                         0.00            0.00            0.00

Heap                         0.00            0.00            0.00

Stack                        0.00            0.01            0.01

Private                  44313.61        21222.64        65536.25

----------------  --------------- --------------- ---------------

Total                    44313.61        21222.66        65536.27

统计结果发现并没有使用交换分区，而是使用到了 Node1 的内存，系统并没有那么傻，有内存不用而使用交换分区.

是否是因为numa balancing参数导致？

我们关闭 numa balancing 再测试一次

echo 0 > /proc/sys/kernel/numa_balancing

root@ip-10-21-184-4:/home/zhangbo3# numastat -p 24003

Per-node process memory usage (in MBs) for PID 24003 (stress)

                           Node 0          Node 1           Total

                  --------------- --------------- ---------------

Huge                         0.00            0.00            0.00

Heap                         0.00            0.00            0.00

Stack                        0.00            0.01            0.01

Private                  44318.18        21218.07        65536.25

----------------  --------------- --------------- ---------------

Total                    44318.18        21218.08        65536.26

结果仍然是一样。

NUMA 结构下，跨 NODE 访问和 NODE 本地访问的效率差别是多少？

打开NUMA

cpu 与 mem 不在同一个 node 情况下，写内存速度

root@ip-10-21-184-4:/home/zhangbo3# numactl --cpubind=0 --membind=0 dd if=/dev/zero of=/dev/shm/local bs=20M count=1024

1024+0 records in

1024+0 records out

21474836480 bytes (21 GB) copied, 9.14673 s, 2.3 GB/s

cpu 与 mem 在同一个 node 情况下，读内存速度

root@ip-10-21-184-4:/home/zhangbo3# numactl --cpubind=0 --membind=0 dd of=/dev/null if=/dev/shm/local bs=20M count=1024

1024+0 records in

1024+0 records out

21474836480 bytes (21 GB) copied, 5.22966 s, 4.1 GB/s

cpu 与 mem 不在同一个 node 情况下，写内存速度

numactl --cpubind=0 --membind=1 dd if=/dev/zero of=/dev/shm/remote bs=20M count=1024

1024+0 records in

1024+0 records out

21474836480 bytes (21 GB) copied, 12.2229 s, 1.8 GB/s

cpu 与 mem 不在同一个 socket 情况下，读内存速度

root@ip-10-21-184-4:/home/zhangbo3# numactl --cpubind=0 --membind=1 dd of=/dev/null if=/dev/shm/B bs=20M count=1024

1024+0 records in

1024+0 records out

21474836480 bytes (21 GB) copied, 7.31183 s, 2.9 GB/s

关闭NUMA

写效率

numactl --cpubind=0 --membind=0 dd if=/dev/zero of=/dev/shm/1 bs=20MB count=1024

1024+0 records in

1024+0 records out

20480000000 bytes (20 GB) copied, 10.8606 s, 1.9 GB/s

读效率

root@ip-10-21-184-243:/home/zhangbo3# numactl --cpubind=0 --membind=0 dd of=/dev/null if=/dev/shm/A bs=20MB count=1024

1024+0 records in

1024+0 records out

20480000000 bytes (20 GB) copied, 5.41376 s, 3.8 GB/s

以上测试只作为一个基准测试，并不代表真实的内存访问或写入速率.

结论

NUMA 架构情况下，并不会导致到某个node内存不够的情况下，使用到交换分区而不使用其他内存的数据，可能这跟node1 上的内存比较充裕有关，但是node1上内存不够的情况下，大家都使用交换分区，并没有什么不妥。
大多数情况下，还是建议打开NUMA，特别是在CPU核数比较多的情况下，local memory access 还是快很多，毕竟大部分情况下不会出现remote memory access。

[1]: http://static.zybuluo.com/mr8/kuz5e78l2cc8nvw5j2rqr59s/300px-NUMA.svg.png

[原] 细说 NUMA的更多相关文章

OpenStack 虚拟机冷/热迁移的实现原理与代码分析
目录文章目录目录前文列表冷迁移代码分析(基于 Newton) Nova 冷迁移实现原理热迁移代码分析 Nova 热迁移实现原理向 libvirtd 发出 Live Migration 指令 ...
【原】AFNetworking源码阅读（三）
[原]AFNetworking源码阅读(三) 本文转载请注明出处 —— polobymulberry-博客园 1. 前言上一篇的话,主要是讲了如何通过构建一个request来生成一个data tas ...
【原】AFNetworking源码阅读（一）
[原]AFNetworking源码阅读(一) 本文转载请注明出处 —— polobymulberry-博客园 1. 前言 AFNetworking版本:3.0.4 由于我平常并没有经常使用AFNetw ...
[原] KVM 虚拟化原理探究（5）— 网络IO虚拟化
KVM 虚拟化原理探究(5)- 网络IO虚拟化标签(空格分隔): KVM IO 虚拟化简介前面的文章介绍了KVM的启动过程,CPU虚拟化,内存虚拟化原理.作为一个完整的风诺依曼计算机系统,必然有输 ...
【原】SDWebImage源码阅读（五）
[原]SDWebImage源码阅读(五) 本文转载请注明出处 —— polobymulberry-博客园 1. 前言前面的代码并没有特意去讲SDWebImage的缓存机制,主要是想单独开一章节专门讲 ...
【原】SDWebImage源码阅读（三）
[原]SDWebImage源码阅读(三) 本文转载请注明出处 —— polobymulberry-博客园 1.SDWebImageDownloader中的downloadImageWithURL 我们 ...
C#综合揭秘——细说多线程（上）
引言本文主要从线程的基础用法,CLR线程池当中工作者线程与I/O线程的开发,并行操作PLINQ等多个方面介绍多线程的开发. 其中委托的BeginInvoke方法以及回调函数最为常用. 而 I/O线程 ...
[转]C#综合揭秘——细说进程、应用程序域与上下文之间的关系
引言本文主要是介绍进程(Process).应用程序域(AppDomain)..NET上下文(Context)的概念与操作.虽然在一般的开发当中这三者并不常用,但熟悉三者的关系,深入了解其作用,对提高 ...
PHP图像处理之在原图像处理
处理原有的图像图片处理,缩放,裁剪,翻转,旋转,透明,锐化等图片操作一.创建图片资源 imagecreatetruecolor(width,hei ...

随机推荐

wamp You don't have permission to access / on this server等问题的解决.
原文:wamp You don't have permission to access / on this server等问题的解决. 安装完wamp之后,安装网上的教程设置虚拟路径,出现了问题,同样 ...
win8 iis7/iis8 安装、卸载、设置方法
原文:win8 iis7/iis8 安装.卸载.设置方法一.安装自从升级到Win8之后,之前使用已经趋于熟悉的iis7.0被取而代之的是iis8.0,那么安装和获取方法也就产生的略微的变化,为了避 ...
SVD在推荐系统中的应用
一.奇异值分解SVD 1.SVD原理 SVD将矩阵分为三个矩阵的乘积,公式: 中间矩阵∑为对角阵,对角元素值为Data矩阵特征值λi,且已经从大到小排序,即使去掉特征值小的那些特征,依然可以很好地重构 ...
基于LINUX的多功能聊天室
原文:基于LINUX的多功能聊天室基于LINUX的多功能聊天室其实这个项目在我电脑已经躺了多时,最初写完项目规划后,我就认认真真地去实现了它,后来拿着这个项目区参加了面试,同样面试官也拿这个项目来 ...
Weka初步
从前年開始使用weka最数据挖掘方面的研究,到如今有一年半的时间了.看到我们同组的兄弟写了关于weka方面的总结.我也想整理一下.由于网上的资料实在是太少.记得刚接手的时候,真是硬着头皮看代码.只是到 ...
ViewPager用法
第一图: 页面中填充内容是随机关键词飞入和飞出动画效果,随后会更新,如今请先无视吧 ---2015-02-27--- 两年后最终更新了,网上都能搜到的,哎无奈太懒http://bl ...
php_DWZ-JUI中碰到的问题解决方法详解(thinkphp+dwz)
原文:php_DWZ-JUI中碰到的问题解决方法详解(thinkphp+dwz) 折腾了两天,dwz删除后,数据不能自动刷新,解决方案,直接看图 . 1. 删除.修改状态后无法刷新记录: 在dwz. ...
Sql Server脚本使用TFS版本控制
原文:Sql Server脚本使用TFS版本控制 1.安装TFS插件 Microsoft Visual Studio Team Foundation Server 2010 MSSCCI Provid ...
Serverlet具体解释
Serverlet简单介绍: Servlet(Server Applet),全称Java Servlet,未有中文译文.是用Java编写的server端程序.其主要功能在于交互式地浏览和改动数据,生成 ...
ASP.NET MVC+EF框架+EasyUI实现权限管理系列(16)-类库架构扩展以及DLL文件生成修改和用户的简单添加
原文:ASP.NET MVC+EF框架+EasyUI实现权限管理系列(16)-类库架构扩展以及DLL文件生成修改和用户的简单添加 ASP.NET MVC+EF框架+EasyUI实现权限管系列 (开篇) ...

[原] 细说 NUMA