CPU 架构SMP/NUMA，调优

SMP：全称是“对称多处理”（Symmetrical Multi-Processing）技术。

是指在一个计算机上汇集了一组处理器(多CPU),各CPU之间共享内存以及总线。

弱点：CPU变多后，但是内存和内存控制器只有一个，CPU是通过内存控制器访问内存的，所以多个CPU对内存控制器就会产生竞争，为了避免竞争就出现了NUMA架构。

NUMA：Non Uniform Memory Access

各个CPU有自己专用的内存（学名叫node），但是也可以访问别的CPU的专业内存，这时性能就会下降。

Linux下NUMA相关的命令

numastat:查看节点的状态。

可以看到自己CPU下的进程命中了自己的内存(node)多少次，没命中多少次，如果没命中的次数多了怎么办？就要强制把这进程绑定到自己的CPU上。

经典的应用场景：把nginx的worker进程绑定到numa架构下的特定的CPU上，性能会大幅度提升。
numactl：可以实现把进程绑定到特定的CPU上

但是，当机器重新启动后，绑定就失效了。如何解决呢，使用numad
numad：守护进程
numademo

非numa架构，如何把进程绑定到特定的CPU上呢，使用taskset

$ taskset -p -c 0,1,2-4,5,9 1234

上面命令的意思：把进程ip为1234的进程，绑定到0号，1号，2号，3号，4号，5号，9号CPU上。

这只是个例子，一般都绑定到1个CPU上，但是当系统重启后，还需要重新绑定，因为pid也变了。

Nginx比较厉害，可以配置哪个worker绑定到哪个CPU，事先写到配置nginx的配置文件里。

用上面的方法可以让某个进程专门让某几个CPU执行，但是这几个CPU除了要执行这个进程外，还要执行内核，怎么避免不让这些CPU不执行内核，只执行这个进程呢？

解决办法：假设有6个CPU，系统启动时，只让2个CPU执行内核的指令，其余4个不让执行内核指令。

编辑/etc/default/grub 文件，在 quiet splash 后面加上 isolcpus=2,3。回到终端执行update-grub 。其将自动依照刚才编辑的配置文件（/etc/default/grub）生成为引导程序准备的配置文件（/boot/grub/grub.cfg）

参考：ubuntu中测试进程的处理器亲和性和vCPU的绑定

即便预留了CPU，被预留的CPU不处理内核的指令了，但是也要处理中断啊，那么如何把中断也不让这些CPU处理呢？

修改/proc/irq/<irq_num>/smp_affinity文件

$ echo cpu_mask > /proc/irq/<irq_num>/smp_affinity

cpu_mask:用比特位表示。

0001：代表1号CPU

0011：代表1号和2号CPU

0101：代表1号和3号CPU

非numa架构，如何判断要把哪些进程绑定到特定CPU上呢？如何判断哪些线程被频繁的切换了呢？有如下命令

sar -q

使用sar之前要配置一下

1，修改：/etc/default/sysstat, 将 ENABLED=“false“ 改为ENABLED=“true“

2，执行：sudo /etc/init.d/sysstat restart

top

w

uptime

wmstat 1 5

下面的是查看CPU的使用率

mpstat 1 2

sar -P 1 2

iostat -c 1

cat /proc/stat

命令iostat -c 1的截图,含义查看CPU的占用率

%user：用户进程的CPU占用率
%system：内核的CPU占用率
%iowait：io处理的CPU占用率
%steal：虚拟机的CPU占用率
%idle：CPU空闲

ys:~$ iostat -c 1

Linux 4.15.0-20-generic (ys-VirtualBox)         2019年09月27日  _x86_64_        (1 CPU)

avg-cpu:  %user   %nice %system %iowait  %steal   %idle

           0.26    0.03    0.08    0.05    0.00   99.57

avg-cpu:  %user   %nice %system %iowait  %steal   %idle

           0.00    0.00    0.00    0.00    0.00  100.00

avg-cpu:  %user   %nice %system %iowait  %steal   %idle

           0.00    0.00    0.00    0.00    0.00  100.00

avg-cpu:  %user   %nice %system %iowait  %steal   %idle

           0.00    0.00    0.00    0.00    0.00  100.00

命令【dstat】比较强大，可以直观的得到如下信息：

       --top-bio

           show most expensive block I/O process

           显示最消耗blockI/O的进程

       --top-bio-adv

           show most expensive block I/O process (incl. pid and other stats)

           显示最消耗blockI/O的进程

       --top-childwait

           show process waiting for child the most

           显示等待子进程时间最长的父进程

       --top-cpu

           show most expensive CPU process

           显示最消耗CPU的进程

       --top-cpu-adv

           show most expensive CPU process (incl. pid and other stats)

           显示最消耗CPU的进程

       --top-cputime

           show process using the most CPU time (in ms)

           显示最消耗CPU时间片的进程

       --top-cputime-avg

           show process with the highest average timeslice (in ms)

           显示最消耗CPU时间片的进程

       --top-int

           show most frequent interrupt

           显示最经常发生的中断信号

       --top-io

           show most expensive I/O process

           显示最消耗I/O的进程

       --top-io-adv

           show most expensive I/O process (incl. pid and other stats)

           显示最消耗I/O的进程

       --top-latency

           show process with highest total latency (in ms)

           显示等待时间最长的进程

       --top-latency-avg

           show process with the highest average latency (in ms)

           显示等待时间最长的进程

       --top-mem

           show process using the most memory

           显示使用内存最多的进程

命令【sar -w 1（秒为单位）】比较强大，可以直观的得到进程在指定秒数里的平均切换次数

c/c++ 学习互助QQ群：877684253

本人微信：xiaoshitou5854

CPU 架构SMP/NUMA，调优的更多相关文章

CPU VS GPU(性能调优 12.1)
CPU VS GPU 关于绘图和动画有两种处理的方式:CPU(中央处理器)和GPU(图形处理器).在现代iOS设备中,都有可以运行不同软件的可编程芯片,但是由于历史原因,我们可以说CPU所做的工作都在 ...
MySQL 调优基础(一) CPU与进程
一般而言,MySQL 的调优可以分为两个层面,一个是在MySQL层面上进行的调优,比如SQL改写,索引的添加,MySQL各种参数的配置:另一个层面是从操作系统的层面和硬件的层面来进行调优.操作系统的层 ...
Linux系统调优——CPU（一）
(1).系统调优思路性能优化就是找到系统处理中的瓶颈以及去除这些的过程,性能优化其实是对OS 各子系统达到一种平衡的定义.具体步骤如下: 1. 系统的运行状况: CPU -> MEM -& ...
Java性能调优笔记
Java性能调优笔记调优步骤:衡量系统现状.设定调优目标.寻找性能瓶颈.性能调优.衡量是否到达目标(如果未到达目标,需重新寻找性能瓶颈).性能调优结束. 寻找性能瓶颈性能瓶颈的表象:资源消耗过多. ...
Perf -- Linux下的系统性能调优工具，第 1 部分【转】
转自:https://www.ibm.com/developerworks/cn/linux/l-cn-perf1/ Perf 简介 Perf 是用来进行软件性能分析的工具. 通过它,应用程序可以利用 ...
Perf -- Linux下的系统性能调优工具，第 1 部分
Perf 简介 Perf 是用来进行软件性能分析的工具. 通过它,应用程序可以利用 PMU,tracepoint 和内核中的特殊计数器来进行性能统计.它不但可以分析指定应用程序的性能问题 (per t ...
hadoop 集群调优实践总结
调优概述# 几乎在很多场景,MapRdeuce或者说分布式架构,都会在IO受限,硬盘或者网络读取数据遇到瓶颈.处理数据瓶颈CPU受限.大量的硬盘读写数据是海量数据分析常见情况. IO受限例子: 索引 ...
Perf Event ：Linux下的系统性能调优工具
Perf Event :Linux下的系统性能调优工具 2011-05-27 10:35 刘明 IBMDW 字号:T | T Perf Event 是一款随 Linux 内核代码一同发布和维护的性能 ...
ActiveMQ 性能调优
本章重点学习普通的性能调优技巧怎么优化生产者和消费者调优实例简介 ActiveMQ 的性能高度依赖于多种不同的因素,包括:网络代理拓扑架构,传输层,底层网络的服务质量和速度,硬件,操作系统和 ...

随机推荐

WebViewJavascriptBridge的详细使用
参考链接: https://www.jianshu.com/p/d12ec047ce52 https://www.jianshu.com/p/ba6358b1eec3 有demo:https://ww ...
[iOS开发]关于cocoapods的使用
CocoaPods的使用关于CocoaPods,相信做iOS开发的应该都比较熟悉了.Cocoapods是一个用来管理第三方库的比较好用的管理工具.关于Cocoapods的东西不再多说,接下来进入正题 ...
为什么AlertDialog要使用Builder来构建呢
为什么 AlertDialog 使用Builder 模式呢? 首先说句废话,因为 AlertDialog 太过复杂,内部参数太多,然后不使用构建者模式那么 AlertDialog 的构造方法就可能是: ...
mysql 安装(Linux、Ubuntu)
1.检查系统是否已经安装过mysql rpm -qa | grep mysql 若出现类似于以上的结果则表明系统已经安装过mysql,执行以下命令卸载 rpm -e --nodeps mysql-co ...
C语言中，字符型数字与常数型数字的加减实现
char in-str[10],out-str[10]; for(int i=0;i<10;i++) { out-str[i]=9-(in-str[i]-'0')+'0'; }
C#开发BIMFACE系列26 服务端API之获取模型数据11：获取单个面积分区信息
系列目录 [已更新最新开发文章,点击查看详细] 在<C#开发BIMFACE系列25 服务端API之获取模型数据9:获取楼层对应面积分区列表>一文中介绍了如何获取单个模型中单个楼层包 ...
Tree-Shaking性能优化实践 - 原理篇
Tree-Shaking性能优化实践 - 原理篇一. 什么是Tree-shaking 先来看一下Tree-shaking原始的本意上图形象的解释了Tree-shaking 的本意,本文所说的前 ...
纠错：Feign 没用短连接
Feign 默认不是短连接疯狂创客圈 Java 高并发[ 亿级流量聊天室实战]实战系列 [博客园总入口 ] 疯狂创客圈(笔者尼恩创建的高并发研习社群)Springcloud 高并发系列文章,将为大 ...
vue中的父子组件相互调用
vue中的父子组件相互调用: 1.vue子组件调用父组件方法:子组件:this.$emit('xx'); 父组件:定义yy方法,并在引用子组件时传参,如@xx="yy" 2.vue ...
[转]使用IConfigureNamedOptions和ConfigureAll配置命名选项
这是我上一篇关于在ASP.NET Core 2.x中使用多个强类型设置实例的后续文章.在文章的结尾,我介绍了命名选项的概念,该选项已添加到ASP.NET Core 2.0中.在本文中,我将详细介绍如何 ...