esxtop 指标%RDY,NUMA,Wide-VMs
参考文章:http://www.boche.net/blog/index.php/2010/10/21/cpu-ready-to-rdy-conversion/
好文:http://frankdenneman.nl/2010/09/13/esx-4-1-numa-scheduling/
http://bbs.vmanager.cn/thread-3939-1-1.html
http://wahlnetwork.com/2011/09/22/numa-woes-battling-high-cpu-rdy-on-vsphere-4/
http://frankdenneman.nl/2010/02/03/sizing-vms-and-numa-nodes/
http://frankdenneman.nl/2010/12/28/node-interleaving-enable-or-disable/
如果是每个node有6core,vm最好分配2,3,6个vcpu
缺省是vm超过8个vcpu会启用vNUMA,但是如果VM分配的vcpu不超过8个,但是仍然大于node中的内核总数,可以对这些vm启用vNUMA
有一些多核处理器的NUMA节点大小不同于每socket的核心数目。例如有些12核心cpu具有2个6核心的NUMA节点。
Some multi-core processors have NUMA node sizes that are different than the number of cores
per socket. For example, some 12-core processors have two six-core NUMA nodes per processor.

First and most importantly, try and size your VMs as a multiple of your physical server’s NUMA node size. For instance, if your physical server has 6 cores per NUMA node, size your VMs as either 2, 3, or 6 way. This KB article explains the potential impact of mismatched VM sizes to NUMA node sizes in more detail http://kb.vmware.com/kb/1026063
Virtual NUMA
vSphere 5.0 and later support for exposing virtual NUMA topology to guest operating systems, which can improve performance by facilitating guest operating system and application NUMA optimizations.
virtual machines so they align with physical NUMA boundaries. For example, you have a host system with six cores per NUMA node. In this case, size your virtual machines with a multiple of six vCPUs (that is, 6 vCPUs, 12 vCPUs, 18vCPUs, 24 vCPUs, and so on).
By default, vNUMA is enabled only for virtual machines (hardware versions: 8) with more than eight vCPUs. This feature can be enabled for smaller virtual machines, however, by adding to the .vmx file the following line:numa.vcpu.maxPerVirtualNode = X (where X is the number of vCPUs per vNUMA node).
使用虚拟 NUMA
vSphere 5.0 及更高版本包括对向客户机操作系统公开虚拟 NUMA 拓扑的支持,这样便于客户机操作系统和应用程序 NUMA 优化,从而可提高性能。
虚拟 NUMA 拓扑可用于硬件版本 8 的虚拟机,且默认情况下在虚拟 CPU 的数目大于 8 时启用。也可以使用高级配置选项手动影响虚拟 NUMA 拓扑。
可以通过 vSphere Client 中的两种设置来影响虚拟 NUMA 拓扑:虚拟机的虚拟插槽数及每个插槽的内核数。如果每个插槽的内核数 (cpuid.coresPerSocket) 大于 1,且虚拟机中的虚拟内核数大于 8,则虚拟 NUMA 节点大小与虚拟插槽大小相匹配。如果每个插槽的内核数小于或等于 1,则会创建虚拟 NUMA 节点以匹配首个打开虚拟机电源的物理主机的拓扑。
当虚拟 CPU 数目和使用的内存量按比例增长时,可以使用默认值。对于占用不成比例的大量内存的虚拟机,可通过以下方式之一替代默认值:
■
增加虚拟 CPU 的数目,即使未使用此数目的虚拟 CPU 也是如此。请参见更改虚拟 CPU 的数目。
■
使用高级选项通过物理 NUMA 拓扑来控制虚拟 NUMA 拓扑及其映射。请参见虚拟 NUMA 控制。

Figure 2: NON-NUMA vCPU placement

Figure 3: NUMA vCPU placement


Figure 4: esxtop memory totals
如图:上图服务器有64GB内存,2个4核CPU,每个NUMA分配有32GB内存。
第一个NUMA node有13988 free,第二个NUMA node有372 MB free.
在第二个节点上的vm看起来会没有多少内存可以使用了,但是幸运的是可以远程使用node1上的内存。
N%L指示使用本地NUMA node节点上的内存的百分比。少于一定比例会将vm迁移到令一个node以便提高本地内存存取性能。
| METRIC | EXPLANATION |
|---|---|
| NHN | Current Home Node for virtual machine |
| NMIG | Number of NUMA migrations between two snapshots. It includes balance migration, inter-mode VM swaps performed for locality balancing and load balancing |
| NRMEM (MB) | Current amount of remote memory being accessed by VM |
| NLMEM (MB) | Current amount of local memory being accessed by VM |
| N%L | Current percentage memory being accessed by VM that is local |
| GST_NDx (MB) | The guest memory being allocated for VM on NUMA node x. “x” is the node number |
| OVD_NDx (MB) | The VMM overhead memory being allocated for VM on NUMA node x |

Transparent page sharing and memory locality.
------------------------------------------------------------------------------------
当考察一个物理主机性能的时候,一个重要的衡量指标是CPU使用率。
而考察一个虚拟机的性能的时候,另一个重要的指标是Ready time.
Ready time 告诉我们guest vm在获得主机分配的CPU资源前等待了多久时间,以 % format的格式
%RDY曾经用来发现CPU性能瓶颈
vSphere Client中也可以监控vm性能指标,可以发现CPU ready这项,以微秒为统计
两种格式需要转换。


NUMA
NUMA stands for Non-Uniform Memory Access, which translates into a variance of memory access latencies. Both AMD Opteron and Intel Nehalem are NUMA architectures. A processor and memory form a NUMA node. Access to memory within the same NUMA node is considered local access, access to the memory belonging to the other NUMA node is considered remote access.
在激活了NUMA的ESXi主机的虚拟机上执行esxtop显示%RDY值过高 |
|
Node interleaving disabled equals NUMA
、、

esxtop 指标%RDY,NUMA,Wide-VMs的更多相关文章
- NUMA and vNUMA
NUMA and vNUMA posted by szamosattila on march 04, 2012Tutorial, Virtualization With the spread of S ...
- RFC2544测试指标
RFC2544测试指标 参考:https://wenku.baidu.com/view/3abbb5bf960590c69ec3769d.html RFC2544性能测试介绍 参考:https:// ...
- All you should know about NUMA in VMware!
http://www.elasticvision.info/ All you should know about NUMA in VMware! Lets try answering some typ ...
- vsphere 处理NUMA
vsphere 4.1 之前: cpu调度会将一个VM的分配给一个home node,整个vm被看做一个NUMA client. 如果VM的vCPU数量超过一个NUMA node的可用数量,则不被看做 ...
- Summarizing NUMA Scheduling两篇文章,解释得不错
http://vxpertise.net/2012/06/summarizing-numa-scheduling/ Sitting on my sofa this morning watching S ...
- NUMA总结。
vsphere 5.1性能最佳实践http://www.vmware.com/pdf/Perf_Best_Practices_vSphere5.1.pdf vNUMA 要求:硬件版本8以上. 1.整个 ...
- 深度学习在美团点评推荐平台排序中的应用&& wide&&deep推荐系统模型--学习笔记
写在前面:据说下周就要xxxxxxxx, 吓得本宝宝赶紧找些广告的东西看看 gbdt+lr的模型之前是知道怎么搞的,dnn+lr的模型也是知道的,但是都没有试验过 深度学习在美团点评推荐平台排序中的运 ...
- 使用 esxtop 识别存储性能问题
可以使用交互式 esxtop 实用程序提供连接到 VMware ESX 主机的各种设备的 I/O 衡量指标. 使用 esxtop 配置监控 要监控每个 HBA 的存储性能,请执行以下操作: 通过在命令 ...
- (转)Linux NUMA引发的性能问题
最近某客户的核心业务系统又出了翻译缓慢的情况.该问题在6月份也出现过,当时进行了一次调整. 我们首先来看下故障时间段的awr报告: 单纯的从TOP 5 event,基本上是看不出任何东西的,可能有人会 ...
随机推荐
- CAD二次开发起步
1 环境搭建(VS 2017 + CAD 2019) CAD版本一般要比VS版本晚两年以上,比如我现在使用VS2017,则CAD要用2019版,至于CAD2018能不能用没试验过,有兴趣的小伙伴可以试 ...
- Ubuntu64位下使用eclipse闪退的解决
解决办法: 删除文件 [workspace]/.metadata/.plugins/org.eclipse.e4.workbench/workbench.xmi
- Caused by: java.lang.IllegalArgumentException: Can not set int field reyo.sdk.enity.xxx.xxx to java.lang.Long
由于数据库字段设置不正确引起的,不能选中 alter <table> modify <column> int unsigned; 关于unsigned int类型,可以看看它的 ...
- Orchard模块开发全接触1:起步
在<http://www.cnblogs.com/luminji/p/3831281.html>中简单介绍了 Orchard 的模块开发,接下来,我们需要做个更复杂的例子,Orchard ...
- .NetCore中EFCore for MySql整理(二)
一.简介 EF Core for MySql的官方版本MySql.Data.EntityFrameworkCore 目前正是版已经可用当前版本v6.10,对于以前的预览版参考:http://www.c ...
- 概率校准与Brier分数
1.再提逻辑回归 前面已经讲过了逻辑回归,这里不再细讲,只是简单的说一个函数,主要是方便大家更好的理解概率校准. 在逻辑回归中,用的最多的就是sigmod函数,这个函数的作用就是把无限大或者无限小的数 ...
- c++ 如何编写接口类(interface)
接口类简介: 接口是一系列抽象方法的声明,是一些方法特征的集合,这些方法都应该是抽象的,需要由具体的类去实现,然后第三方就可以通过这组抽象方法调用,让具体的类执行具体的方法. 用c++实现接口类时需要 ...
- 深度学习Github排名,很不错的介绍
今天看到这篇文章,把深度学习github排名靠前的项目,介绍了一下,很不错: https://blog.csdn.net/yH0VLDe8VG8ep9VGe/article/details/81611 ...
- 混合开发 Hybird Cordova PhoneGap web 跨平台 MD
Markdown版本笔记 我的GitHub首页 我的博客 我的微信 我的邮箱 MyAndroidBlogs baiqiantao baiqiantao bqt20094 baiqiantao@sina ...
- layer.msg();怎么关闭
var index = layer.msg(); $.ajax("","",function(){ layer.close(index) })


100%
发表于 2011-3-16 13:48:09 |