Nova 如何统计 OpenStack 资源

1、云计算的本质在于将硬件资源软件化，以达到快速按需交付的效果，最基本的计算、存储和网络基础元素并没有因此改变。就计算而言，CPU、RAM 和 DISK等依旧是必不可少的核心资源。

从源代码和数据库相关表可以得出，Nova 统计计算节点的四类计算资源：

CPU: 包括 vcpus(节点物理 cpu 总线程数), vcpus_used(该节点虚拟机的 vcpu 总和)
RAM: 包括 memory_mb(该节点总 ram)，memory_mb_used(该节点虚拟机的 ram 总和)，free_ram_mb(可用 ram) Note: memory_mb = memory_mb_used + free_ram_mb
DISK：local_gb(该节点虚拟机的总可用 disk)，local_gb_used（该节点虚拟机 disk 总和），free_disk_gb(可用 disk) Note：local_gb = local_gb_used + free_disk_gb*
其它：PCI 设备、CPU 拓扑、NUMA 拓扑和 Hypervisor 等信息

从代码可以看出，Nova 每分钟统计一次资源，方式如下：

vcpus: libvirt 中 get_Info()
vcpu_used: 通过 libvirt 中 dom.vcpus() 从而统计该节点上所有虚拟机 vcpu 总和

memory: libvirt 中 get_Info()
memory_mb_used：先通过 /proc/meminfo 统计可用内存，再用总内存减去可用内存得出(资源再统计时会重新计算该值)

DISK

local_gb: os.statvfs(CONF.instances_path)
local_gb_used: os.statvfs(CONF.instances_path)(资源再统计时会重新计算该值)

其它

hypervisor 相关信息：均通过 libvirt 获取
PCI: libvirt 中 listDevices(‘pci’, 0)
NUMA: livirt 中 getCapabilities()

那么问题来了，按照上述收集资源的方式，free_ram_mb, free_disk_gb 不可能为负数。Nova-compute 在上报资源至数据库前，还根据该节点上的虚拟机又做了一次资源统计。

为什么需再次统计 RAM 资源？宿主机的内存不只是分配给虚拟机，还有肩负其他应用，因此必须重新统计 RAM 资源。

统计的方式为：

free_memory = total_memory - CONF.reserved_host_memory_mb - 虚拟机理论内存总和

CONF.reserved_host_memory_mb：内存预留，比如预留给系统或其它应用

虚拟机理论内存总和：即所有虚拟机 flavor 中的内存总和 free_disk_gb = local_gb - CONF.reserved_host_disk_mb / 1024 - 虚拟机理论磁盘总和

nova.scheduler.filters.ram_filter.BaseRamFilter

class BaseRamFilter(filters.BaseHostFilter):

    def host_passes(self, host_state, spec_obj):

        """Only return hosts with sufficient available RAM."""

        requested_ram = spec_obj.memory_mb

        free_ram_mb = host_state.free_ram_mb

        total_usable_ram_mb = host_state.total_usable_ram_mb

        if not total_usable_ram_mb >= requested_ram:

            LOG.debug("%(host_state)s does not have %(requested_ram)s MB "

                      "usable ram before overcommit, it only has "

                      "%(usable_ram)s MB.",

                      {'host_state': host_state,

                       'requested_ram': requested_ram,

                       'usable_ram': total_usable_ram_mb})

            return False

        ram_allocation_ratio = self._get_ram_allocation_ratio(host_state,

                                                              spec_obj)

        memory_mb_limit = total_usable_ram_mb * ram_allocation_ratio

        used_ram_mb = total_usable_ram_mb - free_ram_mb

        usable_ram = memory_mb_limit - used_ram_mb

        if not usable_ram >= requested_ram:

            LOG.debug("%(host_state)s does not have %(requested_ram)s MB "

                    "usable ram, it only has %(usable_ram)s MB usable ram.",

                    {'host_state': host_state,

                     'requested_ram': requested_ram,

                     'usable_ram': usable_ram})

            return False

        host_state.limits['memory_mb'] = memory_mb_limit

        return True

为什么要重新统计 DISK 资源？原因与 RAM 大致相同。为了节省空间， qemu-kvm 常用 QCOW2 格式镜像，以创建 DISK 大小为 100G 的虚拟机为例，虚拟机创建后，其镜像文件往往只有几百 KB，当有大量数据写入时磁盘时，宿主机上对应的虚拟机镜像文件会迅速增大。而 os.statvfs 统计的是虚拟机磁盘当前使用量，并不能反映潜在使用量。因此必须重新统计 DISK 资源。

统计的方式为：

free_disk_gb = local_gb - CONF.reserved_host_disk_mb / 1024 - 虚拟机理论磁盘总和

CONF.reserved_host_disk_mb：磁盘预留

虚拟机理论磁盘总和：即所有虚拟机  flavor 中得磁盘总和

nova.scheduler.filters.disk_filter.DiskFilter

class DiskFilter(filters.BaseHostFilter)::

    def _get_disk_allocation_ratio(self, host_state, spec_obj):

    return host_state.disk_allocation_ratio

def host_passes(self, host_state, spec_obj):

    """Filter based on disk usage."""

    requested_disk = (1024 * (spec_obj.root_gb +

                              spec_obj.ephemeral_gb) +

                      spec_obj.swap)

    free_disk_mb = host_state.free_disk_mb

    total_usable_disk_mb = host_state.total_usable_disk_gb * 1024

    if total_usable_disk_mb < requested_disk:

    LOG.debug("%(host_state)s does not have %(requested_disk)s "

              "MB usable disk space before overcommit, it only "

              "has %(physical_disk_size)s MB.",

              {'host_state': host_state,

               'requested_disk': requested_disk,

               'physical_disk_size':

                   total_usable_disk_mb})

    return False

    disk_allocation_ratio = self._get_disk_allocation_ratio(

    host_state, spec_obj)

    disk_mb_limit = total_usable_disk_mb * disk_allocation_ratio

    used_disk_mb = total_usable_disk_mb - free_disk_mb

    usable_disk_mb = disk_mb_limit - used_disk_mb

    if not usable_disk_mb >= requested_disk:

    LOG.debug("%(host_state)s does not have %(requested_disk)s MB "

            "usable disk, it only has %(usable_disk_mb)s MB usable "

            "disk.", {'host_state': host_state,

                       'requested_disk': requested_disk,

                       'usable_disk_mb': usable_disk_mb})

        return False

    disk_gb_limit = disk_mb_limit / 1024

    host_state.limits['disk_gb'] = disk_gb_limit

    return True

资源超配与调度

即使 free_ram_mb 或 free_disk_gb 为负，虚拟机依旧有可能创建成功。事实上，当 nova-scheduler 在调度过程中，某些 filter 允许资源超配，比如 CPU、RAM 和 DISK 等 filter，它们默认的超配比为：

CPU: CONF.cpu_allocation_ratio = 16
RAM: CONF.ram_allocation_ratio = 1.5
DISK: CONF.disk_allocation_ratio = 1.0

以 ram_filter 为例，在根据 RAM 过滤宿主机时，过滤的原则为：

memory_limit = total_memory * ram_allocation_ratio
used_memory = total_memory - free_memory
memory_limit - used_memory < flavor['ram']，表示内存不足，过滤该宿主机；否则保留该宿主机。

宿主机 RAM 和 DISK 的使用率往往要小于虚拟机理论使用的 RAM 和 DISK，在剩余资源充足的条件下，libvirt 将成功创建虚拟机。

内存和磁盘超配虽然能提供更多数量的虚拟机，当该宿主机上大量虚拟机的负载都很高时，轻着影响虚拟机性能，重则引起 qemu-kvm 相关进程被杀，即虚拟机被关机。

因此对于线上稳定性要求高的业务，建议不要超配 RAM 和 DISK，但可适当超配 CPU。建议这几个参数设置为：

CPU: CONF.cpu_allocation_ratio = 4
RAM: CONF.ram_allocation_ratio = 1.0
DISK: CONF.disk_allocation_ratio = 1.0
RAM-Reserve: CONF.reserved_host_memory_mb = 2048
DISK-Reserve: CONF.reserved_host_disk_mb = 20480

Nova 如何统计 OpenStack 资源的更多相关文章

(转) Nova是如何统计OpenStack资源
引言运维的同事常常遇到这么四个问题: Nova 如何统计 OpenStack 计算资源? 为什么 free_ram_mb, free_disk_gb 有时会是负数? 即使 free_ram_mb, ...
零基础学习openstack【完整中级篇】及openstack资源汇总
1.你是如何学习openstack的?2.你对openstack的组件了解多少?3.你认为openstack该如何学习? 一直想写关于openstack的方面的内容,今天终于整理完成.算是完成一桩心事 ...
##5.1 Nova控制节点-- openstack pike
##5.1 Nova控制节点 openstack pike 安装目录汇总 http://www.cnblogs.com/elvi/p/7613861.html ##5.1 Nova控制节点 # co ...
##5.2 Nova计算节点-- openstack pike
##5.2 Nova计算节点 openstack pike 安装目录汇总 http://www.cnblogs.com/elvi/p/7613861.html ##5.2 Nova计算节点 # co ...
使用 Ansible 统计服务器资源利用率
使用 Ansible 统计服务器资源利用率: 3 条 shell 脚本实现统计: CPU 利用率统计: top -bn1 | grep load | awk '{printf "CPU Lo ...
ns统计使用资源的SNMP OID
ns统计使用资源的SNMP OID > add snmp manager 192.168.195.1 > add snmp community public ALL > add sn ...
（转）openstack 资源查询常用 sql
直接通过查询 openstack 数据库, 获得相应的常见查询结果查询用户使用中主机, 及其主机对应信息查询用户使用中存储, 及其存储对应信息查询用户对应主机 mysql> select ...
通过apache的mod_status 统计占资源的脚本
apache的mod_status模块,提供了对apache运行时的一些统计信息,对apache的管理员来说很有意义. 一.加载apache的mod_status模块各种系统下,加载apache模块 ...
openstack （4）---部署Glance镜像服务，Nova计算服务
一.Glance Glance是Openstack项目中负责镜像管理的模块,其功能包括虚拟机镜像的查找.注册和检索等. Glance提供Restful API可以查询虚拟机镜像的metadata及获取 ...

随机推荐

C. Tanya and Toys_模拟
C. Tanya and Toys time limit per test 1 second memory limit per test 256 megabytes input standard in ...
类似LIS+贪心(ZOJ1025)
题目链接:http://acm.zju.edu.cn/onlinejudge/showProblem.do?problemId=25 解题报告: #include <cstdio> #in ...
富文本文字图片点击，（TextView）
textview上的富文本支持文字,图片的点击事件 - (void)protocolIsSelect:(BOOL)select { NSMutableAttributedString *attrib ...
2017.9.27 JavaWeb 属性的设置和获取
3.4.3新属性的设置和获取对于getpParamter方法是通过参数传递获得数据, 设置数据的方法格式: void request.setAttribute("key",Ob ...
.clone事件当你克隆的时候，DOM节点是克隆出来了，但是克隆出来的节点不能运行时事件 ...
解决办法如下在clone()里面加个参数true,即可完成事件的植入.即:.clone(true).clone( [ withDataAndEvents ], [ deepWithDataAndEve ...
hadoop中compare函数
在看hadoop 的二次排序的时候,改写了下, 加了第三个参数, 本来以为是在 public int compareTo(IntPair o) { System.out.println(" ...
jQuery deferred 使用心得
因为项目的原因,我接触到了jQuery deferred 的这个神奇的工具,下面我用几个例子,与大家分享我的感悟. 我们有5个很耗时的函数分别为fA.fB.fC.fD.fE 我们的需求是fA和fB ...
线程池，多线程，线程异步，同步和死锁，Lock接口
线程池线程池,其实就是一个容纳多个线程的容器,其中的线程可以反复使用,省去了频繁创建线程对象的操作,无需反复创建线程而消耗过多资源. 除了创建和销毁线程的开销之外,活动的线程也需要消耗系统资源.线程 ...
mybatis中oracle转mysql
刚来公司实习,遇到的第一个任务就是这个,简单记录一下思路过程.人菜的很,没啥参考价值. 测试时: 将现有的oracle库转为mysql: 用的Navicat自带数据传输功能,简单粗暴出现的问题: 1 ...
深入理解java虚拟机学习笔记（一）JVM内存模型
上周末搬家后,家里的宽带一直没弄好,跟电信客服反映了N遍了终于约了个师傅明天早上来迁移宽带,可以结束一个多星期没网的痛苦日子了.这段时间也是各种忙,都一个星期没更新博客了,再不写之前那种状态和激情都要 ...

Nova 如何统计 OpenStack 资源

Nova 如何统计 OpenStack 资源的更多相关文章

随机推荐

热门专题