如需转载,请标明原文出处以及作者

陈锐 RuiChen @kiwik

*2015/2/4 22:44:22 *


写在最前面:

这段时间连续改了几个scheduler和resource_tracker相关的bug,仔细的读了一下相关的代码,一点感受分享给大家。

代码基线:Kilo

混乱中求秩序

compute_node在nova中是一个很神奇的东西,在不同的上下文中有不同的名字,本身还和Service存在复杂的关系。

数据库中有两张表services和compute_nodes,分别代表了以下两个概念:

  1. services: 一个nova的基本进程单元,例如:nova-compute, nova-conductor, nova-scheduler等等。大规模部署的时候,可能在不同主机(hostname)存在多个相同名称(binary)的进程存在,为了标识不同的进程,使用了(CONF.host, binary)作为唯一键。

  2. compute_nodes:从nova-scheduler的角度看,是最小的调度(schedule)单元,从nova-compute的角度看,是计算资源的拥有者。

Host API

先从API说起,有一组host相关的API,host-list, host-update等等。

  • host-list:听名字以为是列出了所有的compute_node,其实是列出了所有部署了nova进程的host,在这里host代表了service,功能和service-list一致,包括数据都是从Services表中获取的,可以完全用service-list取代。

  • host-describe:相对来说比较独特的host API了,显示了计算节点上资源的使用情况,包括:总量(total),当前使用量(used_now)和每个租户的使用量(project)。在这里host又代表的是compute_node

  • host-update:包括两个功能,enable/disable host和设置host维护状态。可以认为是Xen driver的特有API,因为其他的driver都没有实现。enable/disable host功能和enable/disable service功能一致。需要提到的是Xen driver的设置host维护状态,触发维护态之后,Xen driver会将这个host上的所有instance,通过XenAPI迁移到相同资源池(aggregate)的其他host上。

  • host-action:设置host的power状态,可以输入的参数有startup/reboot/shutdown,KVM/VMware一个都没有实现,Xen/HyperV实现了reboot和shutdown,没有实现startup,嘿嘿,原因你懂的。

对象模型

再来看一下nova内部的对象模型。

nova-compute

  • ResourceTracker:每一个ResourceTracker对象是DB中一个compute_node的内存映射,保存了计算资源的使用情况,包括:cpu,ram,local_gb,pci,numa_topology等。在定时任务中和DB数据同步。在nova-compute中compute_node名叫ResourceTracker。

  • ComputeManager:通过self._resource_tracker_dict缓存了所有被当前nova-compute进程管理的ResourceTracker对象,Libvirt、Xen、HyperV这类driver每一个nova-compute管理一个compute_node,VMmare和Ironic可以一个nova-compute管理多个compute_node,VMware driver下一个compute_node对应一个VMware的集群,Ironic driver下表示一个物理服务器。

所以我们经常说到的“主机(host)有多少剩余资源?”,其实更准确的描述应该是“compute_node有多少剩余资源?”。因为在VMware的场景下,一个compute_node是包括多台host的cluster。

nova-scheduler

  • HostState:compute_node在nova-scheduler进程中的表示形式,从DB的compute_nodes中构造,表示了compute_node的资源使用情况,以(hostname, hostname)为key缓存在HostManager的host_state_map中,并在合适的时候从DB中同步。在nova-scheduler中compute_node名叫HostState。

  • HostManager:在host_state_map保存所有的HostState。

同理,“nova-scheduler没有为instance选到合适的主机(host)”,应该是“nova-scheduler没有为instance选择到合适的compute_node”。

说到这里,自己都觉得自己像是孔乙己,在给大家讲“茴字的四种写法”,呵呵。但是仔细想想,用host指代compute_node,在KVM driver下可能是适用的,但是在VMware driver下呢?如果一定要给nova中的host和node做一个明确的区分的话,host可以认为是nova-compute进程运行的主机,而node是instance运行的主机。

和Service的关系

数据库中的compute_nodes表存在一个service_id列指向对应的nova-compute的services表记录。Kilo版本的BP detach-service-from-computenode 解除了两者之间的外键关联,更加明确了service和compute_node的定位,解耦之后两者通过CONF.host关联。

数据库services表中的记录是在进程启动的时候插入的,并以(CONF.host, binary)为唯一键,而compute_nodes表是在ResourceTracker.update_available_resource时插入的,以(CONF.host, nodename)为唯一键。

nodename=hypervison_name

HostState = compute_node, host aggregate metadata 对hoststate 过滤,所以,host aggregate可以对compute node过滤也就可以对ironic的node过滤?

错了,加入 host aggregate时时用host,但host status的aggregate metadata是从该host status(node)所属的host上的metadata得来的。

            host_state.update(compute,
dict(service),
self._get_aggregates_info(host),
self._get_instance_info(context, compute)) def _get_aggregates_info(self, host):
return [self.aggs_by_id[agg_id] for agg_id in
self.host_aggregates_map[host]]

(转)Nova中的compute_node的更多相关文章

  1. Nova中的系统状态分析

    系统状态 作者 孔令贤 Nova提供这么几个资源状态的查询. Service Nova中的service有两类,一类是所谓的control service,一类就是compute service.要想 ...

  2. 玩转Openstack之Nova中的协同并发(二)

    玩转Openstack之Nova中的协同并发(二) 昨天介绍了Python中的并发处理,主要介绍了Eventlet,今天就接着谈谈Openstack中Nova对其的应用. eventlet 在nova ...

  3. 玩转Openstack之Nova中的协同并发(一)

    玩转Openstack之Nova中的协同并发(一) 前不久参加了个Opnstack的Meetup,其中有一个来自EasyStack的大大就Nova中的协同并发做了一番讲解,有所感触,本想当天就总结一下 ...

  4. Nova中的Hook机制

    Nova的代码中支持Hook机制,也就是在某些函数的前后,可以加入自己的代码逻辑.Hook代码可以完全独立于Nova开发,本质上使用setuptools的entry points机制.K版本的Open ...

  5. OpenStack 企业私有云的若干需求(1):Nova 虚机支持 GPU

    本系列会介绍OpenStack 企业私有云的几个需求: 自动扩展(Auto-scaling)支持 多租户和租户隔离 (multi-tenancy and tenancy isolation) 混合云( ...

  6. nova分析(7)—— nova-scheduler

    Nova-Scheduler主要完成虚拟机实例的调度分配任务,创建虚拟机时,虚拟机该调度到哪台物理机上,迁移时若没有指定主机,也需要经过scheduler.资源调度是云平台中的一个很关键问题,如何做到 ...

  7. Openstack之Nova创建虚机流程分析

    前言        Openstack作为一个虚拟机管理平台,核心功能自然是虚拟机的生命周期的管理,而负责虚机管理的模块就是Nova. 本文就是openstack中Nova模块的分析,所以本文重点是以 ...

  8. OpenStack中Keystone的基本概念理解

    原文http://www.kankanews.com/ICkengine/archives/10788.shtml Keystone简介 Keystone(OpenStack Identity Ser ...

  9. KVM 介绍(7):使用 libvirt 做 QEMU/KVM 快照和 Nova 实例的快照 (Nova Instances Snapshot Libvirt)

    学习 KVM 的系列文章: (1)介绍和安装 (2)CPU 和 内存虚拟化 (3)I/O QEMU 全虚拟化和准虚拟化(Para-virtulizaiton) (4)I/O PCI/PCIe设备直接分 ...

随机推荐

  1. IOS 代码块

    1.关系式表示 <returnType>(^BlockName)(list of arguments)=^(arguments){body;};

  2. Quartz使用总结(转发:http://www.cnblogs.com/drift-ice/p/3817269.html)

    Quartz可以用来做什么? Quartz是一个任务调度框架.比如你遇到这样的问题 想每月25号,信用卡自动还款 想每年4月1日自己给当年暗恋女神发一封匿名贺卡 想每隔1小时,备份一下自己的爱情动作片 ...

  3. Oracle11g用户频繁锁定并且解锁后不允许登录

    原因有可能是oracle的密码过期机制导致的:一.由于Oracle中默认在default概要文件中设置了“PASSWORD_LIFE_TIME=180天”所导致.解决办法:1.查看用户用的哪种prof ...

  4. 剑指offer 面试63题

    面试63题 题目:股票的最大利润 题:假设把某股票的价格按照时间先后顺序存储在数组中,请问买卖该股票一次可获得的最大利润是多少?例如,一只股票在某些时间节点的价格为{9,11,8,5,7,12,16, ...

  5. mysql分组查询报错

    执行sql group by查询时报错 SELECT id from userz GROUP BY username Expression #1 of SELECT list is not in GR ...

  6. requirejs源码分析: requirejs 方法–2. context.require(deps, callback, errback);

    上一篇 requirejs源码分析: requirejs 方法–1. 主入口  中的return context.require(deps, callback, errback);  调用的是make ...

  7. 03 Spring框架 bean的属性以及bean前处理和bean后处理

    整理了一下之前学习spring框架时候的一点笔记.如有错误欢迎指正,不喜勿喷. 上一节我们给出了三个小demo,具体的流程是这样的: 1.首先在aplicationContext.xml中添加< ...

  8. iframe 跨域请求

    iframe.contentWindow 兼容各个浏览器,可取得子窗口的 window 对象. iframe.contentDocument Firefox 支持,> ie8 的ie支持.可取得 ...

  9. 020_自己编写的wordcount程序在hadoop上面运行,不使用插件hadoop-eclipse-plugin-1.2.1.jar

    1.Eclipse中无插件运行MP程序 1)在Eclipse中编写MapReduce程序 2)打包成jar包 3)使用FTP工具,上传jar到hadoop 集群环境 4)运行 2.具体步骤 说明:该程 ...

  10. Linux Shell基础 环境变量配置文件

    source命令:使环境变量配置文件强制生效 source 命令会强制执行脚本中的全部命令,而忽略脚本文件的权限.该命令主要用于让重新配置的环境变量配置文件强制生效.source 命令格式如下: [r ...