云计算管理员们一般都工作在一个分布式局域网计算基础设施中,它与传统数据中心最大的区别之一就是,所有被存储、调配和管理的数据都在一个私有云中。基于云计算的高效工作负载监控可在性能发生问题之前就提前发现这些问题的苗头,从而防患于未然。了解你的云计算运行详细信息将有助于交付一个更强大的云计算使用体验。

收集云计算性能指标

IT管理员们必须积极主动地收集和记录云计算服务器的性能指标与数据,这主要是因为托管云计算工作负载的大多数服务器都是需要使用专用资源的虚拟机。对于云计算服务器来说,过度分配资源或分配资源不足都是一个需要付出高昂代价的错误。

适当的规划和工作负载管理是任何重大云计算部署工作之前必须实施的环节。当收集运行专用工作负载的特定服务器的性能指标时,管理员们必须评估如下参数:

CPU使用率:云计算服务器必须是物理的或虚拟的。管理员们必须查看机器,并确定用户是如何访问CPU资源的。当无数用户从云计算启动桌面服务或应用程序服务时,必须认真考虑这台服务器需要多少个专用核。

RAM需求:基于云计算的工作负载可以是RAM密集型的。在一个特定服务器上监控一个工作负载,可允许你衡量分配多少的RAM资源。其关键在于按需规划而不过度分配资源,你可以通过工作负载监控来实现这一目标。通过查看一段时间内RAM的使用情况,管理员们可以确定何时将会发生使用高峰以及相应合适的RAM等级。

  存储需求:规模规划是云计算工作负载的重要一步。用户设置和工作负载分配都需要空间资源。还必须检查I/O:例如,使用中的引导和大规模应用高峰都可以秒杀任何一个未对这类事件做好预案和采取措施的SAN。通过监控I/O和控制器指标,管理员们可以确定特定存储系统的性能水平。你可以使用固态硬盘(SSD)或板载闪存缓存以阻止I/O高峰。

  网络设计:网络及其架构在云计算基层设施与工作负载中起了一个非常重要的作用。监控数据中心和云计算内的网络将有助于确定特定速度需求。从服务器到SAN通过10GbE连接的光纤交换机上行链路将有助于减少瓶颈和改善云计算工作负载性能。

  性能监控工具也是非常有用的。通过理解云计算服务器是如何运行以及了解最终客户需求,管理员们可以确定合适的物理基础设施规模以便于支持虚拟实例。

工作流程自动化的优势

  主动云计算工作负载监控可执行收集指标和统计数据的任务。在发生应用高峰时,许多系统都可以监控工作负载并提供工作流程自动化服务。

  某些诸如旅游业这样的市场,往往在一年中的特定时间段会发生使用高峰事件。为了应对这样的突发事件,可以设置工作负载阈值,以便于一旦需求增加超过预设值时可创建新的虚拟机。因此,最终用户将总是可以访问数据和保持正常的工作负载,而无需做出性能牺牲。

  工作流程自动化还有助于灾难恢复和备份等任务。由于在无数网站之间发生了数据复制操作,因此当另一个网站发生数据丢失时,远程的另一个网站就会承担这一工作负载。适当的工作负载监控和数据中心设计可以有助于提升系统的稳定性,而更为重要的是提高业务的连续性。

云计算监控提示

  这里列出了一些有助于保持你私有云工作负载正常运行的规则:

  了解你的物理资源。尽管在最初的时候物理资源似乎是无穷无尽的,但是事实上它们终究是有穷尽的。如果没有适当地监控和调配这些资源,这些资源会非常迅速地被用尽。云计算工作负载可以提出需求。规划是必须的。

  主动保留运行日志。除了主动地监控云计算工作负载,云计算管理人员应当记录在一段时间内这一工作负载或服务器是如何运行的。云计算服务器可以升级,工作负载可以在不同物理主机之间迁移。在这些情况下,知道特定新旧服务器是如何分别设置运行可以有助于计算拥有总成本和投资回报。在很多情况下,良好的性能日志可以提供有用的统计信息以便于证明数据中心新增预算的合理性。

  监控端点。从数据中心的角度来看,工程师能够监控和管理活动的工作负载。在端点处监控工作负载活动也是非常重要的。通过了解工作负载是如何被传递、是如何被接受,IT团队可以创建一个更为积极的计算体验。

当用户访问一个云计算中的工作负载时,管理员们就可以查看他们所使用的连接类型、数据如何传至端点以及是否有任何修改。在某些情况下,管理员们可能要使用到数据压缩或带宽优化等技术,从而使工作负载在端点处正常运行.如果需要更多的技术文章,可以访问马哥教育官网,每天都会有大量优质内容与大家分享欧!

云计算下的企业IT运维的更多相关文章

  1. 云计算和AI时代,运维应该如何做好转型?

    云计算和AI时代,运维应该如何做好转型? 今天我们来聊一聊,在云计算和AI时代,运维应该如何做好转型?今天的内容可以说是我们前面运维组织架构和协作模式转型的姊妹篇.针对运维转型这个话题,谈谈我的思考和 ...

  2. 怎么做好企业IT运维工作

    维的工作层次来分,又分为硬件运维.桌面运维.系统运维.数据库运维和应用运维.他们运维的设备,小的从个人电脑,大的到数以亿计的高精尖计算设备(比如 大型机 ). 根据公司 IT 系统规模的不同,运维团队 ...

  3. 2019企业linux运维最需要的了解的一些硬件基础知识

    第3章 服务器    245 3.1 电脑的种类    245 3.2 服务器的介绍    246 3.2.1 服务器的类别    246 3.2.2 服务器的性能    247 3.2.3 服务器的 ...

  4. 京东云数据库 RDS助力企业便捷运维

    iPhone6发布那年,京东在国贸等商圈送货最快速度数分钟,包括从下单到送达.这是一个极端的富含营销因素例子.即便如此,常态来看,隔天到货的这种业务模式,也是基于同样的支撑:营销业务.物流业务,大数据 ...

  5. 企业IT运维以及信息管理部服务器管理

    方法 1.服务器有必要保持简洁.除了必要的应用软件以及安全软件之外,尽量不要安全其它的软件. 2.要做好服务器帐号权利规划和分配,分配够用的权利就行,从而降低密码泄漏带来的损失. 3.注意关注服务器软 ...

  6. CentOS7下搭建Ansible自动化运维工具,集中管理服务器

    (1).Ansible具有如下特点: 部署简单,只需在主控端部署Ansible环境,被控端无需做任何操作: 默认使用SSH协议对设备进行管理: 主从集中化管理: 配置简单.功能强大.扩展性强: 支持A ...

  7. windows下批量换程序——运维常用

    Windows一批机器,需要批量换程序.写个脚本给大家. net stop sharedaccess (关闭防火墙) del /s d:\*.log d:\*.vbs d:\*.pdb d:\*.vb ...

  8. 什么是业务运维,企业如何实现互联网+业务与IT的融合

    业务运维并不是一个新概念,针对传统信息架构提出的业务服务管理就是把以业务为核心的IT系统与IT基础设施性能进行整合运维的解决方案.然而随着互联网+转型的不断推进,基础设施的智能化和广泛云化成为IT发展 ...

  9. 企业该如何进行高效IT运维管理

    企业该如何进行高效IT运维管理 在企业内部也是一样,当大量的生产和经营数据集中在数据中心,一旦人们与数据中心因为IT故障而失去联系,停滞的也许不是个人应用受阻这样简单的后果.我们谁也不想看到自己企业的 ...

随机推荐

  1. js 数组去重、去空(收藏)

    function unique (arr) { return Array.from(new Set(arr)) } var arr = [1,1,'true','true',true,true,15, ...

  2. 岩哥带你飞——Spring 学习1&重要组件

    ------------------------------------------------------------------------------ 准备工作:1.创建一个web 项目 2.创 ...

  3. Ribbon【入门】

    公共依赖: <parent> <groupId>org.springframework.boot</groupId> <artifactId>sprin ...

  4. python 正则 re模块(详细版)

    正则表达式 什么是正则表达式? 正则表达式是对字符串(包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为“元字符”))操作的一种逻辑公式,就是用事先定义好的一些特定字符.及这些特定字符的组合 ...

  5. spring cloud微服务实践四

    spring cloud的hystrix还有一个配搭的库hystrix-dashboard,它是hystrix的一款监控工具,能直观的显示hystrix响应信息,请求成功率等.但是hystrix-da ...

  6. Gossip协议

    Gossip数据传播协议: Fabric通过将工作负载划分到事务执行(背书和提交)对等节点和事务排序节点,优化了区块链网络性能.安全性和可伸缩性.这种网络操作的解耦需要一个安全.可靠和可伸缩的数据传播 ...

  7. BZOJ4566 HAOI2016找相同字符(后缀自动机)

    对第一个串建SAM,第二个串在上面跑,记录当前前缀匹配的最长后缀长度l,每次考虑当前前缀的贡献,对于当前所在节点显然是|right|*(l-len[fa]),而对于其parent树上所有祖先的贡献显然 ...

  8. Warning: popen() has been disabled for security reasons in OS/Guess.php on line 241

    今天使用pecl install swoole命令编译安装swoole的时候提示:Warning: popen() has been disabled for security reasons in ...

  9. C#对象转换工具类

    using System; using System.Collections.Generic; using System.Linq; using System.Reflection; using Sy ...

  10. 通过DBCC Page查看在SQL Server中哪行数据被锁住了?

    原文:通过DBCC Page查看在SQL Server中哪行数据被锁住了? 如何查看被锁的是哪行数据?通过dbcc page可以. 要想明白这个问题: 首先,需要模拟阻塞问题,这里直接模拟了阻塞问题的 ...