云计算下的企业IT运维
云计算管理员们一般都工作在一个分布式局域网计算基础设施中,它与传统数据中心最大的区别之一就是,所有被存储、调配和管理的数据都在一个私有云中。基于云计算的高效工作负载监控可在性能发生问题之前就提前发现这些问题的苗头,从而防患于未然。了解你的云计算运行详细信息将有助于交付一个更强大的云计算使用体验。
收集云计算性能指标
IT管理员们必须积极主动地收集和记录云计算服务器的性能指标与数据,这主要是因为托管云计算工作负载的大多数服务器都是需要使用专用资源的虚拟机。对于云计算服务器来说,过度分配资源或分配资源不足都是一个需要付出高昂代价的错误。
适当的规划和工作负载管理是任何重大云计算部署工作之前必须实施的环节。当收集运行专用工作负载的特定服务器的性能指标时,管理员们必须评估如下参数:
CPU使用率:云计算服务器必须是物理的或虚拟的。管理员们必须查看机器,并确定用户是如何访问CPU资源的。当无数用户从云计算启动桌面服务或应用程序服务时,必须认真考虑这台服务器需要多少个专用核。
RAM需求:基于云计算的工作负载可以是RAM密集型的。在一个特定服务器上监控一个工作负载,可允许你衡量分配多少的RAM资源。其关键在于按需规划而不过度分配资源,你可以通过工作负载监控来实现这一目标。通过查看一段时间内RAM的使用情况,管理员们可以确定何时将会发生使用高峰以及相应合适的RAM等级。
存储需求:规模规划是云计算工作负载的重要一步。用户设置和工作负载分配都需要空间资源。还必须检查I/O:例如,使用中的引导和大规模应用高峰都可以秒杀任何一个未对这类事件做好预案和采取措施的SAN。通过监控I/O和控制器指标,管理员们可以确定特定存储系统的性能水平。你可以使用固态硬盘(SSD)或板载闪存缓存以阻止I/O高峰。
网络设计:网络及其架构在云计算基层设施与工作负载中起了一个非常重要的作用。监控数据中心和云计算内的网络将有助于确定特定速度需求。从服务器到SAN通过10GbE连接的光纤交换机上行链路将有助于减少瓶颈和改善云计算工作负载性能。
性能监控工具也是非常有用的。通过理解云计算服务器是如何运行以及了解最终客户需求,管理员们可以确定合适的物理基础设施规模以便于支持虚拟实例。
工作流程自动化的优势
主动云计算工作负载监控可执行收集指标和统计数据的任务。在发生应用高峰时,许多系统都可以监控工作负载并提供工作流程自动化服务。
某些诸如旅游业这样的市场,往往在一年中的特定时间段会发生使用高峰事件。为了应对这样的突发事件,可以设置工作负载阈值,以便于一旦需求增加超过预设值时可创建新的虚拟机。因此,最终用户将总是可以访问数据和保持正常的工作负载,而无需做出性能牺牲。
工作流程自动化还有助于灾难恢复和备份等任务。由于在无数网站之间发生了数据复制操作,因此当另一个网站发生数据丢失时,远程的另一个网站就会承担这一工作负载。适当的工作负载监控和数据中心设计可以有助于提升系统的稳定性,而更为重要的是提高业务的连续性。
云计算监控提示
这里列出了一些有助于保持你私有云工作负载正常运行的规则:
了解你的物理资源。尽管在最初的时候物理资源似乎是无穷无尽的,但是事实上它们终究是有穷尽的。如果没有适当地监控和调配这些资源,这些资源会非常迅速地被用尽。云计算工作负载可以提出需求。规划是必须的。
主动保留运行日志。除了主动地监控云计算工作负载,云计算管理人员应当记录在一段时间内这一工作负载或服务器是如何运行的。云计算服务器可以升级,工作负载可以在不同物理主机之间迁移。在这些情况下,知道特定新旧服务器是如何分别设置运行可以有助于计算拥有总成本和投资回报。在很多情况下,良好的性能日志可以提供有用的统计信息以便于证明数据中心新增预算的合理性。
监控端点。从数据中心的角度来看,工程师能够监控和管理活动的工作负载。在端点处监控工作负载活动也是非常重要的。通过了解工作负载是如何被传递、是如何被接受,IT团队可以创建一个更为积极的计算体验。
当用户访问一个云计算中的工作负载时,管理员们就可以查看他们所使用的连接类型、数据如何传至端点以及是否有任何修改。在某些情况下,管理员们可能要使用到数据压缩或带宽优化等技术,从而使工作负载在端点处正常运行.如果需要更多的技术文章,可以访问马哥教育官网,每天都会有大量优质内容与大家分享欧!
云计算下的企业IT运维的更多相关文章
- 云计算和AI时代,运维应该如何做好转型?
云计算和AI时代,运维应该如何做好转型? 今天我们来聊一聊,在云计算和AI时代,运维应该如何做好转型?今天的内容可以说是我们前面运维组织架构和协作模式转型的姊妹篇.针对运维转型这个话题,谈谈我的思考和 ...
- 怎么做好企业IT运维工作
维的工作层次来分,又分为硬件运维.桌面运维.系统运维.数据库运维和应用运维.他们运维的设备,小的从个人电脑,大的到数以亿计的高精尖计算设备(比如 大型机 ). 根据公司 IT 系统规模的不同,运维团队 ...
- 2019企业linux运维最需要的了解的一些硬件基础知识
第3章 服务器 245 3.1 电脑的种类 245 3.2 服务器的介绍 246 3.2.1 服务器的类别 246 3.2.2 服务器的性能 247 3.2.3 服务器的 ...
- 京东云数据库 RDS助力企业便捷运维
iPhone6发布那年,京东在国贸等商圈送货最快速度数分钟,包括从下单到送达.这是一个极端的富含营销因素例子.即便如此,常态来看,隔天到货的这种业务模式,也是基于同样的支撑:营销业务.物流业务,大数据 ...
- 企业IT运维以及信息管理部服务器管理
方法 1.服务器有必要保持简洁.除了必要的应用软件以及安全软件之外,尽量不要安全其它的软件. 2.要做好服务器帐号权利规划和分配,分配够用的权利就行,从而降低密码泄漏带来的损失. 3.注意关注服务器软 ...
- CentOS7下搭建Ansible自动化运维工具,集中管理服务器
(1).Ansible具有如下特点: 部署简单,只需在主控端部署Ansible环境,被控端无需做任何操作: 默认使用SSH协议对设备进行管理: 主从集中化管理: 配置简单.功能强大.扩展性强: 支持A ...
- windows下批量换程序——运维常用
Windows一批机器,需要批量换程序.写个脚本给大家. net stop sharedaccess (关闭防火墙) del /s d:\*.log d:\*.vbs d:\*.pdb d:\*.vb ...
- 什么是业务运维,企业如何实现互联网+业务与IT的融合
业务运维并不是一个新概念,针对传统信息架构提出的业务服务管理就是把以业务为核心的IT系统与IT基础设施性能进行整合运维的解决方案.然而随着互联网+转型的不断推进,基础设施的智能化和广泛云化成为IT发展 ...
- 企业该如何进行高效IT运维管理
企业该如何进行高效IT运维管理 在企业内部也是一样,当大量的生产和经营数据集中在数据中心,一旦人们与数据中心因为IT故障而失去联系,停滞的也许不是个人应用受阻这样简单的后果.我们谁也不想看到自己企业的 ...
随机推荐
- 【VS开发】【miscellaneous】windows(64位)下使用curl命令
windows(64位)下使用curl命令 Curl命令可以通过命令行的方式,执行Http请求.在Elasticsearch中有使用的场景,因此这里研究下如何在windows下执行curl命令. 工具 ...
- Net上传文件
Net上传文件 最近工作内容涉及到一点前端的内容,把学习到的内容记录下来,在今后的开发过程中,不要犯错.本篇只针对一些刚入职的小白及前端开发人员,大牛请绕道!~ 刚开始我们先不讲上传文件的防范问题,先 ...
- FromServices回来
FromServices回来 起因 这两天,我忽然有点怀念 Asp.NET MVC 5 之前的时代,原因是我看到项目里面有这么一段代码(其实不止一段,几乎每个 Controller 都是) [Rout ...
- rest_framework之三种分页器使用方法
from rest_framework.pagination import PageNumberPagination,LimitOffsetPagination,CursorPagination ...
- 封装一个Model或者Vender类
Model <?php /** * User: Eden * Date: 2019/3/21 * 共有内容 */ class WxPayModel extends Model { protect ...
- 2019java学习路线图
学习路线图往往是学习一样技术的入门指南.网上搜到的Java学习路线图也是一抓一大把.但是很多学习路线图总结的云里雾里,也没有配套的视频,学习效果并不好. 分享一个完整的Java学习路线图给大家,也是贴 ...
- go defer 语句会延迟函数的执行直到上层函数返回。
defer code... 可以理解为 执行完当前defer所在的方法代码后执行defer 中的代码 常用在释放资源 比如 关闭文件 为防止忘记编写关闭代码 可以先写好 defer 各种释放资源 ...
- spark集群安装并集成到hadoop集群
前言 最近在搞hadoop+spark+python,所以就搭建了一个本地的hadoop环境,基础环境搭建地址hadoop2.7.7 分布式集群安装与配置 本篇博客主要说明,如果搭建spark集群并集 ...
- CSS3中三种清除浮动(float)影响的方式
float是HTML中布局的一大关键,很多难题一旦用上float都能很愉快地解决.但是凡是好用的,也容易出错.比如当子元素都为float时,其父元素会受影响,或者偶尔会发现自己某个div的高度变成了0 ...
- 解决tensorflow 调用bug Running model failed:Invalid argument: NodeDef mentions attr 'dilations' not in Op<name=Conv2D; signature=input:T, filter:T ->
将tensorflow C++ 版本更新为何训练版本一致即可