站在"巨人"的肩膀上运维 现实问题 之前在论坛看到一个运维工程师的帖子,内容如下: "现在的一个IT工作者最头疼的就是加班,秃顶的是IT工作者最多.单身的是IT工作者最多.没有约会,没有休闲,没有旅游还是IT工作者最多.这可怎么办呢?我是一名IT运维工程师,每天的工作量很大,更不敢离开机器半步,长期跟设备.服务器打交道,因为怕万一机器出毛病,自己负担不起业务上的麻烦,又怕经理的"炒鱿鱼",况且公司还不肯出钱雇很多IT运维人员,让我一个人看着这么多的设备,真…
在公司里做的一个接口系统,主要是对接第三方的系统接口,所以,这个系统里会和很多其他公司的项目交互.随之而来一个很蛋疼的问题,这么多公司的接口,不同公司接口的稳定性差别很大,访问量大的时候,有的不怎么行的接口就各种出错了. 这个接口系统刚刚开发不久,整个系统中,处于比较边缘的位置,不像其他项目,有日志库,还有短信告警,一旦出问题,很多情况下都是用户反馈回来,所以,我的想法是,拿起 Python,为这个项目写一个监控.如果在调用某个第三方接口的过程中,大量出错了,说明这个接口有有问题了,就可以更快的…
一.DBA数据库管理人员需要在整个架构中解决数据库的压力,前端业务通过扩展,加机器就可以很好的解决,但是存储.数据库就不是很好的可以进行扩展,数据也是分配不均的,所以,1)通过在数据库前面添加Memcached/redis等技术减少压力,比你在前面扩展多个数据库有用多.2)将静态数据放到存储上等,减轻数据库压力. 二.数据库介绍 数据库就是一个存放数据的仓库,按照一定的数据结构组织形式存在的,这种组织形式提供了多张方法,管理其中的数据. 三.数据库的种类 常用的数据库模型是关系型数据库和非关系型…
0x00前言: 一直想写一个监控方面的脚本,然后想到了运维这方面的 后来就写了个脚本. 0x001准备: psutil模块 0x02正文: import os import time import re import smtplib from email.mime.text import MIMEText from email.header import Header import socket import psutil while True: def jianca(): print('[+]…
通过前面几篇文章我们搭建好了监控环境并且监控了服务器.数据库.应用,运维人员可以实时了解当前被监控对象的运行情况,但是他们不可能时时坐在电脑边上盯着DashBoard,这就需要一个告警功能,当服务器或应用指标异常时发送告警,通过邮件或者短信的形式告诉运维人员及时处理. 今天我们就来聊聊 基于Prometheus和Grafana的监控平台的异常告警功能. 告警方式 Grafana 新版本的Grafana已经提供了告警配置,直接在dashboard监控panel中设置告警即可,但是我用过后发现其实并…
一.系统架构 二.监控 本指南涵盖了使用两个流行工具进行 RabbitMQ 监控: Prometheus,一个监控工具包:和Grafana,一个指标可视化系统.这些工具共同构成了一个强大的工具包,用于 RabbitMQ 集群的长期指标收集和监控.虽然RabbitMQ 管理 UI也提供了对指标子集的访问,但它的设计并没有试图成为一个长期的指标收集解决方案. 1.开启监控 rabbitmq-plugins enable rabbitmq_prometheus 2.健康指标 仪表板顶部的单个统计指标捕…
目录 简单介绍 概述 安装部署 一.环境要求 二.下载源码包并解压 三.准备数据库 四.修改配置文件 五.配置环境变量 六.启动kafka-eagle 七.成功运行 简单介绍 概述 Kafka-eagle是一个为了简化开发者和服务工程师维护Kafka集群工作的监控管理工具.这个管理工具可以很容易地发现分布在集群中的哪些topic分布不均匀,或者是分区在整个集群分布不均匀的的情况.它支持管理多个集群.选择副本.副本重新分配以及创建Topic.同时,这个管理工具还可以快速浏览整个集群. 安装部署 一…
1.什么是资源? 资源是Puppet最基础的元素,每个资源的定义都具有标题,类型,以及一系列的属性. 资源定义有如下的特性:   (1) Puppet使用title在编译时区分每个资源,使用命名变量在执行时区分资源 (2)在同一类型的资源中title和namevar都是唯一的 (3)每个类型都有部分属性有默认值 (4)如果不指定namevar,则默认赋予其title的值 2.常用的核心资源类型 notify,package,user,group,file,exec,cron,service (1…
pssh 1 安装:#wget http://peak.telecommunity.com/dist/ez_setup.pypython ez_setup.py#wget http://parallel-ssh.googlecode.com/files/pssh-2.2.2.tar.gz# tar zxvf pssh-2.2.2.tar.gz# cd pssh-2.2.2# python setup.py install2 pssh使用 (假设ssh已做好SSH信任,ssh信任请参看:关于ssh…
3. Nagios安装 - 客户端(192.168.0.12)在客户端机器上 rpm -ivh http://www.aminglinux.com/bbs/data/attachment/forum/month_1211/epel-release-6-7.noarch.rpm yum install -y nagios-plugins nagios-plugins-all nrpe nagios-plugins-nrpe  修改配置文件 vim /etc/nagios/nrpe.cfg “all…