ceph-状态监测-脚本

http://www.tang-lei.com/2018/06/05/ceph-%E7%8A%B6%E6%80%81%E7%9B%91%E6%B5%8B-%E8%84%9A%E6%9C%AC/

为了能够试试获取ceph集群状态，以期发生故障，可以及时知晓，及时处理。这里结合公司使用的owl监控编写的python脚本，如果使用其他或者crontab，可以酌情修改返回格式。

cat ceph_status.py

100

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

118

119

120

121

122

123

124

125

126

127

#!/usr/bin/python

# -*- coding: utf-8 -*-

import os

import re

import subprocess

import sys

try:

import simplejson as json

except:

import json

##获取集群状态 HEALTH_ERR、HEALTH_WARN、HEALTH_OK

def get_ceph_status():

p = subprocess.Popen("ceph -s -f json", shell=True,stdout=subprocess.PIPE)

j_data = json.loads(p.stdout.read())

status = j_data.get('health').get('overall_status')

mark = 0 ##正常

if status == 'HEALTH_ERR':

mark = 1

if status == 'HEALTH_WARN':

mark = 2

if status == 'HEALTH_OK':

mark = 0

print {'HEALTH':mark}

return {'HEALTH':mark}

##检查osd使用率

def get_osd_usage():

p = subprocess.Popen("ceph osd df | awk '{print $1,$7}'", shell=True, stdout=subprocess.PIPE)

osds = p.stdout.readlines()

dicts = {}

for o in osds:

array = o.strip().split(" ")

try:

id = int(array[0])

dicts[array[0]]=array[1]

except ValueError:

print "Not number"

j_data = json.dumps(dicts, indent=4)

print j_data

return j_data

##获取osd状态 0表示没有down的osd, 1表示有down

def get_osd_status():

##p = subprocess.Popen("ceph osd tree | awk '{print $4}' |grep down", shell=True, stdout=subprocess.PIPE)

##osds_len = len(p.stdout.read())

##print osds_len

##if osds_len == 0:

## return 0

##else:

## return 1

p = subprocess.Popen("ceph osd stat -f json", shell=True, stdout=subprocess.PIPE)

data = json.loads(p.stdout.read())

if data.get('num_osds') == data.get('num_up_osds') == data.get("num_in_osds"):

print 0

return 0

else:

print 1

return 1

##获取pg状态 0表示 active+clean, 1表示有问题

def get_pg_status():

p = subprocess.Popen("ceph pg stat -f json", shell=True, stdout=subprocess.PIPE)

data = json.loads(p.stdout.read())

if len(data.get("num_pg_by_state")) > 1:

print 1

return 1

else:

print 0

return 0

##获取osd延迟信息

def get_osd_latency():

p = subprocess.Popen("ceph osd perf |awk '{print $1,$3}'", shell=True, stdout=subprocess.PIPE)

return _change_data_format(p)

##数据格式转换

def _change_data_format(p):

osds = p.stdout.readlines()

dicts = {}

for o in osds:

array = o.strip().split(" ")

try:

id = int(array[0])

dicts[array[0]]=array[1]

except ValueError:

print "Not number"

j_data = json.dumps(dicts, indent=4)

print j_data

return j_data

##mon 状态

def get_mon_status():

p = subprocess.Popen("ceph mon_status", shell=True, stdout=subprocess.PIPE)

usage = p.stdout.read()

json_usage = json.loads(usage)

print json_usage

return json_usage

##ceph集群所有磁盘使用率

def get_ceph_disk_usage():

p = subprocess.Popen("ceph df -f json", shell=True, stdout=subprocess.PIPE)

usage = p.stdout.read()

json_usage = json.loads(usage)

print json_usage

return json_usage

if __name__ == '__main__':

inputs = sys.argv[1]

if inputs == '1':

get_ceph_status()

if inputs == '2':

get_osd_usage()

if inputs == '3':

get_osd_status()

if inputs == '4':

get_osd_latency()

if inputs == '5':

get_pg_status()

if inputs == '6':

get_mon_status()

if inputs == '7':

get_ceph_disk_usage()

ceph-状态监测-脚本的更多相关文章

如何编写LVS对Real Server的健康状态检测脚本
简介:Linux 虚拟服务器(Linux Virtual Server. LVS),是一个由章文松开发的自由软件.利用KVS可以实现高可用的.可伸缩缩的Web, Mail, Cache和Medial等 ...
linux系统负载状态检查脚本
为了便于分析问题,编写了一个linux状态检查脚本,脚本可放置任意目录,脚本执行检测后会输出日志记录到当前目录下.直接执行脚本可用于一次检测,可通过日志进行分析.如果需要长时间监测,可执行-x参数,脚 ...
intouch与PLC之间通讯状态监测和设置
intouch与PLC进行通讯状态监测中,一般做法需要PLC来实施主动脉冲计数,或者bool变化来实现.本文通过上位机自带参数设置,实现对intouch通讯状态监视,将画面恢复初始状态,并及时弹窗报警 ...
【转载】 GPU状态监测 nvidia-smi 命令详解
原文地址: https://blog.csdn.net/huangfei711/article/details/79230446 ----------------------------------- ...
Tomcat 项目部署、账户配置、状态监测
tomcat部署项目方式一.自动部署(最常用) 直接把war包或部署的文件夹放到webapps下. tomcat启动后会自动监听webapps下的文件|目录,放入打包好的项目会自动部署,移除打包好的 ...
检查服务器主从状态的脚本-check_server_state.sh
分别检查服务器在Master/Slave状态下,各项服务是否正常,否则报警: 原来使用keepalived每隔1分钟调用,由于执行结果对keepalived的weight参数有影响,所以移动到外部,使 ...
python MySQL-Slave从服务器状态检测脚本
#!/bin/bash mysql -e "show slave status\G" > mysql_status.txt array=($(egrep 'Slave_IO_ ...
ceph状态信息靠谱查询
1)检查集群的状态汇总信息: [root@haha1 clouder]# ceph -s cluster 8e136e25-77ab-4e0b-b24b-232a7b466cfe health HEA ...
IIS状态监测（如果状态错误则重启IIS）
步骤: 1:建立健康监测文件.文件内容随意,这里以healthcheck.aspx命名,内容是<span>hellow word</span> 2:利用vbs语言执行IIS重启 ...

随机推荐

php面试专题---Mysql索引原理及SQL优化
php面试专题---Mysql索引原理及SQL优化一.总结一句话总结: 注意:只写精品 1.为表设置索引要付出代价是什么? 存储空间:一是增加了数据库的存储空间修改插入变动索引时间:二是在插入 ...
生产环境下，oracle不同用户间的数据迁移。第三部分
任务名称:生产环境下schema ELON数据迁移至schema TIAN########################################前期准备:1:确认ELON用户下的对象状态se ...
R 保存包含中文的 eps 图片--showtext
来自统计之都,感谢 Ihavenothing(http://cos.name/cn/profile/81532) 详情参考:http://cos.name/cn/topic/151358?replie ...
jmeter之登录接口的一次简单压测与分析
前言:登录接口的一次简单压测与分析 1.接口文档 2.配置元件 3.结果分析 1.接口文档 a.拿到接口文档接口地址:http://localhost:8080/jpress/admin/login ...
hibernate搭建及其增删改查
一.jar包最基础的hibernatejar包,以及数据库驱动的jar包二.数据库 t_user表 id int 主键自动增长 name varchar() 三.配置文件 <?xml ve ...
selenium自动化测试之【数据驱动测试】
数据驱动测试是自动化测试的主流设计模式之一,相同的测试脚本使用不同的测试数据来执行,测试数据和测试行为进行了完全的分离,这样的测试脚本设计模式称为数据驱动.实施数据驱动测试的步骤:1.编写测试脚本,脚 ...
js 文件下载进度监控
var xhr = new XMLHttpRequest(); xhr.open('GET', '文件地址.mp4'); xhr.setRequestHeader("Content-type ...
canvas绘制加载特效
css样式: body{ text-align: center; } canvas{ background: #ddd; } canvas标签: <canvas id="canvas& ...
Ajax表单提交给C#后台选中的checkbox值
HTML页面: <input name="payWay" type="checkbox" value="1" /> <i ...
noip2018考后反思之爆0
今年又被Han老师鞭尸了TAT noip普及组比齐同学考的都差,正在准备退役Orz 哎,算了,该放题解还是要放的:( 普及第一题我觉得没有放的必要还是放一下 Code: #include<ios ...

ceph-状态监测-脚本

ceph-状态监测-脚本的更多相关文章

随机推荐

热门专题