最近在写一个批量巡检工具,利用ansible将脚本推到各个机器上执行,然后将执行的结果以json格式返回来。

如下所示:

# ansible node2 -m script -a /root/python/health_check.py

node2 | SUCCESS => {
"changed": true,
"rc": ,
"stderr": "Shared connection to 192.168.244.20 closed.\r\n",
"stdout": "{'cpu_iowait': '0.00', 'swap_out': 0, 'cpu_usr': '0.00', 'cpu_idle': '100.00', 'swap_total': '1999', 'swap_used': '78'
, 'load_average_5': '0.11', 'mem_util': '92.0', 'uptime': '', 'load_average_1': '0.03', 'cpu_sys': '0.00', 'mem_total': '', 'swap_in': , 'load_average_15': '0.06', 'disk': ['Filesystem Size Used Avail Use% Mounted on\\n', '/dev/sda3 18G 8.6G 8.1G 52% /\\n', 'tmpfs 238M 0 238M 0% /dev/shm\\n', '/dev/sda1 190M 27M 154M 15% /boot\\n'], 'numa': ''}\r\n",
"stdout_lines": [
"{'cpu_iowait': '0.00', 'swap_out': 0, 'cpu_usr': '0.00', 'cpu_idle': '100.00', 'swap_total': '1999', 'swap_used': '78', 'loa
d_average_5': '0.11', 'mem_util': '92.0', 'uptime': '', 'load_average_1': '0.03', 'cpu_sys': '0.00', 'mem_total': '', 'swap_in': 0, 'load_average_15': '0.06', 'disk': ['Filesystem Size Used Avail Use% Mounted on\\n', '/dev/sda3 18G .6G .1G % /\\n', 'tmpfs 238M 238M % /dev/shm\\n', '/dev/sda1 190M 27M 154M % /boot\\n'], 'numa': ''}" ]
}

然后将结果重定向到一个文本文件中,再通过另外一个脚本,对该文本文件进行解析汇总,最后实现的结果如下:

ip              uptime          cpu_usr         cpu_sys         cpu_iowait      cpu_idle        load_average_1  load_average_5  ...
192.168.244.30 0.02 0.08 ...
192.168.244.20 0.01 ...

但总感觉这种方式有点low,对返回结果进行解析,这似乎是一个比较普遍的需求吧?

没道理,官方会对这种需求视而不见的,其实,官方提供了一个callback插件,来实现回调功能,里面定义了若干场景,譬如主机不可达,执行任务失败,执行任务成功等,分别对应不同的方法,这样就可以实现在不同的场景触发不同的操作,譬如,如果执行playbook失败了就发送邮件等,执行成功了将返回的结果保存到数据库中。

官方给了一个样例,具体可见:https://github.com/ansible/ansible/blob/devel/lib/ansible/plugins/callback/log_plays.py

基于上面这个样例,自己进行了定制性开发。本来想在callback插件中实现所有功能,但callback插件调试相当麻烦,不允许使用print函数,而且如果出现问题了,譬如列表下标越界,也只是在执行ansible时给出报错信息,并没有指出具体的报错行数。

最后,放弃了自己ALL IN ONE的想法,只是将返回的结果解析后保存到sqlite3数据库中,后续再基于数据库中的数据进行汇总。

代码如下:

from __future__ import (absolute_import, division, print_function)
__metaclass__ = type import os
import time
import json
import sqlite3
from ansible.module_utils._text import to_bytes
from ansible.plugins.callback import CallbackBase class CallbackModule(CallbackBase):
"""
logs playbook results, per host, in /var/log/ansible/hosts
"""
CALLBACK_VERSION = 2.0
CALLBACK_TYPE = 'notification'
CALLBACK_NAME = 'performance_check'
CALLBACK_NEEDS_WHITELIST = False def __init__(self):
super(CallbackModule, self).__init__() def runner_on_failed(self, host, res, ignore_errors=False):
pass def runner_on_ok(self, host, res):
performance_data=PerformanceData()
create_table_sql = 'CREATE TABLE performance_data(ip varchar(20) primary key, uptime varchar(20),cpu_usr DECIMAL,cpu_sys DECI
MAL, cpu_iowait DECIMAL,cpu_idle DECIMAL,load_average_1 DECIMAL,load_average_5 DECIMAL,load_average_15 DECIMAL, mem_total INTEGER,mem_util DECIMAL,swap_total INTEGER,swap_used INTEGER,swap_in INTEGER,swap_out INTEGER,
numa TINYINT)'
insert_sql = 'insert into performance_data values (?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?)'
insert_value = str_to_json(host,res)
performance_data.create_table(create_table_sql)
performance_data.insert_command(insert_sql,insert_value)
performance_data.quit() def runner_on_skipped(self, host, item=None):
#self.log(host, 'SKIPPED', '...')
pass
def runner_on_unreachable(self, host, res):
#self.log(host, 'UNREACHABLE', res)
pass
def runner_on_async_failed(self, host, res, jid):
#self.log(host, 'ASYNC_FAILED', res)
pass
def playbook_on_import_for_host(self, host, imported_file):
pass def playbook_on_not_import_for_host(self, host, missing_file):
pass class PerformanceData():
def __init__(self):
self.conn = sqlite3.connect("/tmp/data.db")
self.cursor = self.conn.cursor() def create_table(self,create_table_sql):
self.cursor.execute(create_table_sql) def insert_command(self,insert_sql,insert_value):
self.cursor.execute(insert_sql,insert_value) def query(self,query_sql):
self.cursor.execute(query_sql)
results=self.cursor.fetchall()
return results def quit(self):
self.conn.commit()
self.conn.close() def str_to_json(host,res):
result= res["stdout"].strip(" ").replace("'",'"').strip('\n').strip('"')
results= '{"'+host+'":'+result+'}'
result_with_host = json.loads(results)
value=result_with_host[host]
return (host,value['uptime'],float(value['cpu_usr']),float(value['cpu_sys']),float(value['cpu_iowait']),
float(value['cpu_idle']), float(value['load_average_1']), float(value['load_average_5']), float(value['load_average_15
']), int(value['mem_total']), float(value['mem_util']),int(value['swap_total']),int(value['swap_used']),int(value['swap_in'
]), int(value['swap_out']), int(value['numa'])
)

这里一并附上,上述解析文本的脚本,似乎更能实现我ALL IN ONE的想法,哈哈~

#coding: utf8
import re,json,sqlite3
def get_ip_success():
with open(r'C:\Users\Administrator\Desktop\2.txt') as f:
ip_unreachable = []
ip_failed = []
ip_success=[]
line_num=0
for line in f.readlines():
if re.search('UNREACHABLE', line):
ip=line.split()[0]
ip_unreachable.append(ip)
flag=0
elif re.search('FAILED',line):
ip = line.split()[0]
ip_failed.append(ip)
flag=0
elif re.search('SUCCESS',line):
ip = line.split()[0]
flag=1
line_num=1
elif flag == 1 and line_num == 7:
line= line.strip(" ").replace("'",'"').strip('\n').strip('"')
stdout_lines= '{"'+ip+'":'+line+'}'
stdout_lines_with_ip = json.loads(stdout_lines)
ip_success.append(stdout_lines_with_ip)
line_num =line_num + 1
return ip_success def os_status_generator(ip_success):
for os_status in ip_success:
for key,value in os_status.iteritems():
yield (key,value['uptime'],float(value['cpu_usr']),float(value['cpu_sys']),float(value['cpu_iowait']),
float(value['cpu_idle']), float(value['load_average_1']), float(value['load_average_5']), float(value['load_average_15']),
int(value['mem_total']), float(value['mem_util']),int(value['swap_total']),int(value['swap_used']),int(value['swap_in']),
int(value['swap_out']), int(value['numa'])
) class OsStatus():
def __init__(self,ip_success):
try:
self.conn = sqlite3.connect(":memory:")
self.cursor = self.conn.cursor()
self.cursor.execute('''CREATE TABLE os_status
(ip varchar(20) primary key, uptime varchar(20),cpu_usr DECIMAL,cpu_sys DECIMAL,cpu_iowait DECIMAL,cpu_idle DECIMAL,
load_average_1 DECIMAL,load_average_5 DECIMAL,load_average_15 DECIMAL,mem_total INTEGER,mem_util DECIMAL,
swap_total INTEGER,swap_used INTEGER,swap_in INTEGER,swap_out INTEGER,numa TINYINT)''')
self.cursor.executemany("insert into os_status values (?,?,?,?,?,?,?,?,?,?,?,?,?,?,?,?)",os_status_generator(ip_success) )
except Exception as e:
print e; def query(self,sql):
self.cursor.execute(sql)
results=self.cursor.fetchall()
column_size=len(results[0])
column_name= [column[0] for column in self.cursor.description]
for i in range(column_size):
print column_name[i].ljust(15),
print
for each_result in results:
for i in range(column_size):
print str(each_result[i]).ljust(15),
print def quit(self):
try:
self.cursor.close()
self.conn.close()
except Exception as e:
print e; ip_success=get_ip_success()
os_status=OsStatus(ip_success)
sql = "select * from os_status"
os_status.query(sql)

最后,再提一下ansible中如何开启callback插件功能,默认是关闭的。

开启两个选项:

callback_plugins   = /usr/share/ansible/plugins/callback
bin_ansible_callbacks = True

这两个是必需的,另外一个选项是

callback_whitelist = performance_check

其中,performance_check对应的是上面callback插件中定义的“CALLBACK_NAME”,

另一个相关参数是“CALLBACK_NEEDS_WHITELIST”,如果设置为False,则无需设置callback_whitelist选项,反之,则必须在callback_whitelist选项中指定“CALLBACK_NAME”。

如何利用ansible callback插件对执行结果进行解析的更多相关文章

  1. ansible回调插件介绍(待完成)

    简介 ansible回调插件(callback plugins)允许为事件添加一些额外响应.这里的事件包括了执行任务(task)的结果,例如(ok.failed.unreachable.skipped ...

  2. Ansible系列(七):执行过程分析、异步模式和速度优化

    本文目录:1.1 ansible执行过程分析1.2 ansible并发和异步1.3 ansible的-t选项妙用1.4 优化ansible速度 1.4.1 设置ansible开启ssh长连接 1.4. ...

  3. 利用Bootstrap Paginator插件和KnockoutJS完成分页功能

    在最近一个项目中,需要结合一堆条件查询并对查询的结果数据完成一个简单分页功能,可是做着做着,自己的思路越来越模糊,做到心态崩溃!!! 哈哈,特此花点时间重新总结,并从最简单的分页,然后向多条件查询分页 ...

  4. 使用ansible kubectl插件连接kubernetes pod以及实现原理

    ansible kubectl connection plugin ansible是目前业界非常火热的自动化运维工具.ansible可以通过ssh连接到目标机器上,从而完成指定的命令或者操作. 在ku ...

  5. C#设计模式总结 C#设计模式(22)——访问者模式(Vistor Pattern) C#设计模式总结 .NET Core launch.json 简介 利用Bootstrap Paginator插件和knockout.js完成分页功能 图片在线裁剪和图片上传总结 循序渐进学.Net Core Web Api开发系列【2】:利用Swagger调试WebApi

    C#设计模式总结 一. 设计原则 使用设计模式的根本原因是适应变化,提高代码复用率,使软件更具有可维护性和可扩展性.并且,在进行设计的时候,也需要遵循以下几个原则:单一职责原则.开放封闭原则.里氏代替 ...

  6. 8. 利用Ansible快速构建MGR | 深入浅出MGR

    GreatSQL社区原创内容未经授权不得随意使用,转载请联系小编并注明来源. 目录 1. 安装ansbile 2. 配置ansible 3. 建立ssh信任 4. 测试ansible 5. 使用ans ...

  7. 利用jQuery对插件进行扩展时,方法$.extend()、$.fn.extend()区别与联系

      利用JQ开发插件的方法: 1.jQuery.extend(); 2.jQuery.fn.extend(); 3.通过$.widget()应用jQuery UI的部件工厂方式创建. 由于第三种方式通 ...

  8. php利用wsh突破函数禁用执行命令(安全模式同理)

    php利用wsh突破函数禁用执行命令(安全模式同理) 前提.需要服务器支持wsh.并知道php安装目录 但是php利用wsh执行命令是没有asp的权限高的.   突破代码 <?php $cmd= ...

  9. Jenkins 利用Dashboard View插件管理任务视图

    利用Dashboard View插件管理任务视图   by:授客 QQ:1033553122 步骤 1.  安装Dashboard View插件 说明: 如果无法在线安装,可以选择本地上传方式安装 附 ...

随机推荐

  1. Entity Framework Core 实现MySQL 的TimeStamp/RowVersion 并发控制

    将通用的序列号生成器库 从SQL Server迁移到Mysql 遇到的一个问题,就是TimeStamp/RowVersion并发控制类型在非Microsoft SQL Server数据库中的实现.SQ ...

  2. .NetCore中的日志(2)集成第三方日志工具

    .NetCore中的日志(2)集成第三方日志工具 0x00 在.NetCore的Logging组件中集成NLog 上一篇讨论了.NetCore中日志框架的结构,这一篇讨论一下.NetCore的Logg ...

  3. KMP算法求解

    // KMP.cpp : 定义控制台应用程序的入口点. // #include "stdafx.h" #include<iostream> using namespac ...

  4. ExtJS 4.2 第一个程序

    本篇介绍如何创建一个ExtJS应用程序.并通过创建目录.导入文件.编写代码及分析代码等步骤来解释第一个ExtJS程序. 目录 1. 创建程序 1.1 创建目录建议 1.2 实际目录 1.3 index ...

  5. 23种设计模式--代理模式-Proxy

    一.代理模式的介绍       代理模式我们脑袋里出现第一个词语就是代购,其实就是这样通过一个中间层这个中间成是属于什么都干什么都买得,俗称"百晓生",在平时得开发中我们经常会听到 ...

  6. 这些.NET开源项目你知道吗?.NET平台开源文档与报表处理组件集合(三)

    在前2篇文章这些.NET开源项目你知道吗?让.NET开源来得更加猛烈些吧 和这些.NET开源项目你知道吗?让.NET开源来得更加猛烈些吧!(第二辑)中,大伙热情高涨.再次拿出自己的私货,在.NET平台 ...

  7. springmvc 多数据源 SSM java redis shiro ehcache 头像裁剪

    获取下载地址   QQ 313596790  A 调用摄像头拍照,自定义裁剪编辑头像 B 集成代码生成器 [正反双向](单表.主表.明细表.树形表,开发利器)+快速构建表单;  技术:31359679 ...

  8. Oozie分布式任务的工作流——Spark篇

    Spark是现在应用最广泛的分布式计算框架,oozie支持在它的调度中执行spark.在我的日常工作中,一部分工作就是基于oozie维护好每天的spark离线任务,合理的设计工作流并分配适合的参数对于 ...

  9. 【微信SEO】公众号也能做排名?

    [写于2016年8月] 最近,微信团队发出一则公告,开放公众号运营者一年内更改公众号名一次,这对不少名字起的奇葩名字(包括dkplus)的公众号来说是一件好事. 为什么说是好事呢?公众号名字直接关联到 ...

  10. [bzoj2152][聪聪和可可] (点分治+概率)

    Description 聪聪和可可是兄弟俩,他们俩经常为了一些琐事打起来,例如家中只剩下最后一根冰棍而两人都想吃.两个人都想玩儿电脑(可是他们家只有一台电脑)……遇到这种问题,一般情况下石头剪刀布就好 ...