1.taokeeper简介

淘宝的开源监控zookeeper的工具,年久失修!

项目地址:

https://github.com/alibaba/taokeeper

监控项:

CPU/MEM/LOAD的监控

ZK日志目录所在磁盘剩余空间监控

单机连接数的峰值报警

单机 Watcher数的峰值报警

节点自检:是指对集群中每个IP所在ZK节点上的PATH: /YINSHI.MONITOR.ALIVE.CHECK 定期进行三次如下流程 : 节点连接 - 数据发布 - 修改通知 - 获取数据 - 数据对比, 在指定的延时内,三次流程均成功视为该节点处于正常状态。

taokeeper4个线程:

4个线程,根据clusterId来获取一个zk集群。

1.ClientThroughputStatJob()

检测链接的数据信息,并放到GlobalInstace

2. ZooKeeperALiveCheckerJob()

调用ZooKeeper API链接测试,启动ZooKeeper数据修改通知检测 ,检查节点是否存活

3. ZooKeeperStatusCollectJob()

对集群server进行ssh链接,执行命令 echo stat | nc {IP} {PORT}和echo wchs | nc {IP} {PORT}以及echo wchc | nc {IP} {PORT},将结果封装之后再检查这些数据,是否大于阈值,如果大于就发送错误通知;

4. HostPerformanceCollectTask()

收集机器CPU LOAD MEMEORY 负载情况 如果大于设置的值则发送消息

程序执行过程(过程中执行的命令附录中有说明)

Initialization类启动四个线程线程,每一个线程查询需要监控集群,再把查询到的集群中的服务器信息,分别作为创建子线程的参数:

第一个线程的子线程:对集群server进行ssh链接,执行命令 echo cons | nc {IP} {PORT},将获取回的session详细信息封装,放入全局对象GlobalInstace中;
第二个线程的子线程:调用ZooKeeper API链接测试,试2个3次,如果不行就发送错误通知;
第三个线程的子线程:对集群server进行ssh链接,执行命令 echo stat | nc {IP} {PORT}和echo wchs | nc {IP} {PORT}以及echo wchc | nc {IP} {PORT},将结果封装,之后再检查这些数据,是否大于阈值,如果大于就发送错误通知;
第四个线程的子线程:对集群server进行ssh获取服务器CPU,内存,磁盘,load等情况,将结果封装,之后再检查这些数据,是否大于阈值,如果大于就发送错误通知。

注意:每个zookeeper服务器上安装nc软件:yum -y install nc   
不安装nc会导致zookeeper监控信息出不来,如下图。zk的角色、连接类等信息就是通过SSH远程执行nc命令,如nc 192.168.1.133 2181

附录:

conf :
3.3.0版本中新增:输出详细的服务配置信息。
cons:
3.3.0版本中新增:列出所有 客户端 链接到 服务端的 session 详细信息。包括所有 接收/发送 的信息包数,session Id,延迟的操作,最后执行的操作…
crst:
3.3.0版本中新增:重置对所有connection/session统计。
dump
列出所有的未处理的会话和零时节点。这个命令只能使用在leader服务上。
envi
输出当前服务的详细信息
ruok
确认服务运行状态是否正常。如果服务正在运行,则回复”imok”。相反的服务将不会回应。
返回了”imok”的服务并不一定表名服务是在集群内,只是说明服务器进程激活和绑定到了指定的客户端端口。使用”stat” 可以获取集群的组成情况和客户端的链接信息
srst
重置server统计
srvr
3.3.0版本中新增:打印所有的服务器信息
stat
列出简略的服务信息和链接客户端信息
wchs
3.3.0版本中新增: 列出简略的服务器上的watches信息
wchc
3.3.0版本中新增: 按照session列出详细的服务器上的watches信息。输出的内容是sessions(connections) 和相关的watches(路径)。
注意:在不同的watches的数量情况下,这个操作肯能很消耗性能,使用它要格外的小心。
wchp
3.3.0版本中新增: 按照path 列出详细的服务器上的watches信息。输出的内容是paths (znodes)和相关sessions。
注意:在不同的watches的数量情况下,这个操作肯能很消耗性能,使用它要格外的小心。
mntr
3.4.0版本中新增:输出可以用来监控集群健康情况的一系列变量。输出的是能兼容Java属性文件的格式,而且内容可能会随时间而改变(比如增加新的变量)。

$ echo mntr | nc localhost 2185
zk_version 3.4.0
zk_avg_latency 0
zk_max_latency 0
zk_min_latency 0
zk_packets_received 70
zk_packets_sent 69
zk_outstanding_requests 0
zk_server_state leader
zk_znode_count 4
zk_watch_count 0
zk_ephemerals_count 0
zk_approximate_data_size 27
zk_followers 4 - 只有Leader 拥有的参数
zk_synced_followers 4 - 只有Leader 拥有的参数
zk_pending_syncs 0 - 只有Leader 拥有的参数
zk_open_file_descriptor_count 23 - 仅适用Unix平台
zk_max_file_descriptor_count 1024 - 仅适用Unix平台

2.taokeeper部署

1.下载

链接:https://github.com/alibaba/taokeeper/downloads

下载下图的 2.数据库,3.配置文件,4.代码

2. 环境准备

a、tomcat : 建议apache-tomcat-6.0.53  (刚开始用apache-tomcat-8.5.15,但是网页显示不全,子链接也加载不出来,后来降低版本就可以了,taokeeper 12年的东西啊)

b、mysql:笔者是mysql-community-server-5.7.18-1

c、zookeeper: 笔者是zookeeper-3.4.10

3.部署

mysql数据库初始化(导入taokeeper.sql)

tomcat安装、配置

  在 tomcat/bin/catalina.sh 中添加 JAVA_OPTS=-DconfigFilePath="/root/services/tomcat/webapps/taokeeper-monitor/config/taokeeper-monitor-config.properties"

taokeeper部署:

  将taokeeper-monitor.tar.gz解压到tomcat的webapps目录下(删除原有文件)。

  新建config(将taokeeper-monitor-config.properties拷贝到此),logs,ZookeeperStore目录,下图所示:

  

  修改配置文件taokeeper-monitor-config.properties 

  (主要是数据库连接,ssh连接zookeeper,附加日志设置) 

#Daily

systemInfo.envName=taokeeper

#DBCP
dbcp.driverClassName=com.mysql.jdbc.Driver
dbcp.dbJDBCUrl=jdbc:mysql://192.168.1.133:3306/taokeeper
dbcp.characterEncoding=GBK
dbcp.username=root
dbcp.password=
dbcp.maxActive=
dbcp.maxIdle=
dbcp.maxWait= #SystemConstant
SystemConstent.dataStoreBasePath=/root/services/tomcat/webapps/taokeeper-monitor/ZookeeperStore
SystemConstant.userNameOfSSH=root
SystemConstant.passwordOfSSH=
#Optional
SystemConstant.portOfSSH= #LOGBACK
LOG_HOME=/root/services/tomcat/webapps/taokeeper-monitor/logs
LOG_LEVEL=DEBUG
MAX_HISTORY_LOG_FILES=

4.启动tomcat

catalina.sh start

5.web浏览 http://localhost:8080/taokeeper-monitor/

6.web配置zookeeper在此不做介绍

看图参考:http://www.ithao123.cn/content-7333258.html

zookeeper监控之taokeeper的更多相关文章

  1. zookeeper 监控 —— 阿里taokeeper

    TaoKeeper是一个围绕ZooKeeper做的监控与报表系统. 主要功能如下: 能够统计ZK集群连接数,Watcher数目 ,节点数等系列信息,并按一定规则进行一些聚合操作; 能够通过设置一些阈值 ...

  2. zookeeper监控告警

    一.ZooKeeper简介 ZooKeeper作为分布式系统中重要的组件,目前在业界使用越来越广泛,ZooKeeper的使用场景非常多,以下是几种典型的应用场景: l  数据发布与订阅(配置中心) l ...

  3. ZooKeeper监控

    http://jm-blog.aliapp.com/?p=1450 在公司内部,有不少应用已经强依赖zookeeper,zookeeper的工作状态直接影响它们的正常工作.目前开源世界中暂没有一个比较 ...

  4. Zookeeper监控(Zabbix)

      一直在弄监控,这些个中间件Zookeeper.Kafka......,平时也只知道一点皮毛,也就搭建部署过,没有真正的用过,一般都是大数据的同学在用,作为运维人员我需要对他做一个监控,由于对他不是 ...

  5. Hadoop记录- zookeeper 监控指标

    目前zookeeper获取监控指标已知的有两种方式: 1.通过zookeeper自带的 four letter words command 获取各种各样的监控指标 2.通过JMX Client连接zo ...

  6. Zabbix实战-简易教程--中间件ZooKeeper监控

    一.监控思路 通过zabbix trapper方式监控,之前看到网友们都是通过定时任务进行主动上传数据,但是,zabbix还有另外一神器--自动发现,也能达到同样的功能. 二.实现步骤 1.准备脚本 ...

  7. Zookeeper监控平台

    JMX: 安装配置 1.修改zookeeper的启动脚本 vi  zkServer.sh 找到启动参数ZOOMAIN ​ 修改为下面值(修改一项,新增4项): -Dcom.sun.management ...

  8. Eclipse安装zookeeper监控插件

    1.在 Eclipse 菜单打开Help -> Install New Software…2.添加 url http://www.massedynamic.org/eclipse/updates ...

  9. 大数据软件安装之ZooKeeper监控

    一.ZooKeeper安装 官方文档: https://zookeeper.apache.org/doc/r3.5.5/zookeeperStarted.html 1.解压分发 [test@hadoo ...

随机推荐

  1. poj3463 Sightseeing——次短路计数

    题目:http://poj.org/problem?id=3463 次短路计数问题,在更新最短路的同时分类成比最短路短.长于最短路而短于次短路.比次短路长三种情况讨论一下,更新次短路: 然而其实不必被 ...

  2. Nginx的alias与root的用法区别和location匹配规则

    1.alias与root的用法区别 最基本的区别:alias指定的目录是准确的,root是指定目录的上级目录,并且该上级目录要含有location指定名称的同名目录. location /abc/ { ...

  3. 使用内存流导出Excel

    public MemoryStream MemoryStreamDeiveFlowInfoaging(DataTable Table) { Dictionary<int , string> ...

  4. SpringBoot2.0整合Redission

    Redisson是redis一个很强大的客户端,有兴趣的同学可以看我的下一篇文章,这篇主要讲如何整合,费话不多说,直接上干货(大牛请绕道) 首先创建RedissionConfig文件 import o ...

  5. 【BZOJ4566_洛谷3181】[HAOI2016]找相同字符(SAM)

    自己yy的方法yyyyyyyy着就A了,写篇博客庆祝一下. 题目: 洛谷3181 分析: SAM(可能是)模板题(不会SAM的同学戳我:[知识总结]后缀自动机的构建). 对\(s1\)建出SAM,用\ ...

  6. gerrit项目配置

    1. 相关约定说明: 1.1 gerrit服务器ip地址:192.168.130.10 1.2 gerrit服务器端用户名:gerrit 1.3 gerrit用户端管理员:admin 1.4 ssh端 ...

  7. Linux命令(004) -- watch

    对Linux系统的操作过程中,经常会遇到重复执行同一命令,以观察其结果变化的情况.惯用的方法是:上下键加回车,或是Ctr+p然后回车.今天我们来了解一下watch命令,它可以帮助我们周期性的执行一个命 ...

  8. [Windows Server 2003] 网页Gzip压缩

    ★ 欢迎来到[护卫神·V课堂],网站地址:http://v.huweishen.com★ 护卫神·V课堂 是护卫神旗下专业提供服务器教学视频的网站,每周更新视频.★ 本节我们将带领大家:启用网站GZI ...

  9. gtest ASSERT_TRUE和EXPECT_TRUE

    调用ASSERT_TRUE的函数,返回值类型定义必须是void,如果想返回别的类型,就用EXPECT_TRUE: void abc::fun() { ASSERT_TRUE(fun1()); } bo ...

  10. java设计模式03装饰者者模式

    动态地给一个对象添加一些额外的职责.就增加功能来说, Decorator模式相比生成子类更为灵活.该模式以对客 户端透明的方式扩展对象的功能. (1)在不影响其他对象的情况下,以动态.透明的方式给单个 ...