zookeeper logs and snapshot
来自:http://xstarcd.github.io/wiki/Cloud/zookeeper_log_snapshot.html
事务日志可视化转换
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
|
#!/bin/sh # scriptname: zkLog2txt.sh # zookeeper事务日志为二进制格式,使用LogFormatter方法转换为可阅读的日志 if [ -z "$1" -o "$1" = "-h" ]; then echo "Useage: $0 <LogFile> [zkDir]" echo "eg: $0 /opt/zpdata/version-2/log .3000002c7 /opt/zookeeper \\ | grep '^7/24/13' | grep -A 10 -B 10 GAEI_AF_NotifyServer| more " exit 0 fi #LogFile=/dfs/zpdata/version-2/log.100000001 LogFile=$1 zkDir=$2 [ -z "$zkDir" ] && zkDir= /opt/zookeeper [ ! -f "$LogFile" ] && echo "LogFile:$LogFile not exist!" && exit 1 [ ! -d "$zkDir" ] && echo "zkDir:$zkDir not exist!" && exit 1 [ ! -d "$zkDir/lib" ] && echo "zkDir:$zkDir/lib not exist!" && exit 1 #java -cp $zkDir/zookeeper.jar:$zkDir/lib/slf4j-api-1.6.1.jar:$zkDir/lib/slf4j-log4j12-1.6.1.jar:$zkDir/lib/log4j-1.2.15.jar \ #org.apache.zookeeper.server.LogFormatter "$LogFile" JAVA_OPTS= "$JAVA_OPTS -Djava.ext.dirs=$zkDir:$zkDir/lib" java $JAVA_OPTS org.apache.zookeeper.server.LogFormatter "$LogFile" |
查看zookeeper日志的方法:在zookeeper主机上执行 zkLog2txt.sh <zk日志文件>,如下:
1
|
zkLog2txt.sh /hadoop/zookeeper/version-2/log .a00000001 /opt/zookeeper | more |
日志及快照清理
zookeeper主要存放了两类文件,一个是snapshot和log,前者是内存数的快照,后者类似mysql的binlog,将所有与修改数据相关的操作记录在log中,两类文件的目录可在配置文件中指定。
- 参考:
- ZooKeepr日志清理: http://blog.csdn.net/xiaolang85/article/details/21184293
- zookeeper 存储之文件格式分析: http://blog.csdn.net/pwlazy/article/details/8080626
正常运行过程中,ZK会不断地把快照数据和事务日志输出到这两个目录,并且如果没有人为操作的话,ZK自己是不会清理这些文件的,需要管理员来清理,这里介绍4种清理日志的方法。在这4种方法中,推荐使用第一种方法,对于运维人员来说,将日志清理工作独立出来,便于统一管理也更可控。毕竟zk自带的一些工具并不怎么给力,这里是社区反映的两个问题:
- https://issues.apache.org/jira/browse/ZOOKEEPER-957
- http://zookeeper-user.578899.n2.nabble.com/PurgeTxnLog-td6304244.html
文件删除脚本
第一种,也是运维人员最常用的,写一个删除日志脚本,每天定时执行即可:
1
2
3
4
5
6
7
8
9
10
11
12
13
|
#!/bin/bash #snapshot file dir dataDir= /home/yinshi .nc /test/zk_data/version-2 #tran log dir dataLogDir= /home/yinshi .nc /test/zk_log/version-2 #zk log dir logDir= /home/yinshi .nc /test/logs #Leave 66 files count=66 count=$[$count+1] ls -t $dataLogDir /log .* | tail -n +$count | xargs rm -f ls -t $dataDir /snapshot .* | tail -n +$count | xargs rm -f ls -t $logDir /zookeeper .log.* | tail -n +$count | xargs rm -f |
以上这个脚本定义了删除对应两个目录中的文件,保留最新的66个文件,可以将他写到crontab中,设置为每天凌晨2点执行一次就可以了。
zkPurgeTxnLog工具
第二种,使用ZK的工具类PurgeTxnLog,它的实现了一种简单的历史文件清理策略,可以在这里看一下他的使用方法:http://zookeeper.apache.org/doc/r3.4.3/api/index.html
可以指定要清理的目录和需要保留的文件数目,简单使用如下:
1
2
|
java - cp zookeeper.jar:lib /slf4j-api-1 .6.1.jar:lib /slf4j-log4j12-1 .6.1.jar:lib /log4j-1 .2.15.jar:conf \ org.apache.zookeeper.server.PurgeTxnLog <dataDir> <snapDir> -n <count> |
zkCleanup.sh
第三种,对于上面这个Java类的执行,ZK自己已经写好了脚本,在bin/zkCleanup.sh中,所以直接使用这个脚本也是可以执行清理工作的。
1
|
/usr/lib/zookeeper/bin/zkCleanup .sh /hadoop/zookeeper/version-2/ 5 |
自动清理配置项
第四种,从3.4.0开始,zookeeper提供了自动清理snapshot和事务日志的功能,通过配置 autopurge.snapRetainCount
和 autopurge.purgeInterval
这两个参数能够实现定时清理了。这两个参数都是在zoo.cfg中配置的:
1
2
3
4
5
|
# 指定清理频率,单位是小时,默认是0,表示不开启自己清理功能。 autopurge.purgeInterval=6 # 和上面的参数搭配使用,指定需要保留的文件数目,默认是保留3个。 autopurge.snapRetainCount=5 |
zookeeper logs and snapshot的更多相关文章
- zookeeper logs is missing zookeeper 日志丢失
ERROR [main:QuorumPeerMain@85] - Invalid config, exiting abnormally Invalid config, exiting abnormal ...
- solrCloud+tomcat+zookeeper集群配置
solrcolud安装solrCloud+tomcat+zookeeper部署 转载请出自出处:http://eksliang.iteye.com/blog/2107002 http://eksli ...
- zookeeper多节点配置
单机多节点模式 zookeeper解压, 放到 /opt/zookeeper/ 下, 同目录再放一个 server1目录, 下面建data和log两个目录用于存放数据和日志 zoo.cfg [milt ...
- centos下安装ZooKeeper
1.需求 安装ZooKeeper,metaQ 2.下载 http://zookeeper.apache.org/releases.html 当前stable版是zookeeper-3.4.6 3.解压 ...
- Zookeeper 安装和配置
单机模式 下载zookeeper的安装包之后, 解压到合适目录. 进入zookeeper目录下的conf子目录, 创建zoo.cfg: tickTime=2000 dataDir=/Users/app ...
- ZooKeeper 学习笔记
ZooKeeper学习笔记 1. zookeeper基本概念 zookeeper是一个分布式的,开放源码的分布式应用程序协调服务,是hadoop和Habase的重要组件,是为分布式应用提供一致性服 ...
- Zookeeper + Kafka 集群搭建
第一步:准备 1. 操作系统 CentOS-7-x86_64-Everything-1511 2. 安装包 kafka_2.12-0.10.2.0.tgz zookeeper-3.4.9.tar.gz ...
- SolrCloud(一)搭建Zookeeper
搭建Zookeeper 三台服务器: AMouse: 192.168.3.201 BCattle : 192.168.3.202 Ctiger : 192.168.3.203 一 下载Zookee ...
- Download and Install Apache Zookeeper on Ubuntu
http://www.techburps.com/misc/download-and-install-apache-zookeepr/36 In previous article of this Bi ...
随机推荐
- pytest七:assert
断言是写自动化测试基本最重要的一步,一个用例没有断言,就失去了自动化测试的意义了.什么是断言呢?简单来讲就是实际结果和期望结果去对比,符合预期那就测试 pass,不符合预期那就测试 failed py ...
- ECMAscript5 新增数组内函数
indexOf() 格式:数组.indexOf(item, start) 功能:从start这个下标开始,查找item在数组中的第一次出现的下标. 参数:item 我们要去查找的元素 start从哪个 ...
- Spring3.X jdk8 java.lang.IllegalArgumentException
异常提示: javax.servlet.ServletException: Servlet.init() for servlet springMVC threw exception org.apach ...
- javah命令的使用
背景 java开发中如果使用到JNI,则难免需要使用javah来生成C++或C的头文件信息,下面小编就直接说说javah的命令: 第一种:直接cd到当前程序的target/class目录下(maven ...
- window.jQuery || document...
window是浏览器端的全部数据变量的引用.比如 window.window === window window.jQuery 就是浏览器中的全局变量里的jQuery那为什么不写 jQuery 而是写 ...
- 【noip模拟赛4】Matrix67的派对 dfs
描述 Matrix67发现身高接近的人似乎更合得来.Matrix67举办的派对共有N(1<=N<=10)个人参加,Matrix67需要把他们安排在圆桌上.Matrix67的安排原则是,圆桌 ...
- turbo boost - 睿频加速
turbo boost就是英特尔睿频加速技术 英特尔睿频加速技术是英特尔酷睿 i7/i5 处理器的独有特性,也是英特尔新宣布的一项技术.这项技术可以理解为自动超频.当开启睿频加速之后,CPU会根据当前 ...
- C++ 冒泡排序、选择排序、快速排序
#include<stdio.h> #define N 10 void swap(int *p1, int *p2); void BubbleSort(int *a); void Sele ...
- [转]使用python来操作redis用法详解
转自:使用python来操作redis用法详解 class CommRedisBase(): def __init__(self): REDIS_CONF = {} connection_pool = ...
- 全排列-hdu1716
题目描述: 题目意思很简单,就是要我们输出全排列后的数据组成,但是要注意组成的数据是一个实数,并且千位数字相同的处在同一行中. 代码实现: #include<stdio.h> #inclu ...