Hbase 元数据一致性检查(转)
最近在学习HBase先关的知识,顺便做一下笔记,以加深知识的了解和掌握。
Hbase常用工具
文件检测修复工具
hbase hbck -help
常用选项:
-details 显示所有region检查的完整报告
-summary 输出表和状态的总结信息
-metaonly 只检查-ROOT-和.META.表
-fixAssignments 用于修复Region分配错误
-fixMeta 用于修复.META.表的问题(前提是HDFS上的region信息是正确的)
-fixHdfsHoles 修复RegionHoles问题
-fixHdfsOrphans 修复Orphan Region(HDFS上没有.regioninfo的Region)
-fixHdfsOverlaps 修复Region区间重叠的问题
-fixVersionFile 修复缺失hbase.version文件问题
快速修复元数据选项
-repair 相当于-fixAssignments -fixMeta -fixHdfsHoles -fixHdfsOrphans -fixHdfsOverlaps -fixVersionFile -sidelineBigOverlaps
-repairHoles 相当于-fixAssignments -fixMeta -fixHdfsHoles -fixHdfsOrphans
检测Hbase集群是否有文件损坏
hbase hbck
hbase hbck -details
快速修复元数据损坏
使用快速修复元数据选项是解决不一致问题风险最低的一种方法
hbase hbck -repair
hbase hbck -repairHoles
修复Region叠加的问题(风险系数高)
hbase hbck -fixHdfsOrphans
#合并region的时候,一次最大合并3个
hbase hbck -fixHdfsOverlaps -maxMerge 3
hbase hbck -fixHdfsOverlaps -sidelineBigOverlaps
#一组中最多允许4个region不参与
hbase hbck -fixHdfsOverlaps -maxOverlapsToSideline 4
修复.META.表没有正确分配
hbase hbck -fixMetaOnly -fixAssignments
修复版本(hbase.version)丢失的问题
hbase hbck -fixMetaOnly -fixVersionFile
修复-ROOT-和.META.表损坏
当-ROOT-和.META.表损坏的时候,HBase将启动失败,这种情况下要使用OFFlineMetaRepair工具创建新的-ROOT-和.META.表。该工具的工作原理是找到HBase在HDFS的主目录,加载Region的元数据文件信息,然后重新创建新的-ROOT-和.META.表,命令如下:
hbase org.apache.hadoop.hbase.util.OffileMetaRepair
hfile文件查看
hbase hfile -v -p -f hiflepath/hiflename
WAL日志查看
hbase hlog -j hlogpath/hlogfilename
数据迁移工具
CopyTable 用于在同集群内部或者集群之间复制表的部分或者全部数据的工具
export 可以将表的内容导出成HDFS的序列化文件
import 可以加载导出数据回HBase
WALPlayer 日志回放工具,可以重放WAL文件到HBase
Region和RegionServer的管理
major_compact一般会对IO有比较大的影响,因此一般禁用线上系统的自动大合并(配置文件中hbase.hregion.majorcompaction设为0),而采用脚步触发的方式来进行合并
major_compact可以对表、region、列族等进行合并,常用的是对表和对表的单个region进行大合并,命令如下:
对表进行大合并
major_compact 'tablename'
对表的单个region进行大合并
major_compact 'regionname' #tablename
下线regionServer节点
balance_switch false
cd /data/hbaseadmin/hbaseenv/hbase/bin; ./hbase-daemon.sh stop regionserver
RegionServer会关闭该server上所有的region,然后关闭自身的进程,在停止过程中,RegionServer会向ZK报告说自己已经过期。master会发现RegionServer已经死掉,会把它当作崩溃的节点来处理,然后会将Region分配到其他的节点上。
下线节点后再开始负载均衡
balance_switch true
优雅地下线RegionServer节点
当RegionServer下线的时候,Region按顺序被关闭,如果一个RegionServer上有很多Region,从第一个Region下线,到最后一个Region关闭,并且Master认为其死掉了,该Region才可以上线,整个过程要花很长的时间。HBase 0.90.2中加入了一个graceful_stop的功能,该功能可以让节点逐渐降低其负载,直到最后关闭。
优雅下线1台RegionSever的命令为:
graceful_stop RegionServer_HOSTNAME
graceful_stop做的工作是逐个地讲Region从RegionServer中移除,先移除一个Region,然后将这个Region安置到一个新的地方,再移除下一个,直到Region被全部移除。最后关闭RegionServer。
滚动重启
for i in `cat conf/regionservers | sort`;do graceful_stop.sh --restart --reload --debug $i;done & > /tmp/log.txt &
滚动重启,并解决本地化问题
1、运行hbck确保一致性
hbase hbck
2、重启master
cd /data/hbaseadmin/hbaseenv/hbase/bin && ./hbase-daemon.sh stop master
./hbase-daemon.sh start master
3、关闭负载均衡器
echo "balance_switch false" | hbase shell
4、滚动重启RegionServer
for i in `cat conf/regionservers | sort`;do graceful_stop.sh --restart --reload --debug $i;done & > /tmp/log.txt &
5、再次重启Master
cd /data/hbaseadmin/hbaseenv/hbase/bin && ./hbase-daemon.sh stop master
./hbase-daemon.sh start master
6、开启负载均衡器
echo "balance_switch true" | hbase shell
7、运行hbck确保数据一致
hbase hbck
作者:飞鸿无痕
链接:https://www.jianshu.com/p/d34d633460fe
Hbase 元数据一致性检查(转)的更多相关文章
- SQL Server 2008 安装过程中遇到“性能计数器注册表配置单元一致性”检查失败 问题的解决方法
操作步骤: 1. 在 Microsoft Windows 2003 或 Windows XP 桌面上,依次单击"开始"."运行",然后在"打开&quo ...
- pt-table-checksum 主从复制一致性检查
1. pt-table-checksum介绍 http://www.percona.com/doc/percona-toolkit/2.2/pt-table-checksum.html pt-tabl ...
- 供应类型与计划分类一致性检查(PO)
应用 Oracle Purchasing 层 Level Function 函数名 Funcgtion Name CUXPOIMM 表单名 Form Name CUXPOIMM 说明 Descri ...
- 供应类型与计划分类一致性检查(INV)
应用 Oracle Inventory 层 Level Function 函数名 Funcgtion Name CUXINVIMM 表单名 Form Name CUXINVIMM 说明 Descrip ...
- FC 与 FB 与 OB 的区别,时间标记冲突与一致性检查 有详细的步骤
关键字1 组织块的程序是由用户自己编写. 关键字2 时间标记冲突与一致性检查 有详细的步骤. 关键字3 FC 与 FB 与 OB 的区别? (一)功能 功能块 区别 ? FB 和FC均为 用户编写 ...
- mysql 主从一致性检查
我上一次遇到MySQL主从服务器数据一致性问题,想想是几年前的事情了,还依稀记得当时惊慌失措的情景,好在最后借助Maatkit解决了问题.几年后,当我再次面对同样的问题时,Maatkit已经不复存在, ...
- TIKV副本一致性检查机制分析
背景 TIKV使用raft协议来实现副本同步,任何时刻写入一个KEY-VAL键值对,都会基于RAFT协议复制到不同机器的三个副本上,raft协议本身能保证副本同步的强一致性,但是任何系统都可能存在BU ...
- pt工具主从一致性检查并修复以及版本3.0.4的版本缺点
pt-table-checksum和pt-table-sync分别检验master-slave的数据不一致并修复. 1.本次测试环境 [root@172-16-3-190 we_ops_admin]# ...
- git fsck -- 一致性检查
格式: git fsck [选项] <path> 选项 git commit -a 提交所有改动的文件(a -- all) git commit -m 提交说明(m ...
随机推荐
- 【原】Java学习笔记008 - 方法(函数)
package cn.temptation; public class Sample01 { public static void main(String[] args) { // 方法/函数 Met ...
- Go语言学习笔记-函数部分(三)
函数部分 函数基本组成:关键字func.函数名.参数列表.返回值.函数体.返回语句 例子: func Add(int a, int b) (return int, err error){ ....函数 ...
- redis快照持久化和aof日志持久化
持久化就是即使断电/重启需要存储的数据不会丢失,即将数据存储在设备中,一般存在硬盘内 redis的持久化有2种方式 :1-rdb快照 2-aof日志,可以通过配置redis.conf文件进行配置 r ...
- 关于idea在运行web项目时部署的位置
(转) 以前一直很好奇,在idea中运行tomcat,把项目部署到其中,运行起来,然后我去tomcat目录下去看,根本找不到我部署的项目 那我的项目是咋运行的啊… - - 后来我就查啊查 ,纠结啊纠结 ...
- dispatch_barrier_async--屏障是一个同步点
Discussion Calls to this function always return immediately after the block has been submitted and n ...
- 基于Armitage的MSF自动化集成攻击实践
基于Armitage的MSF自动化集成攻击实践 目录 0x01 实践环境 0x02 预备知识 0x03 Armitage基础配置 0x04 Nmap:Armitage下信息搜集与漏洞扫描 0x05 A ...
- 手把手教你发布一个Python包
本文主题如下: 编写一个包(Python 源代码),但不是本文的重点. 编译包,观察编译后的文件. 发布包,发布的包可以有多种类型. 如何在 Pypi 中查看已发布的包 注意: 本文编写的包在 Pyt ...
- MySQL与MongoDB
MySQL MongoDB DB DB table Collections row Documents column Field 增 db.tables.insert({})#效 ...
- Java 如何存取MySQL datetime类型
1 在java中只有Date类型,这样数据存储到MySQL会出现问题,前台提交的数据,比如2018-03-20 17:30:59,后台用Date接受的时候,由于Date只精确到天,所以默认接收时间为2 ...
- SSM项目使用GoEasy 实现web消息推送服务
一.背景 之前项目需要做一个推送功能,最开始我用websocket实现我的功能.使用websocket的好处是免费自主开发,但是有几个问题:1)浏览器的兼容问题,尤其是低版本的ie:2)因为是推送 ...