先给结论吧：HBase利用compaction机制，通过大量的读延迟毛刺和一定的写阻塞，来换取整体上的读取延迟的平稳。

1.为什么要compaction

在上一篇 HBase读写中我们提到了，HBase在读取过程中，会创建多个scanner去抓去数据。

其中，会创建多个storefilescanner去load HFile中的指定data block。所以，我们很容易就想到，如果说HFile太多的话，那么就会涉及到很多磁盘IO，这个就是常说的“读放大”现象。

因此，就有了今天的主题，HBase的核心特性——compaction。

通过执行compaction，可以使得HFile的数量基本稳定，使得IO seek次数稳定，然后每次的查询rt才能稳定在一定范围内。

2.compaction的分类

compaction分为两种，minor compaction和major compaction。

Minor compaction主要是将一些相邻的小文件合并为大文件，这个过程仅仅做文件的合并，并不会删除deleted type的数据和ttl过期的数据。

Major compaction是指将一个HStore下的所有文件合并为一个HFile，这个过程会消耗大量系统资源，一般线上会关闭自动定期major compaction的功能（将参数hbase.hregion.majorcompaction设为0即可关闭，但是flush的触发还是会进行），改为手动低峰执行。这个过程会删除三类数据：标记为删除的数据、TTL过期的数据、版本号不满足要求的数据。

具体什么时候触发哪种类型的compaction呢？

满足以下任意条件会触发major compaction，否则就是minor compaction：

用户强制执行major compaction
长时间没有compact，且候选文件小于阈值（hbase.hstore.compaction.max）
Store中含有reference文件（split产生的临时文件），需要通过 major compact进行数据迁移，删除临时文件

3.compaction的触发时机

compaction的触发时机一共有三种：

1）MemStore flush:

这个在一开始就提到了，相信也很容易理解。因为每次MemStore flush会产生新的HFile文件，而文件数量超过限制，自然就触发了compaction。这里需要注意的是，我们在深入HBase架构一文中已经提到，memstore是以region为单位进行flush的，也就是说，一个region内的任意一个HStore下面的memstore满了，这个region下的所有HStore的memstore都会触发flush。然后每个HStore都有可能触发compaction。

2）后台线程周期性检查

HBase有一个后台线程CompactionChecker，会定期巡检触发检查，是否进行compaction。

这里和flush触发的compaction有所不同，这里先检查文件树是否大于阈值，大于就触发compaction。如果没有大于阈值，还会检查下HFile里面的最早更新时间，是否早于某个阈值（hbase.hregion.majorcompaction），如果早于，就触发major compaction来达到清理无用数据的目的。

3）手动触发：

由于我们担心major compaction会影响业务，因此会选择业务低峰期进行手动触发。

还有一部分原因，是用户执行ddl后，希望理解生效，也会执行手动触发major compaction。

最后，可能是因为磁盘容量不够了，需要major compaction来手动清理无效数据，合并文件。

4.HFile合并过程

1）读取待合并的HFile的key value，写入临时文件中

2）将临时文件移动到对应的region的数据目录

3）将compaction的输入文件路径和输出文件路径写入WAL日志，然后强行执行sync

4）将对应region数据目录下的输入文件全部删除

5.compaction的副作用分析

当然，compaction本身也要涉及到大量文件的读写，在表现上就是会有一定的读延迟毛刺。因此，我们可以认为，compaction过程是使用短时间的大量IO消耗来换取后续查询的低延迟。

另一方面，假设处于长时间的高写入量，HFile的数量一直增长，compaction的速度赶不上HFile增长的速度，那么，HBase会暂时阻塞写请求。当每次memstore进行flush的时候，如果一个HStore中的HFile的数量超过了hbase.hstore.blockingStoreFIles（默认为7），那么就会暂时阻塞flush的动作，阻塞时间为abase.hstore.blockingWaitTime。当阻塞时间过去后，观察HFile的数量下降到上述值，那么就会继续flush的操作。这样，就保证了HFile数量的稳定，但是对写入会有一定的速度影响。

看到这里了，原创不易，点个关注、点个赞吧，你最好看了～

知识碎片重新梳理，构建Java知识图谱：https://github.com/saigu/JavaKnowledgeGraph（历史文章查阅非常方便）

扫码关注我的公众号“阿丸笔记”，第一时间获取最新更新。同时可以免费获取海量Java技术栈电子书、各个大厂面试题。

「从零单排HBase 04」HBase高性能查询揭秘的更多相关文章

「从零单排canal 04」启动模块deployer源码解析
基于1.1.5-alpha版本,具体源码笔记可以参考我的github:https://github.com/saigu/JavaKnowledgeGraph/tree/master/code_read ...
「从零单排canal 03」 canal源码分析大纲
在前面两篇中,我们从基本概念理解了canal是一个什么项目,能应用于什么场景,然后通过一个demo体验,有了基本的体感和认识. 从这一篇开始,我们将从源码入手,深入学习canal的实现方式.了解can ...
「从零单排canal 05」 server模块源码解析
基于1.1.5-alpha版本,具体源码笔记可以参考我的github:https://github.com/saigu/JavaKnowledgeGraph/tree/master/code_read ...
「从零单排canal 06」 instance模块源码解析
基于1.1.5-alpha版本,具体源码笔记可以参考我的github:https://github.com/saigu/JavaKnowledgeGraph/tree/master/code_read ...
「从零单排canal 07」 parser模块源码解析
基于1.1.5-alpha版本,具体源码笔记可以参考我的github:https://github.com/saigu/JavaKnowledgeGraph/tree/master/code_read ...
「从零单排canal 01」 canal 10分钟入门（基于1.1.4版本）
1.简介 canal [kə'næl],译意为水道/管道/沟渠,主要用途是基于 MySQL 数据库增量日志解析,提供增量数据订阅和消费.应该是阿里云DTS(Data Transfer Servi ...
「从零单排canal 02」canal集群版 + admin控制台最新搭建姿势（基于1.1.4版本）
canal [kə'næl],译意为水道/管道/沟渠,主要用途是基于 MySQL 数据库增量日志解析,提供增量数据订阅和消费.应该是阿里云DTS(Data Transfer Service)的开 ...
「从零单排HBase 12」HBase二级索引Phoenix使用与最佳实践
Phoenix是构建在HBase上的一个SQL层,能让我们用标准的JDBC APIs对HBase数据进行增删改查,构建二级索引.当然,开源产品嘛,自然需要注意“避坑”啦,阿丸会把使用方式和最佳实践都告 ...
「从零单排HBase 05」核心特性region split
HBase拥有出色的扩展性,其中最依赖的就是region的自动split机制. 1.split触发时机与策略前面我们已经知道了,数据写入过程中,需要先写memstore,然后memstore满了以后 ...

随机推荐

概率DP——BZOJ4008 [HNOI2015]亚瑟王
[HNOI2015]亚瑟王 Description 小 K 不慎被 LL 邪教洗脑了,洗脑程度深到他甚至想要从亚瑟王邪教中脱坑.他决定,在脱坑之前,最后再来打一盘亚瑟王.既然是最后一战,就一定要打得漂 ...
AttributeError: 'bytes' object has no attribute 'hex'
python3.5之前bytes数据没有hex()属性需要使用 ''.join(map(lambda x:('' if len(hex(x))>=4 else '/x0')+hex(x)[2: ...
made his acquaintance|adequate|advisable|announce|contrived to|made up|toss|considering that
PHRASE 与(某人)初次相识;结识(某人)When you make someone's acquaintance, you meet them for the first time and ge ...
LeetCode Day 12
LeetCode0024 给定一个链表,两两交换其中相邻的节点,并返回交换后的链表. 你不能只是单纯的改变节点内部的值,而是需要实际的进行节点交换. 示例: 给定 1->2->3-> ...
C# 内置的类型转换方法
C# 提供了下列内置的类型转换方法: 序号方法 & 描述 1 ToBoolean把类型转换为布尔型. 2 ToByte把类型转换为字节类型. 3 ToChar如果可能的话,把类型转换为单个 ...
HttpClient GET和POST请求
package com.rogue.hclient; import java.io.BufferedReader; import java.io.IOException; import java.io ...
虚拟网卡 TUN/TAP 驱动程序设计原理（经典）
盗用-收藏简介虚拟网卡Tun/tap驱动是一个开源项目,支持很多的类UNIX平台,OpenVPN和Vtun都是基于它实现隧道包封装.本文将介绍tun/tap驱动的使用并分析虚拟网卡tun/tap驱 ...
caffe之数据集介绍
数据集:http://bigdata.51cto.com/art/201702/531276.htm 计算机视觉 MNIST: 最通用的健全检查.25x25 的数据集,中心化,B&W 手写数字 ...
vue watch和computed的使用场景
watch 监听某个数据的变化(监听完调用什么函数) 一个数据影响多个数据 (比如:浏览器自适应.监控路由对象.监控自身属性变化) computed 计算后返回新一个数据受多个数据影响(比如:计算总 ...
linux查看端口号占用命令-netstat
题记经常会发现,很多时候我们在运行一些带有端口的程序时,程序经常会报端口被占用的问题,比如Tomcat 8080,端口起不来. 查看端口号 netstat 如果发现某个端口被占用后,可以用命令查看, ...

「从零单排HBase 04」HBase高性能查询揭秘