HBase架构设计

2024-08-28 00:49:07 原文

一.Client

　　包含访问HBase的接口并维护cache来加快对HBase的访问。

二.Zookeeper

　　1.保证任何时候，集群中只有一个master。

　　2.存储所有Region的寻址入口。

　　3.实时监控Region server的上线和下线信息，并实时通知Master。

　　4.存储HBase的schema和table元数据。

三.Master

　　1.为Region server分配region。

　　2.负责Region server的负载均衡。

　　3.发现失效的Region server并重新分配其上的region。

　　4.管理用户对table的增删改操作。

四.Region Server

　　1.Region server维护region，处理对这些region的I/O请求。

　　2.Region server负责切分在运行过程中变得过大的region。

五.Region

　　1.HBase自动把表水平划分成多个区域【region】，每个region会保存一个表里面某段连续的数据。

　　2.每个表一开始只有一个region，随着数据不断插入表，region不断增大，当增大到一个阈值大的时候，region就会等分为两个新的region【裂变】。

　　3.当table的行不断增多，就会有越来越多的region。这样一张完整的表被保存在多个Region server上。

六.Memstore与storefile

　　1.一个region由多个store组成，一个store对应一个cf【列族】。

　　2.store包括位于内存中的memstore和位于磁盘的storefile，写操作先写入memstore，当memstore中的数据达到某个阈值，hregionserver会启动flashcache进程写入storefile，每次写入形成一个单独的storefile。

　　3.当storefile文件的数量增长到一定阈值后，系统会进行合并【minor compaction：相邻两个小文件之间合并，不影响HBase提供服务。major compaction：在合并过程中会进行版本合并和删除操作，影响HBase提供服务】，形成更大的storefile。

　　4.当一个region所有storefile的大小和数量超过一定阈值后，会把当前的region分割为两个，并由hmaster随机分配到相应的regionserver服务器，实现负载均衡。

　　5.客户端检索数据，先在memstore中找，找不到再去storefile中找。

备注：

　　1.HRegion是HBase中分布式存储和负载均衡的最小单位。HRegion可以分布在不同的HRegion server上。

　　2.HRegion由一个或多个store组成，每个store保存一个列族。

　　3.每个store又有一个memStore和0到多个storeFile组成。

　　

HBase架构设计的更多相关文章

Solr与HBase架构设计
摘要:本篇是本人在做一个大数据项目时,对于系统架构的一点总结,如何在保证存储量的情况下,又能保证数据的检索速度. 前提: Solr.SolrCloud提供了一整套的数据检索方案,HBase提 ...
【大数据技术】HBase与Solr系统架构设计
如何在保证存储量的情况下,又能保证数据的检索速度. HBase提供了完善的海量数据存储机制,Solr.SolrCloud提供了一整套的数据检索方案. 使用HBase搭建结构数据存储云,用来存储海量数据 ...
HBase的架构设计为什么这么厉害!
老刘是一名即将找工作的研二学生,写博客一方面是复习总结大数据开发的知识点,一方面是希望能够帮助和自己一样自学编程的伙伴.由于老刘是自学大数据开发,博客中肯定会存在一些不足,还希望大家能够批评指正,让我 ...
【转】Flume(NG)架构设计要点及配置实践
Flume(NG)架构设计要点及配置实践 Flume NG是一个分布式.可靠.可用的系统,它能够将不同数据源的海量日志数据进行高效收集.聚合.移动,最后存储到一个中心化数据存储系统中.由原来的Fl ...
HBASE架构解析(二)
http://www.blogjava.net/DLevin/archive/2015/08/22/426950.html HBase读的实现通过前文的描述,我们知道在HBase写时,相同Cell( ...
HBASE架构解析(一)
http://www.blogjava.net/DLevin/archive/2015/08/22/426877.html 前记公司内部使用的是MapR版本的Hadoop生态系统,因而从MapR的官 ...
两年内从零到每月十亿 PV 的发展来谈 Pinterest 的架构设计（转）
原文:Scaling Pinterest - From 0 To 10s Of Billions Of Page Views A Month In Two Years 译文:两年内从零到每月十亿 PV ...
MySQL性能调优与架构设计-架构篇
架构篇(1) 读书笔记 1.Scale(扩展):从数据库来看,就是让数据库能够提供更强的服务能力 ScaleOut: 是通过增加处理节点的方式来提高整体处理能力 ScaleUp: 是通过增加当前处理节 ...
基于Hadoop的大数据平台实施记——整体架构设计[转]
http://blog.csdn.net/jacktan/article/details/9200979 大数据的热度在持续的升温,继云计算之后大数据成为又一大众所追捧的新星.我们暂不去讨论大数据到底 ...

随机推荐

使用ANNdotNET进行情感分析
2018年10月的MSDN杂志上发表了由James McCaffrey撰写的文章“使用CNTK的情感分析” .在这篇博文中,我将向您介绍这篇非常好且写得很好的MSDN文章示例.我不打算重复MSDN文章 ...
华为机试001：字符串最后一个单词的长度(华为OJ001)
华为机试字符串最后一个单词的长度计算字符串最后一个单词的长度,单词以空格隔开. 提交网址: http://www.nowcoder.com/practice/8c949ea5f36f422594b ...
使用Eclipse创建SpringBoot项目
1 首先我们需要安装STS插件:Help--> Eclipse Marketplace 安装成功之后,会让你重启eclipse. 2 然后 File-->New--->Proje ...
【JAVA集合框架一】java集合框架官方介绍 Collections Framework Overview 集合框架总览翻译 javase8 集合官方文档中文版
原文链接: https://docs.oracle.com/javase/8/docs/technotes/guides/collections/overview.html 原文内容也一并附加在本文最 ...
Spring Boot （三）模板引擎FreeMarker集成
一.FreeMaker介绍 FreeMarker是一款免费的Java模板引擎,是一种基于模板和数据生成文本(HMLT.电子邮件.配置文件.源代码等)的工具,它不是面向最终用户的,而是一款程序员使用的组 ...
SOAP报文转成JAVA对象
在今天以前我还没有用过代码解析过SOAP报文,更别提转成JAVA对象了,今天的任务中报文这个模样的,(为防止数据信息,以下数据我故意打乱了防止泄露什么信息.) <?xml version=&qu ...
tcp_wrapper过滤
1.1 wrap简介 wrap工作在内核空间和应用程序中间的库层次中.在内核接受到数据包准备传送到用户空间时都会经过库层次,对于部分(只是部分)应用程序会在经过库层次时会被wrap库文件阻挡下来检查一 ...
Perl的do语句块结构
do语句块结构如下: do {...} do语句块像是匿名子程序一样,没有名称,给定一个语句块,直接执行.且和子程序一样,do语句块的返回值都是最后一个执行的语句的返回值. 例如,将使用if-elsi ...
Perl一行式：字段处理和计算
perl一行式程序系列文章:Perl一行式获取每行最后一个字段 $ perl -alne 'print $F[$#F]' file.log 这里涉及到了选项"-a".数组@F.这 ...
基于SpringMVC+Spring+MyBatis实现秒杀系统【客户端交互】
前言该篇主要实现客户端和服务的交互.在第一篇概况里我已经贴出了业务场景的交互图片. 客户端交互主要放在seckill.js里来实现.页面展现基于jsp+jstl来实现. 准备工作 1.配置web.x ...