HBase原理和架构

HBase是什么

HBase在生态体系中的位置

HBase vs HDFS

HBase表的特点

HBase是真正的分布式存储，存储级别达到TB级别，而才传统数据库就不是真正的分布式了，传统数据库在底层，虽然的存储能力很强，一旦达到上亿条数据。读取性能下降得很快。

传统数据库按行存储，如果列过多的话，一行数据会非常大，HBase按列簇存储，每个列簇都存储一个文件，如果只读取某一些字段的话，只需读取对应的文件就可以了，其他的不用扫描，节省了IO。

HBase的存储每一行的内容可以不同，空出来的列不占用空间。

多版本，怎么理解呢，就比如说相同id的行重新插入数据不会覆盖掉，而是按照插入的时间戳分类。

行存储和列存储

02 HBase数据模型

HBase逻辑视图

Rowkey和Column Family

HBase数据模型

HBase支持的操作

03 HBase物理模型

传统数据库和HBase的存储的不同

物理存储

Table vs Region

04 HBase系统架构

架构图

HBase基本组件

HBase工作流程

Hbase Write-Ahead-Log（预先写日志）

Regionserver结构

HBase Compact && Split

HLog Replay

Hfile存储格式

Hfile存储格式(续)

Keyvalue格式

Hlog存储格式

HLog存储格式(续)

HBase高可用

HBase容错性

Region定位

先访问zookeeper,找到root表的位置，root表记录了meta表的位置，在meta表里面查找对应的rowkey查找所在的region,并获取用户region的位置

-ROOT-和.META.表结构

如果是root表，表名就是.meta。如果是meta表，表名就是用户的id 订单等等。

-ROOT-表和.META

Hbase 读流程

Client客户端先找到zookeeper拿到meta表，meta表根据rowkey拿到相应的region信息，找到对应的regionsever

1.memstore是写缓存，blockcache是读缓存。

2.读数据的时候先到写缓存memstore去读，这样能提高读的效率，当memstore没有了，才到读缓存blockcache读数据。如果上面两个缓存（属于内存）都没有的情况下，就到磁盘去读。

3.在读到磁盘的时候去查找相应的数据，在没找到之前把前面的hfile放到blockcache读缓存里面，因为blockcache的空间也是有限的，如果blockcache读满了还没有找到需要查询的数据，blockcache就会淘汰一部分数据。

HBase put写流程

Hbase VS 关系型数据库

Hbase VS Hive

HBase原理和架构的更多相关文章

HBase的基本架构及其原理介绍
1.概述:最近,有一些工程师问我有关HBase的基本架构的问题,其实这个问题仅仅说架构是非常简单,但是需要理解.在这里,我觉得可以用HDFS的架构作为借鉴.(其实像Hadoop生态系统中的大部分组建的 ...
Zookeeper概论（对zookeeper的概论、原理、架构等的理解）
Zookeeper概论(对zookeeper的概论.原理.架构等的理解) 一.概论 Zookeeper是一个分布式的.开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是h ...
【转】HBase原理和设计
简介 HBase —— Hadoop Database的简称,Google BigTable的另一种开源实现方式,从问世之初,就为了解决用大量廉价的机器高速存取海量数据.实现数据分布式存储提供可靠的方 ...
Hbase原理
Hbase原理概述 HBase是一个构建在HDFS上的分布式列存储系统:HBase是基于Google BigTable模型开发的,典型的key/value系统:HBase是Apache Hadoop ...
HBase原理和设计
转载 2016年1月10日:http://www.sysdb.cn/index.php/2016/01/10/hbase_principle/ 简介架构数据组织原理 RS定位 region写入 ...
HBase原理、设计与优化实践
转自:http://www.open-open.com/lib/view/open1449891885004.html 1.HBase 简介 HBase —— Hadoop Database的简称,G ...
大数据技术之_11_HBase学习_01_HBase 简介+HBase 安装+HBase Shell 操作+HBase 数据结构+HBase 原理
第1章 HBase 简介1.1 什么是 HBase1.2 HBase 特点1.3 HBase 架构1.3 HBase 中的角色1.3.1 HMaster1.3.2 RegionServer1.3.3 ...
HBase之一：HBase原理和设计
一.简介 HBase —— Hadoop Database的简称,Google BigTable的另一种开源实现方式,从问世之初,就为了解决用大量廉价的机器高速存取海量数据.实现数据分布式存储提供可靠 ...
1、Hbase原理分析
一.Hbase介绍 1.1.对Hbase的认识 HBase作为面向列的数据库运行在HDFS之上,HDFS缺乏随机读写操作,HBase正是为此而出现. HBase参考 Google 的 Bigtable ...

随机推荐

【转】ImageView.ScaleType属性
原文网址:https://blog.csdn.net/Buaaroid/article/details/49360779 ImageView的Scaletype决定了图片在View上显示时的样子,如进 ...
MySQL 5.7新特性之在线收缩undo表空间
1. MySQL 5.5时代的undo log 在MySQL5.5以及之前,大家会发现随着数据库上线时间越来越长,ibdata1文件(即InnoDB的共享表空间,或者系统表空间)会越来越大,这会造成2 ...
webpack 4 学习资料
webpack 4 学习资料资料网址 webpack 中文版 https://webpack.docschina.org/configuration/ webpack 4 教程 https://s ...
解决 Sublime text3 中文显示乱码问题【亲测可用】
一.安装包管理器使用Ctrl+`快捷键或者通过View->Show Console菜单打开命令行,粘贴如下代码 import urllib.request,os; pf = 'Packag ...
MySQL数据库分区操作【RANGE】
客服平台,线上查询存在性能问题,为了解决或者说是缓解这个问题,除了加必要的索引,另外就是将表进行分区. 这里主要是针对既有的表进行分区,采用的是alter table xxx的方式,当然,也可以采用c ...
100M双绞线接头的标准接法
双绞线接头(RJ45)针脚号码定义
[蓝桥杯]ALGO-92.算法训练_前缀表达式
问题描述编写一个程序,以字符串方式输入一个前缀表达式,然后计算它的值.输入格式为:“运算符对象1 对象2”,其中,运算符为“+”(加法).“-”(减法).“*”(乘法)或“/”(除法),运算对象为 ...
编码知识梳理(UTF-8, Unicode, GBK, X509, ANSI, VIM中编码)
编码小结 1 初识编码所谓编码,是信息从一种形式或格式转换为另一种形式的过程. 字符编码,从自然语言的字符的一个集合(如字母表或音节表),到其他东西的一个集合(如号码或电脉冲)的映射 ANSI:wi ...
ubuntu16.04 彻底卸载MySQL
以MySQL- 5.7.18为例: sudo apt-get autoremove --purge mysql-server-5.7 #sudo apt-get remove mysql-server ...
whith ~ as 用法
个人理解 with self.client.get("/", catch_response=True) as response: 其实就是 response = self.clie ...

HBase原理和架构

HBase原理和架构的更多相关文章

随机推荐

热门专题