HBASE概念:

  HBASE是一个分布式架构的数据库,通过对数据进行多层的分块打散储存。从而改写传统数据库的储存能力和读取速度。

HBASE的集群服务器:

  HBASE的集群主要分为Zookeeper集群,Master集群,RegionSever集群。

    Zookeeper集群:储存Table的Region地址,管理Master和RegionSever服务器间的操作。

    Master集群:进行建表,删表工作和分配Region(管理负载均衡,Split时,重新分配Region)

    RegionSever集群:储存真正数据的地方

数据储存模型:

  分块储存概念:

    1.Hbase的Table会按行进行Region的数据块划分。

    2.Region数据块会被分配给集群的各个(Regionsever)机器上面去。

    3.每个Regin块会再进行Store块划分,每个Store块拥有一个MenStore和0至多个StoreFile

  Region块的信息储存:

    HBase中有两张记录Region信息所在位置的特殊的Table,-ROOT-和.META.

    .META.:记录了各个用户表的Region信息,.META.本身可以有多个regoin,放在RegionSever中

    -ROOT-:记录了.META.表的Region信息,-ROOT-本身只有一个region,放在RegionSever中

    Zookeeper中记录了-ROOT-表的location

  Store块中储存的信息:

    RowKey:是Byte array,是表中每条记录的“主键”,方便快速查找,Rowkey的设计非常重要。

    Column Family:列族,拥有一个名称(string),包含一个或者多个相关列

    Column:属于某一个columnfamily,familyName:columnName,每条记录可动态添加

    Version Number:类型为Long,默认值是系统时间戳,可由用户自定义

    Value(Cell):Byte array

数据流程:

  创建、修改表:

    1.Client向Zookeeper发送创建表请求,Zookeeper记录日志后传递给HMaster。

    2.HMaster返回可以写入RegionSever给Zookeeper

    3.Zookeeper把创建的表和Regionsever的关系通过ROOT表和META表记录下来

    4.以后进行表操作则不用经过HMaster,直接从Zookeeper中获取对应的RegionSever地址

  操作表:

    1.Client向Zookeeper发送操作数据请求

    2.Zookeeper检查缓存中是否有目标表与RegionSever的关系

    3.从Zookeeper中抽取ROOT表和META表读取目标表与RegionSever的关系

    4.到对应的RegionSever中进行Hlog日志记录并找到对应的StoreFile进行数据操作

    5.把最后的Hlog和StoreFile储存到HDFS中

参考资料:

http://www.cnblogs.com/JemBai/archive/2012/07/21/2602432.html

http://www.uml.org.cn/sjjm/201212141.asp#6

http://www.csdn.net/article/2014-02-17/2818431-HDFS+MapReduce+Hbase

http://blog.csdn.net/woshiwanxin102213/article/details/17584043

http://www.cnblogs.com/hark0623/p/5571193.html

http://tangay.iteye.com/blog/736871

HBASE学习笔记-初步印象的更多相关文章

  1. HBase学习笔记之HBase的安装和配置

    HBase学习笔记之HBase的安装和配置 我是为了调研和验证hbase的bulkload功能,才安装hbase,学习hbase的.为了快速的验证bulkload功能,我安装了一个节点的hadoop集 ...

  2. HBASE学习笔记(四)

    这两天把要前几天的知识点回顾一下,接下来我会用自己对知识点的理解来写一些东西 一.知识点回顾 1.hbase集群启动:$>start-hbase.sh ===>hbase-daemon.s ...

  3. HBase学习笔记之BulkLoad

    HBase学习之BulkLoad bulkload的学习以后再写文章. 参考资料: 1.https://blog.csdn.net/shixiaoguo90/article/details/78038 ...

  4. HBase学习笔记之HBase原理和Shell使用

    HBase学习指南之HBase原理和Shell使用 参考资料: 1.https://www.cnblogs.com/nexiyi/p/hbase_shell.html,hbase shell

  5. HBase学习笔记(四)—— 架构模型

    在逻辑上,HBase 的数据模型同关系型数据库很类似,数据存储在一张表中,有行有列. 但从 HBase 的底层物理存储结构(K-V)来看,HBase 更像是一个 multi-dimensional m ...

  6. Hbase学习笔记01

    最近做项目接触到了HDFS.mapreduce以及Hbase,有了实战机会,今天打算将这些知识好好总结下,以备不时之需.首先从Hbase开始吧. Hbase是建立在HDFS上的分布式数据库,下图是Hb ...

  7. HBase学习笔记-高级(一)

    HBase1. hbase.id记录了集群的唯一标识:hbase.version记录了文件格式的版本号2. split和.corrupt目录在日志分裂过程中使用,以便保存一些中间结果和损坏的日志在表目 ...

  8. HBASE学习笔记--API

    HBaseConfiguration HBaseConfiguration是每一个hbase client都会使用到的对象,它代表的是HBase配置信息.它有两种构造方式: public HBaseC ...

  9. Hbase—学习笔记(一)

    此文的目的: 1.重点理解Hbase的整体工作机制 2.熟悉编程api,能够用来写程序 1.  什么是HBASE 1.1.   概念特性 HBASE是一个数据库----可以提供数据的实时随机读写 HB ...

随机推荐

  1. chrome 扩展包 postman 的安装

    由于chrome网上应用不能使用.添加扩展程序,需要其他的办法. 1.下载postman安装包.下载地址 2.这一步按照这个下载包中的方法,也可以,可以忽略其错误. 先解压出crx,使用两个办法,使用 ...

  2. [转]EntityFramework状态变化AutoDetectChangesEnabled与SaveChanged参数说明

    一.约定OnModelCreating 有一些限制需要注意,例如:1.表名不支持使用标签进行标注2.最小长度在 OnModelCreating 中不支持3.正则表达式在 OnModelCreating ...

  3. kendo模板 Uncaught Error: Invalid template:' 报错

    I was having a problem with a grid toolbar template because of a # in a hrefWorked out that I needed ...

  4. 【Python】【学习笔记】1.快速入门

    1.软件安装 从官网下载相应版本的安装包,一般不大. https://www.python.org/ 安装一路默认即可 2. 参考教程:快速入门:十分钟学会Python 本文的内容介于教程(Totur ...

  5. HDU 3033 分组背包变形(每种至少一个)

    I love sneakers! Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others) ...

  6. Fibonacci(斐波那契)递归实现。容易看懂

    #include<iostream>using namespace std;int fibonacci(int n){if(n<=0) return 0; else if(n==1) ...

  7. Redux教程1:环境搭建,初写Redux

    如果将React比喻成士兵的话,你的程序还需要一位将军,去管理士兵(的状态),而Redux恰好是一位好将军,简单高效: 相比起React的学习曲线,Redux的稍微平坦一些:本系列教程,将以" ...

  8. IOS 学习 开发 自定义 UINavigationController 导航

    文件目录如下:基本导航顺序: root -> First -> Second -> Third.其中,FirstViewController作为 navigation堆栈的rootv ...

  9. android学习之RadioButton和CheckBox

    移通152 余继彪 RadioBuuton是一个单选按钮,CheckBox是一个复选按钮 . RadioButton的使用 ,首先要将RadioButton放在RadioGroup中,RadioGro ...

  10. 移除project,testsuite,testcase级别所有的custom properties

    // Remove all custom properties on Project level. If removed, custom properties cannnot be injected ...