HBase数据模型(1)

HBase数据模型(2)

1.0 HBase的版本version,是一个用长整型表示的。由Rowkey、Column(列族和列)、Version组合在一起称为HBase中的一个单元格。

2.0 排序,Get和Scan操作返回的是经过排序的数据。返回的数据首先按行字典排序,其次是列族,然后是列修饰符(cloumn qualifier),最后是时间戳反向排序,最新的在最前面。

3.0 连接查询,实现jion操作有两种方法:要么写入HBase的时候已经做好连接;要么查询表并在应用层实现连接。

4.0 计数器,IncrementColumnValue(简称ICV)是HBase的计数器,可以完成一些计算页面浏览量(PV)等的操作。

5.0 原子操作,仅供对行级别的原子性,也就是对同一个Key下的数据进行的两个操作,在实际执行的时候是会串行的执行,保证了每一行KeyValue对不会被破坏。

6.0 行锁,RegionServer提供了一个行锁特性,保证了只有一个客户端能获取一行数据相应的锁,同时对该行进行修改。

7.0 自动分区

  • HBase中的表数据会被分拆很多个Region,Region可以动态扩展并且HBase保证Region的负载均衡。
  • Region实际上是行键排序后的按则分割的连续的存储空间。
  • Region的自动分区动作是split和compaction
  • 刚刚创建的的表只有一个Region,随着数据的写入,达到Region上限配置时,Region会按照中间键自动地拆分成两个大致相等的Region,每个Region由一个RegionServer管理,一个RegionServer处理器管理者许多个Region。
  • 每个Region包含起始Rowkey的记录,不包含结束Rowkey的记录。
  • 每个RegionServer可以管理大约100 ~ 1000个Region,每个Region的大小可以是1 ~ 20GB。
  • 当一个Region进行拆分时,首先要将该Region下线(offline),拆分完后新的Region在上线(online),下线的Region暂时不可用,不过由于速度极快,通常不会对数据的读写造成影响。

8.0 CAP原理

一致性(Consistency):所以节点在用一时间具有相同的数据。

可用性(Availability):保证每个请求不管成功或者失败都有响应。

分区容忍性(Partition tolerance):系统中任意信息的丢失或失败不会影响系统的继续运作。

HBase数据模型(1)

HBase数据模型(2)

HBase数据模型(2)的更多相关文章

  1. HBase 数据模型(Data Model)

    HBase Data Model--HBase 数据模型(翻译) 在HBase中,数据是存储在有行有列的表格中.这是与关系型数据库重复的术语,并不是有用的类比.相反,HBase可以被认为是一个多维度的 ...

  2. Hbase总结(一)-hbase命令,hbase安装,与Hive的区别,与传统数据库的区别,Hbase数据模型

    Hbase总结(一)-hbase命令 下面我们看看HBase Shell的一些基本操作命令,我列出了几个常用的HBase Shell命令,如下: 名称 命令表达式 创建表 create '表名称', ...

  3. HBase 数据模型

    在HBase中,数据是存储在有行有列的表格中.这是与关系型数据库重复的术语,并不是有用的类比.相反,HBase可以被认为是一个多维度的映射. HBase数据模型术语 Table(表格) 一个HBase ...

  4. HBase数据模型

    上次我们讲过了<HBase简介>,点击阅读有助于更好地理解本文.本文讲述的是HBase数据模型. 1.ROW KEY 决定一行数据按照字典顺序排序的.Row key只能存储64k的字节数据 ...

  5. HBase数据模型(1)

    HBase数据模型(1) HBase数据模型(2) 1.0 HBase的特性 Table HBase以表(Table)的方式组织数据,数据存储在表中. Row/Column 行(Row)和列(Colu ...

  6. 3.Hbase数据模型

    3.1.Hbase数据模型: 概念视图: 物理视图 Hbase数据在存储系统中是以列族来体现的[Column Family],任何时候可以随意的添加一列到已经存在的列族中 空的单元格在表中不做存储也不 ...

  7. 从零自学Hadoop(20):HBase数据模型相关操作上

    阅读目录 序 介绍 命名空间 表 系列索引 本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,SourceLink 序 ...

  8. 从零自学Hadoop(21):HBase数据模型相关操作下

    阅读目录 序 变量 数据模型操作 系列索引 本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,SourceLink 序 ...

  9. HBASE数据模型&扩展和负载均衡理论

    示例数据模型 HBase中扩展和负载均衡的基本单元成为region,region本质上是以行健排序的连续存储区间.如果region太大,系统会把它们 自动拆分,相反的,就是把多个region合并,以减 ...

随机推荐

  1. i2c-tools的使用方法及举例

    i2c-tools的使用方法 最近在调试ADV7401,调试的过程难免要反复修改寄存器,然后看结果现象.传统的做法是修改驱动代码寄存器值->编译->下载->运行->看结果,这一 ...

  2. Runtime.getRuntime()

    1转自:https://www.aliyun.com/jiaocheng/849282.html 那就首先说点Runtime类吧,他是一个与JVM运行时环境有关的类,这个类是Singleton的.我说 ...

  3. Redux API之applyMiddleware

    applyMiddleware(...middlewares) 使用包含自定义功能的 middleware 来扩展 Redux 是一种推荐的方式.Middleware 可以让你包装 store 的di ...

  4. CentOS6下安装Java jdk1.7.0_10和 maven

    安装步骤如下: 1. 下载JDK7.0_10 (jdk-7u10-linux-i586.tar.gz) 地址: 2. 卸载系统自带的开源JDK 查看是否安装JDK rpm -qa | grep jav ...

  5. linux c实现的提取文件名的小程序

    /*@author etangyushan *工作中很多时候会和文件名打交道,有时候只需要文件名称,就写了这么一个小程序 *这个函数实现了把一个文件的绝对路径和后缀去除,只留下文件名的功能 * */ ...

  6. java.endorsed.dirs的作用

    java.endorsed.dirs   java.ext.dirs 用于扩展jdk的系统库,那么 -Djava.endorsed.dirs 又有什么神奇的作用呢? java提供了endorsed技术 ...

  7. HDU - 5001 Walk(概率dp+记忆化搜索)

    Walk I used to think I could be anything, but now I know that I couldn't do anything. So I started t ...

  8. pandas基础(3)_数据处理

    1:删除重复数据 使用duplicate()函数检测重复的行,返回元素为bool类型的Series对象,每个元素对应一行,如果该行不是第一次出现,则元素为true >>> df =D ...

  9. linux下提示/usr/lib64/libstdc++.so.6: version `GLIBCXX_3.4.14' not found 解决办法

    1.查看gcc版本中包含哪些库. strings /usr/lib64/libstdc++.so.6 | grep GLIBC GLIBCXX_3. GLIBCXX_3.4.1 GLIBCXX_3.4 ...

  10. JS高级学习历程-5

    [闭包] 定义:闭包就是一个函数 条件:一个函数去嵌套另外一个函数,里边的函数就是闭包 function  f1(){ function f2(){ } } 特点:闭包函数有权访问父级环境的变量信息.