HBase总结（十八）Hbase rowkey设计一

hbase所谓的三维有序存储的三维是指：rowkey（行主键），column key(columnFamily+qualifier)，timestamp(时间戳)三部分组成的三维有序存储。

1.rowkey。我们知道rowkey是行的主键，并且hbase仅仅能用个rowkey，或者一个rowkey范围即scan来查找数据。所以 rowkey的设计是至关重要的，关系到你应用层的查询效率。我们知道。rowkey是以字典顺序排序的。而存储的字节码，字典排序，我们知道，假设是字
母，那就是字母的顺序，比方，有两个rowkey，rowkey1:aaa222,rowkey2:bbb111,那么rowkey1是排在 rowkey2前面的，由于按字典，a排在b前面，假设rowkey2的第一位也是a，那么就依据第二位来比較，假设还相同，则比較第三为。后面相同。这个理解了，我们在依据rowkey范围查询的时候，我们通常是知道startRowkey，假设我们通过scan仅仅传startRowKey ： d开头的。那么查询的是全部比d大的都查了，而我们仅仅须要d开头的数据，那就要通过endRowKey来限制。

我们能够通过设定endRowKey为：d
开头。后面的依据你的rowkey组合来设定，通常是加比startKey大一位。

比方说rowkey设计为：用户ID-日期，那么查某个用户某天的数据，startKEY为3231-20121212，endKey为:3231+201213,那么你查到的就是用户为3231在20121212这一天的数据。

2.column key

column key是第二维，数据按rowkey字典排序后，假设rowkey同样。则是依据column key来排序的。也是按字典排序。

我们在设计table的时候要学会利用这一点。比方我们的收件箱。我们有时候须要按主题排序。那我们就能够把主题这设置为我们的column key。即设计为columnFamily+主题.,这种设计。

3.timestamp

timestamp 时间戳，是第三维。这是个按降序排序的，即最新的数据排在最前面。这个就没有什么说的了。

网上其它的博客也提到比較多。

本文章主要是简单说下rowkey的字典排序即（三维有序）

HBase总结（十八）Hbase rowkey设计一的更多相关文章

Hbase 学习（七） rowkey设计
一直以来对rowkey的设计都比较迷茫,<hbase权威指南>倒是给出了个还算靠谱的例子. 下面这个例子有点儿像帖子表结构,它的rowkey设计是这样的,可以简单的理解为,什么人在什么时间 ...
HBase（十）HBase性能调优总结
一. HBase的通用优化 1 高可用在 HBase 中 Hmaster 负责监控 RegionServer 的生命周期,均衡 RegionServer 的负载,如果 Hmaster 挂掉了,那么整 ...
Hbase对hive的支持没有hdfs的好的原因及hbase什么时候使用及rowkey设计技巧
hive-=mareduce 的 split 在 hbase就是 region了,,,,,,,访问region必须通过hregionserver 会造成regionser负担过大, 另外 reg ...
Hadoop HBase概念学习系列之RowKey设计（二十九）
HBase里的RowKey设计,分为随机查询的RowKey设计和连续查询的RowKey设计.
HBase学习（四）二级索引 rowkey设计
HBase学习(四) 一.HBase的读写流程画出架构 1.1 HBase读流程 Hbase读取数据的流程:1)是由客户端发起读取数据的请求,首先会与zookeeper建立连接2)从zookeepe ...
Hbase Rowkey设计
转自:http://www.bcmeng.com/hbase-rowkey/ 建立Schema Hbase 模式建立或更新可以通过 Hbase shell 工具或者使用Hbase Java API 中 ...
HBase的RowKey设计原则
HBase是三维有序存储的,通过rowkey(行键),column key(column family和qualifier)和TimeStamp(时间戳)这个三个维度可以对HBase中的数据进行快速定 ...
大数据性能调优之HBase的RowKey设计
1 概述 HBase是一个分布式的.面向列的数据库,它和一般关系型数据库的最大区别是:HBase很适合于存储非结构化的数据,还有就是它基于列的而不是基于行的模式. 既然HBase是采用KeyValue ...
Hbase笔记——RowKey设计
一).什么情况下使用Hbase 1)传统数据库无法承载高速插入.大量读取. 2)Hbase适合海量,但同时也是简单的操作. 3)成熟的数据分析主题,查询模式确立不轻易改变. 二).现实场景 1.电商浏 ...

随机推荐

F - Oil Deposits 【地图型BFS+联通性】
The GeoSurvComp geologic survey company is responsible for detecting underground oil deposits. GeoSu ...
非负整数可重集去重&排序+获得可重集的全排列的几种方法
非负整数可重集O(n)去重并排序可重集是指元素可重复的集合,对于在一定区间内的正整数集,比如[1,n],我们可以在不不使用任何额外空间(包括不使用O(1)的空间)的情况下,用O(n)的时间复杂度完成 ...
利用Java的反射与代理机制实现AOP
在上一篇文章中,我们讲述了利用Java的反射机制中实现Spring中的IOC,在本文中,我们将更进一步,讲述用Java的反射和动态代理机制来实现Spring的AOP. 一．AOP概述 AOP(Aspe ...
CodeChef - UASEQ Chef and sequence
Read problems statements in Mandarin Chinese and Russian. You are given an array that consists of n ...
【欧拉函数表】POJ2478-Farey Sequence
[题目大意] 求∑φ(i)(1<=i<=N). [思路] 欧拉函数具有如下的重要推论: 当b是素数时性质①若b|a,有φ(ab)=φ(a)*b: 性质②若b不|a,有φ(ab)=φ(a) ...
由SequenceFile.Writer(key,value)谈toString()方法
之前有篇博客(http://www.cnblogs.com/lz3018/p/5243503.html)介绍以SequenceFile作为输入源进行矩阵乘法的过程,首先是将矩阵存储到SequenceF ...
ext js layout and tree
数据 <configuration> <configSections> <section name="hibernate-configuration&q ...
nobr 不换行标签
示例代码: <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> ...
SQLSERVER调用DLL程序
在SQL Server中调用dll分为两个步骤 1.创建一个dll文件(dll文件分成3种类型,讲其中一种) 2.把dll文件放进SQL Server的程序集中.然后定义一个Function,就可以通 ...
Centos6.5搭建RHCS集群-实现GFS+iSCSI网络共享存储
RHCS集群配置需要用到的各组件功能:RHCS(Red Hat Cluster Suite):能够提供高可用性.高可靠性.负载均衡.存储共享且经济廉价的集群工具集合.LUCI:是一个基于web的集群 ...

HBase总结（十八）Hbase rowkey设计一

HBase总结（十八）Hbase rowkey设计一的更多相关文章

随机推荐

热门专题