简单来讲,rowkey就是 KeyValue 中的key  
 

rowkey设计之 尽量散列设计 RowKey
        如第三部分第六中讲到,如果数据都是有序的存储到一个特定的范围内,将会存储在一个有特定起始键和停止键的 region 中。 由于一个 region 只能由一个服务器管理, 所以所有的更新都会几种在一台服务器上。 这会导致系统产生读写热点, 并由于写入数据过分几种而导致整个系统性能下降。
        1 方式采用SHA1(MD5落后了,SHA1是MD5改良版) 加密, 取前6位作为前缀加入到userid前面。
        2 给入UUID合理加入
        
        缺点:用户要扫描一个连续数据的范围时,可能需要对每个 region 服务都发起请求(因为之前的连续数据已经分散到不同的服务器中)。
        好处:用户可以多线程并行的读取数据。这有些类似于一个小规模的 MapReduce 作业, 这样查询的吞吐量会有所提高。
        
rowkey设计之 RowKey 长度尽量短
        缺点:如果 rowkey 太长,第一存储开销会增加,影响存储效率 ,第二 内存中RowKey字段过长,会导致内存的利用率降低,进而降低索引命中率。
        解决方法:   
                        1 时间用 Long 来表示
                        2 尽量使用编码压缩 
rowkey设计之  优先选择   行键设计》列族设计》列限定符》时间戳》值
 
    Query 单元格按照时间戳降序排列。将所以在 HFile 的 Reader 读取数据时,最新的值先被读到(图右下),这也是 HBase 设计模式中典型的读取数据的方式。
    KeyValue 存储时先按行键排序,当一行有多个单元格时内部再按列键升序排序。
 
    用户可以按行键检索一行数据没这样可以有效的减少查询特定行和航范围的时间。设定列族可以有效的减少查询的存储文件。 虽然时间戳或者版本在整个键的最右边,但是他是很重要的筛选内容。 存储文件中为每个单元格(cell)都保存了时间错,所以当用户查询一个两小时前修改过的单元格时,就可以跳过之包含如4小时前数据的存储文件。
    另一个层次的查询力度是 列限定符(column qualifier)。 用户可以在查询数据时制定特定的列,或定义过滤器时包含或排除用户需要访问的列。 不过在这一粒度上筛选数据时,系统不得不检查每个送到过滤器的 KeyValue, 所以通过限定符筛选数据只会有小幅度的性能提升。
 
    总结 列族, rowkey, 时间戳, 列限定符, 值
    
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
                                                                                                                        God has given me a gift. Only one. I am the most complete fighter in the world. My whole life, I have trained. I must prove I am worthy of someting.                                                             rocky_24
 

八 rowkey设计 几种方法的更多相关文章

  1. rowkey设计原则和方法

    rowkey设计首先应当遵循三大原则: 1.rowkey长度原则 rowkey是一个二进制码流,可以为任意字符串,最大长度为64kb,实际应用中一般为10-100bytes,它以byte[]形式保存, ...

  2. Linux下进程通信的八种方法

    Linux下进程通信的八种方法:管道(pipe),命名管道(FIFO),内存映射(mapped memeory),消息队列(message queue),共享内存(shared memory),信号量 ...

  3. Javascript刷新页面的八种方法

    /** * Javascript刷新页面的八种方法 * 说明一下,jQuery没有发现刷新页面的方法. */ 1 history.go(0) 2 location.reload() 3 locatio ...

  4. Linux 的shell 字符串截取很有用。有八种方法。

    一 Linux 的字符串截取很有用.有八种方法. 假设有变量 var=http://www.linuxidc.com/123.htm 1  # 号截取,删除左边字符,保留右边字符. echo ${va ...

  5. Android中UI线程与后台线程交互设计的5种方法

    我想关于这个话题已经有很多前辈讨论过了.今天算是一次学习总结吧. 在android的设计思想中,为了确保用户顺滑的操作体验.一 些耗时的任务不能够在UI线程中运行,像访问网络就属于这类任务.因此我们必 ...

  6. c/c++测试函数的运行时间(八种方法)

    目前,存在着各种计时函数,一般的处理都是先调用计时函数,记下当前时间tstart,然后处理一段程序,再调用计时函数,记下处理后的时间tend,再tend和tstart做差,就可以得到程序的执行时间,但 ...

  7. Apache shiro集群实现 (八) web集群时session同步的3种方法

    Apache shiro集群实现 (一) shiro入门介绍 Apache shiro集群实现 (二) shiro 的INI配置 Apache shiro集群实现 (三)shiro身份认证(Shiro ...

  8. nodejs高并发大流量的设计实现,控制并发的三种方法

    nodejs高并发大流量的设计实现,控制并发的三种方法eventproxy.async.mapLimit.async.queue控制并发Node.js是建立在Google V8 JavaScript引 ...

  9. 简洁经常使用权限系统的设计与实现(一):构造权限菜单树的N(N>=4)种方法

    权限系统.Web开发常见标准子系统之中的一个.结合自己的一些思考和实践,从本篇開始权限系统的设计与实现之路. 近期,重构了项目的权限菜单构造过程,向前端返回json格式的权限树. 这一篇.仅仅是大致介 ...

随机推荐

  1. Java使用HttpURLConnection上传文件(转)

    从普通Web页面上传文件很简单,只需要在form标签叫上enctype="multipart/form-data"即可,剩余工作便都交给浏览器去完成数据收集并发送Http请求.但是 ...

  2. Java线程之基础

    Java内存模型(jmm) 线程通信 消息传递 重排序 顺序一致性 Happens-Before As-If-Serial 一.线程的生命周期及五种基本状态 线程生命周期:新建.就绪.运行.阻塞.死亡 ...

  3. POJ-2318 TOYS 计算几何 判断点在线段的位置

    题目链接:https://cn.vjudge.net/problem/POJ-2318 题意 在一个矩形内,给出n-1条线段,把矩形分成n快四边形 问某些点在那个四边形内 思路 二分+判断点与位置关系 ...

  4. [HDU5686]2016"百度之星" - 资格赛 Problem B

    题目大意:给你n,规定一个串中相邻的两个1可以合并为一个2(别的不行),让你求长度为n的全1串最多能变成多少种不同的串. 解题思路:我们先来找一波规律,发现n=1,2,3,4,5时答案分别为1,2,3 ...

  5. vue-cli#2.0项目结构分析

    项目结构 build 构建工具相关的目录 config 配置目录 dist 通过工具打包生成的最终需要上线的目录 node_modules 存放本地开发所有的依赖包的目录 src 源码目录 stati ...

  6. gRPC全局异常捕获

    gRPC全局异常捕获 引 一般的.net项目比如ASP.NET.控制台程序.Windows服务.桌面程序等都会有framework自带的全局异常捕获机制.ASP.NET的ExceptionFilter ...

  7. 题解 P3128 【[USACO15DEC]最大流Max Flow】

    此类型题目有两种比较常见的做法:树链剖分和树上差分. 本题有多组修改一组询问,因此树上差分会比树链剖分优秀很多. 这里两种方法都进行介绍. 树链剖分和树上差分的本质都是将一颗树转换为一个区间,然后进行 ...

  8. 如何成为一个偷懒又高效的Android开发人员

    我敢肯定你对这个标题肯定心存疑惑,但事实就是如此,这个标题完全适合Android开发人员.据我所知, Android程序员不情愿写 findViewById().点击事件监听等重复率较高的代码.那我们 ...

  9. NIO框架之MINA源代码解析(一):背景

     "你们的agent占了好多系统的port.把我们的非常多业务系统都给整死了,给我们造成了非常大的损失.要求你们的相关领导下周过来道歉"   --   来自我们的一个客户.   ...

  10. XCL-Chart柱形图的期望线/分界线

    周日在柱形图上加了两个小功能,当中之中的一个是加上了期望线/分界线,功能非常小,但我个人非常喜欢这个功能(好像之前也没看到别的图表库原生支持这个. ) 主要是加上这些小小的横线后,能非常明显的区分出数 ...