Hbase多版本的读写（Shell&Java API版）

Hbase是基于HDFS的NOsql数据库，它很多地方跟数据库差不多，也有很多不同的地方。这里就不一一列举了,不过Hbase有个版本控制的特性，这个特性在很多场景下都会发挥很大的作用。本篇就介绍下基于Shell和Java API的Hbase多版本的读写。

为了更好的理解多版本，我们可以把普通的数据存储理解成二维空间，提供了rowkey，列族，列几个存储的维度。那么版本则相当于二维空间升华到了三维空间，多了时间维度的概念。如果按照默认的操作，当前的时间戳就是版本号，每个数据都可以保留多个版本的数据。你可以只查询最新的数据，也可以查看历史版本。

这里课外引申一下：从一维到十维空间，有兴趣的可以看一下。 <-- 不要当真哈！从思维开始就已经扯淡了!

上个月在阅读《三体》的时候，也很感叹最后都是多维空间拯救了人类！

话题扯远了，回过来我们在看一下多版本如何进行读写

第一步，创建表并开启多版本

hbase(main):002:0> create_namespace 'xingoo'

0 row(s) in 0.0230 seconds

hbase(main):003:0> create 'xingoo:test_v','v'

0 row(s) in 4.5760 seconds

=> Hbase::Table - xingoo:test_v

创建Hbase表，并查看表结构：

hbase(main):004:0> describe 'xingoo:test_v'

Table xingoo:test_v is ENABLED

xingoo:test_v

COLUMN FAMILIES DESCRIPTION

{NAME => 'v', BLOOMFILTER => 'ROW', VERSIONS => '1', IN_MEMORY => 'false', KEEP_DELETED_CELLS => 'FALSE', DATA_BLOCK_ENCODING => 'NONE', TT

L => 'FOREVER', COMPRESSION => 'NONE', MIN_VERSIONS => '0', BLOCKCACHE => 'true', BLOCKSIZE => '65536', REPLICATION_SCOPE => '0'}

1 row(s) in 0.1040 seconds

需要关注的是VERSIONS字段，这个字段默认为1，即默认只保留一个版本的数据，如果不修改，无论你怎么写，都只能查到一个版本的数据。

更多参数信息，可以查看HColumnDescriptor的Java Doc

修改版本数

hbase(main):005:0> alter 'xingoo:test_v',NAME=>'v',VERSIONS=>5

Updating all regions with the new schema...

1/1 regions updated.

Done.

0 row(s) in 3.1590 seconds

hbase(main):006:0> describe 'xingoo:test_v'

Table xingoo:test_v is ENABLED

xingoo:test_v

COLUMN FAMILIES DESCRIPTION

{NAME => 'v', BLOOMFILTER => 'ROW', VERSIONS => '5', IN_MEMORY => 'false', KEEP_DELETED_CELLS => 'FALSE', DATA_BLOCK_ENCODING => 'NONE', TT

L => 'FOREVER', COMPRESSION => 'NONE', MIN_VERSIONS => '0', BLOCKCACHE => 'true', BLOCKSIZE => '65536', REPLICATION_SCOPE => '0'}

1 row(s) in 0.0150 seconds

再次查看下，就可以看到支持的版本多了。

基于Shell的读写

shell写入多个版本

hbase(main):007:0> put 'xingoo:test_v','1','v:c1','value1'

0 row(s) in 0.0870 seconds

hbase(main):008:0> put 'xingoo:test_v','1','v:c1','value2'

0 row(s) in 0.0050 seconds

hbase(main):009:0> put 'xingoo:test_v','1','v:c1','value3'

0 row(s) in 0.0040 seconds

hbase(main):010:0> put 'xingoo:test_v','1','v:c1','value4'

0 row(s) in 0.0040 seconds

hbase(main):011:0> put 'xingoo:test_v','1','v:c1','value5'

0 row(s) in 0.0040 seconds

hbase(main):012:0> put 'xingoo:test_v','1','v:c1','value6'

0 row(s) in 0.0030 seconds

hbase(main):013:0> put 'xingoo:test_v','1','v:c1','value7'

0 row(s) in 0.0040 seconds

shell读取多个版本的数据

注意：如果读取的版本大于Hbase存储的版本，那么只会读取最大VESIONS个记录。

hbase(main):015:0> get 'xingoo:test_v','1',{COLUMN => 'v:c1',VERSIONS=>5}

COLUMN                              CELL

 v:c1                               timestamp=1499088390024, value=value7

 v:c1                               timestamp=1499088387559, value=value6

 v:c1                               timestamp=1499088385347, value=value5

 v:c1                               timestamp=1499088383228, value=value4

 v:c1                               timestamp=1499088380943, value=value3

5 row(s) in 0.0070 seconds

hbase(main):016:0> get 'xingoo:test_v','1',{COLUMN => 'v:c1',VERSIONS=>6}

COLUMN                              CELL

 v:c1                               timestamp=1499088390024, value=value7

 v:c1                               timestamp=1499088387559, value=value6

 v:c1                               timestamp=1499088385347, value=value5

 v:c1                               timestamp=1499088383228, value=value4

 v:c1                               timestamp=1499088380943, value=value3

5 row(s) in 0.0050 seconds

hbase(main):017:0> get 'xingoo:test_v','1',{COLUMN => 'v:c1',VERSIONS=>2}

COLUMN                              CELL

 v:c1                               timestamp=1499088390024, value=value7

 v:c1                               timestamp=1499088387559, value=value6

2 row(s) in 0.0060 seconds

另外，还可以把版本字段当做一个时间字段来进行范围查询，如:

hbase> get 't1', 'r1', {COLUMN => 'c1', TIMERANGE => [ts1, ts2], VERSIONS => 4}

基于Java的读写

首先，需要创建工具类，包含连接的配置

public class HbaseClient {

    public static final String TABLE = "xingoo:test_v";

    private static Configuration conf = null;

    private static Connection conn = null;

    static {

        try {

            conf = HBaseConfiguration.create();

            conf.set("hbase.zookeeper.property.clientPort", "2181");

            conf.set("hbase.zookeeper.quorum", "zk1,zk2,zk3");

            conn = ConnectionFactory.createConnection(conf);

        } catch (IOException e) {

            e.printStackTrace();

        }

    }

...

}

读操作

public void write(String phone,String listing_id) throws IOException {

        HTable myTable = new HTable(conf, TableName.valueOf(TABLE));

        myTable.setAutoFlush(false, false);

        myTable.setWriteBufferSize(3 * 1024 * 1024);

        Put p = new Put(Bytes.toBytes("row_key_1"));

        //可以自己设置时间戳作为版本号，也可以使用默认时间

//        p.addColumn(Bytes.toBytes("v"), Bytes.toBytes("c1"), System.currentTimeMillis(), Bytes.toBytes("test1"));

        p.addColumn(Bytes.toBytes("v"), Bytes.toBytes("c1"), Bytes.toBytes("test2"));

        System.out.println(System.currentTimeMillis());

        myTable.put(p);

        myTable.flushCommits();

        myTable.close();

    }

写操作

    public List<String> read(String q) throws IOException {

        Table table = HbaseClient.conn.getTable(TableName.valueOf(TABLE));

        Scan scan = new Scan();

        scan.addColumn("v".getBytes(),"c1".getBytes());

        scan.setMaxVersions(3);//设置读取的最大的版本数

        RowFilter rowFilter = new RowFilter(CompareFilter.CompareOp.EQUAL,new BinaryComparator(q.getBytes()));//基于过滤器设置查询条件

        scan.setFilter(rowFilter);

        ResultScanner r = table.getScanner(scan);

        List<String> list = new ArrayList<>();

        for(Result result : r) {

            for (KeyValue kv : result.raw()) {

                list.add(Bytes.toString(kv.getValue()));

            }

        }

        System.out.println(list.size());

        table.close();

        return list;

    }

参考

1 hbase教程：http://www.yiibai.com/hbase/

2 hbase官方文档：http://hbase.apache.org/book.html#appendix_contributing_to_documentation

3 一维到十维空间：http://www.sohu.com/a/116444282_482877

Hbase多版本的读写（Shell&Java API版）的更多相关文章

HBase学习（二）基本命令 Java api
一.Hbase shell 1.Region信息观察创建表指定命名空间在创建表的时候可以选择创建到bigdata17这个namespace中,如何实现呢? 使用这种格式即可:'命名空间名称:表名' ...
HBase总结（十二）Java API 与HBase交互实例
HBase提供了Java Api的訪问接口,掌握这个就跟Java应用使用RDBMS时须要JDBC一样重要 import java.io.IOException; import org.apache.h ...
Hbase学习（三）过滤器 java API
Hbase学习(三)过滤器 HBase 的基本 API,包括增.删.改.查等. 增.删都是相对简单的操作,与传统的 RDBMS 相比,这里的查询操作略显苍白,只能根据特性的行键进行查询(Get)或者根 ...
HBase根据Rowkey批量查询数据JAVA API(一次查多条，返回多个记录)
最近在生产中遇到了一个需求,前台给我多个rowkey的List,要在hbase中查询多个记录(返回给前台list).在网上也查了很多,不过自己都不太满意,filter的功能有可能查询结果不是准确值,而 ...
Hbase框架原理及相关的知识点理解、Hbase访问MapReduce、Hbase访问Java API、Hbase shell及Hbase性能优化总结
转自:http://blog.csdn.net/zhongwen7710/article/details/39577431 本blog的内容包含: 第一部分:Hbase框架原理理解第二部分:Hbas ...
HBase环境搭建、shell操作及Java API编程
一. 1.掌握Hbase在Hadoop集群体系结构中发挥的作用和使过程. 2.掌握安装和配置HBase基本方法. 3.掌握HBase shell的常用命令. 4.使用HBase shell命令进行表的 ...
HBase操作（Shell与Java API）
版权声明:本文为博主原创文章,未经博主允许不得转载. 转: http://blog.csdn.net/u013980127/article/details/52443155 下面代码在Hado ...
hbase java api样例（版本1.3.1，新API）
hbase版本:1.3.1 目的:HBase新API的使用方法. 尝试并验证了如下几种java api的使用方法. 1.创建表 2.创建表(预分区) 3.单条插入 4.批量插入 5.批量插入(客户端缓 ...
HBase 相关API操练(二)：Java API
一.HBase Java编程 (1)HBase是用Java语言编写的,它支持Java编程: (2)HBase支持CRUD操作:Create,Read,Update和Delete: (3)Java AP ...

随机推荐

zabbix系列(五)zabbix3.0.4 探索主机Discovery自动发现主机详细图文教程
Zabbix 自动发现(Discovery)功能使用随着监控主机不断增多,有的时候需要添加一批机器,特别是刚用zabbix的运维人员需要将公司的所有服务器添加到zabbix,如果使用传统办法去单个添 ...
sipML5聊天功能实现
一.环境说明:在阅读sipML5的API文档时,发现它具有聊天的功能,于是在sipML5的源码中进行设定,实现了注册之后可以英文聊天(中文聊天需要在FreeSWITCh中进行设定). 二.具体配置: ...
Android：Service
Android Service: http://www.apkbus.com/android-15649-1-1.html android service 的各种用法(IPC.AIDL): http: ...
让Linux任务在后台可靠运行的几种方法
我们经常会碰到这样的问题,用 telnet/ssh 登录了远程的 Linux 服务器,运行了一些耗时较长的任务, 结果却由于网络的不稳定导致任务中途失败.如何让命令提交后不受本地关闭终端窗口/网络 ...
Mac下brew安装与配置mysql
一.打开mac控制台 $ brew install mysql 二.启动mysql服务 $ mysql.server start 三.初始化mysql配置 1 rainMacBook-Pro:~ co ...
配置本地无密码 SSH登录远程服务器
下面这幅图简单来说就是你本地有一把钥匙,服务器也有一把钥匙,当登录的时候本地的钥匙与服务器的进行对比,通过算法的判定,监测是否具有权限的用户第一步,在本地配置这把钥匙生成私钥与公钥: 打开.ssh目 ...
LeetCode（27）：移除元素
Easy! 题目描述: 给定一个数组 nums 和一个值 val,你需要原地移除所有数值等于 val 的元素,返回移除后数组的新长度. 不要使用额外的数组空间,你必须在原地修改输入数组并在使用 O(1 ...
【linux】tar压缩不包含路径
-C 参数文件路径 /home/test/files tar zcvf file.tar.gz -C /home/test files 这样压缩后,就是可以得当一个相对路径的压缩包了,直接排除掉/ ...
升级 php composer 版本
在执行 composer update 时,报错 You made a reference to a non-existent script @php artisan package:discover ...
BZOJ2843 极地旅行社 LCT
欢迎访问~原文出处——博客园-zhouzhendong 去博客园看该题解题目传送门 - BZOJ2843 题意概括有n座岛每座岛上的企鹅数量虽然会有所改变,但是始终在[0, 1000]之间.你的 ...