概括

1. 创建、删除及启用禁用表、添加列等都需用到HBaseAdmin，另外需要注意删除，添加列等操作都需要禁用表

2. 表中添加数据，查询等都是和HTable相关，如果是多线程的情况下注意用HTablePool

3. 插入数据使用Put，可以单行添加也可批量添加

4. 查询数据需使用Get，Result，Scan、ResultScanner等

一、HBaseConfiguration

org.apache.hadoop.hbase.HBaseConfiguration 对HBase进行配置

返回值	函数	描述
void	addResource(Path file)	通过给定的路径所指的文件来添加资源
void	clear()	清空所有已设置的属性
string	get(String name)	获取属性名对应的值
String	getBoolean(String name, boolean defaultValue)	获取为boolean类型的属性值，如果其属性值类型部位boolean,则返回默认属性值
void	set(String name, String value)	通过属性名来设置值
void	setBoolean(String name, boolean value)	设置boolean类型的属性值

eg：

    static Configuration cfg = HBaseConfiguration.create();

    static {

        cfg.set("hbase.zookeeper.quorum", "192.168.1.95");

        cfg.set("hbase.zookeeper.property.clientPort", "2181");

    }

二、HBaseAdmin

org.apache.hadoop.hbase.client.HBaseAdmin 提供了一个接口来管理HBase数据库的表信息。它提供的方法包括：创建表，删除表，列出表项，使表有效或无效，以及添加或删除表列族成员等。

返回值	函数	描述
void	addColumn(String tableName, HColumnDescriptor column)	向一个已经存在的表添加咧
	checkHBaseAvailable(HBaseConfiguration conf)	静态函数，查看HBase是否处于运行状态
	createTable(HTableDescriptor desc)	创建一个表，同步操作
	deleteTable(byte[] tableName)	删除一个已经存在的表
	enableTable(byte[] tableName)	使表处于有效状态
	disableTable(byte[] tableName)	使表处于无效状态
HTableDescriptor[]	listTables()	列出所有用户控件表项
void	modifyTable(byte[] tableName, HTableDescriptor htd)	修改表的模式，是异步的操作，可能需要花费一定的时间
boolean	tableExists(String tableName)	检查表是否存在

eg：

判断表是否存在：

HBaseAdmin hBaseAdmin = new HBaseAdmin(cfg);

if (hBaseAdmin.tableExists(tableName)) {// 如果存在要创建的表，那么先删除，再创建

 　hBaseAdmin.disableTable(tableName);

　　hBaseAdmin.deleteTable(tableName);

　　System.out.println(tableName + " is exist");

}

创建表：

hBaseAdmin.createTable(tableDescriptor);

添加列：

hBaseAdmin = new HBaseAdmin(cfg);

hBaseAdmin.disableTable(tableName);

HColumnDescriptor hd = new HColumnDescriptor(columnFamily);

hBaseAdmin.addColumn(tableName,hd);

三、HTableDescriptor

org.apache.hadoop.hbase.HTableDescriptor 包含了表的名字极其对应表的列族

返回值	函数	描述
void	addFamily(HColumnDescriptor)	添加一个列族
HColumnDescriptor	removeFamily(byte[] column)	移除一个列族
byte[]	getName()	获取表的名字
byte[]	getValue(byte[] key)	获取属性的值
void	setValue(String key, String value)	设置属性的值

eg：创建表时添加列

HTableDescriptor tableDescriptor = new HTableDescriptor(tableName);// 代表表的schema

tableDescriptor.addFamily(new HColumnDescriptor("name")); // 增加列簇

tableDescriptor.addFamily(new HColumnDescriptor("age"));

tableDescriptor.addFamily(new HColumnDescriptor("gender"));

hBaseAdmin.createTable(tableDescriptor);

四、HColumnDescriptor

关系：org.apache.hadoop.hbase.HColumnDescriptor

作用：维护着关于列族的信息，例如版本号，压缩设置等。它通常在创建表或者为表添加列族的时候使用。列族被创建后不能直接修改，只能通过删除然后重新创建的方式。列族被删除的时候，列族里面的数据也会同时被删除。

返回值	函数	描述
byte[]	getName()	获取列族的名字
byte[]	getValue(byte[] key)	获取对应的属性的值
void	setValue(String key, String value)	设置对应属性的值

eg：见上面

五、HTable

org.apache.hadoop.hbase.client.HTable 可以用来和HBase表直接通信。此方法对于更新操作来说是非线程安全的。

返回值	函数	描述
void	checkAdnPut(byte[] row, byte[] family, byte[] qualifier, byte[] value, Put put	自动的检查row/family/qualifier是否与给定的值匹配
void	close()	释放所有的资源或挂起内部缓冲区中的更新
Boolean	exists(Get get)	检查Get实例所指定的值是否存在于HTable的列中
Result	get(Get get)	获取指定行的某些单元格所对应的值
byte[][]	getEndKeys()	获取当前一打开的表每个区域的结束键值
ResultScanner	getScanner(byte[] family)	获取当前给定列族的scanner实例
HTableDescriptor	getTableDescriptor()	获取当前表的HTableDescriptor实例
byte[]	getTableName()	获取表名
static boolean	isTableEnabled(HBaseConfiguration conf, String tableName)	检查表是否有效
void	put(Put put)	向表中添加值

eg：

    　　HTablePool pool = new HTablePool(cfg, 1000);

        // HTable table = (HTable) pool.getTable(tableName);

        Put put = new Put("*1111".getBytes());// 一个PUT代表一行数据，再NEW一个PUT表示第二行数据,每行一个唯一的ROWKEY，此处rowkey为put构造方法中传入的值

        put.add("name".getBytes(), null, "Chander".getBytes());// 本行数据的第一列

        put.add("age".getBytes(), null, "20".getBytes());// 本行数据的第三列

        put.add("gender".getBytes(), null, "male".getBytes());// 本行数据的第三列

        put.add("score".getBytes(), "Math".getBytes(), "99".getBytes());// 本行数据的第四列

        put.add("score".getBytes(), "English".getBytes(), "100".getBytes());// 本行数据的第四列

        put.add("score".getBytes(), "Chinese".getBytes(), "120".getBytes());// 本行数据的第四列   第二个参数对应qualifier

        try {

            pool.getTable(tableName).put(put);

        } catch (IOException e) {

            e.printStackTrace();

        }

六、Put

关系：org.apache.hadoop.hbase.client.Put

作用：用来对单个行执行添加操作

返回值	函数	描述
Put	add(byte[] family, byte[] qualifier, byte[] value)	将指定的列和对应的值添加到Put实例中
Put	add(byte[] family, byte[] qualifier, long ts, byte[] value)	将指定的列和对应的值及时间戳添加到Put实例中
byte[]	getRow()	获取Put实例的行
RowLock	getRowLock()	获取Put实例的行锁
long	getTimeStamp()	获取Put实例的时间戳
boolean	isEmpty()	检查familyMap是否为空
Put	setTimeStamp(long timeStamp)	设置Put实例的时间戳

eg：见上例

七、Get

org.apache.hadoop.hbase.client.Get ：用来获取单个行的相关信息

返回值	函数	描述
Get	addColumn(byte[] family, byte[] qualifier)	获取指定列族和列修饰符对应的列
Get	addFamily(byte[] family)	通过指定的列族获取其对应列的所有列
Get	setTimeRange(long minStamp,long maxStamp)	获取指定取件的列的版本号
Get	setFilter(Filter filter)	当执行Get操作时设置服务器端的过滤器

eg：

 　　　　HTable table = new HTable(cfg, tablename);

        Get g = new Get(rowKey.getBytes());

        Result rs = table.get(g);

        for (KeyValue kv : rs.raw())

        {

            System.out.println("rowkey:        " + new String(kv.getRow()));

            System.out.println("Column Family: " + new String(kv.getFamily()));

            System.out.println("Column       : " + new String(kv.getQualifier()));

            System.out.println("value        : " + new String(kv.getValue()));

        }

八、Result

org.apache.hadoop.hbase.client.Result 存储Get或者Scan操作后获取表的单行值。使用此类提供的方法可以直接获取值或者各种Map结构（key-value对）

返回值	函数	描述
boolean	containsColumn(byte[] family, byte[] qualifier)	检查指定的列是否存在
NavigableMap<byte[],byte[]>	getFamilyMap(byte[] family)	获取对应列族所包含的修饰符与值的键值对
byte[]	getValue(byte[] family, byte[] qualifier)	获取对应列的最新值

eg：

 　　　　HTable table = new HTable(cfg, tablename);

        Get g = new Get(rowKey.getBytes());

        Result rs = table.get(g);

        for (KeyValue kv : rs.raw())

        {

            System.out.println("rowkey:        " + new String(kv.getRow()));

            System.out.println("Column Family: " + new String(kv.getFamily()));

            System.out.println("Column       : " + new String(kv.getQualifier()));

            System.out.println("value        : " + new String(kv.getValue()));

        }

九、Scan

import org.apache.hadoop.hbase.client.Scan 扫描，类似于数据库中的cursor，使用和get类似，也类似于迭代器

可以使用new Scan() 也可以调用HTable的getScanner()方法次方法返回扫描器scanner

eg1：

Scan scan = new Scan();

ResultScanner scanner = htable.getScanner(scan);

for(Result rs: scanner){

   System.out.println(rs);

}

eg2:

Scan scan = new Scan();

scan.addFamily(Bytes.toBytes("columnFamily1"));

ResultScanner scanner = htable.getScanner(scan);

for(Result rs: scanner){

   System.out.println(rs);

}

eg3:

Scan scan = new Scan();

scan.addFamily(Bytes.toBytes("columnFamily1"),Bytes.toBytes("column1"));

ResultScanner scanner = htable.getScanner(scan);

for(Result rs: scanner){

   System.out.println(rs);

}

eg4: 添加过滤器

    Scan scan = new Scan();

        scan.addColumn(Bytes.toBytes(columnFamily),Bytes.toBytes(column));

        Filter f = new RowFilter(CompareFilter.CompareOp.LESS_OR_EQUAL, new BinaryComparator(Bytes.toBytes(condition)));

        scan.setFilter(f);

        HTablePool pool = new HTablePool(cfg, 1000);

        try {

            ResultScanner resultScanner = pool.getTable(tableName).getScanner(scan);

            Result rs = resultScanner.next();

                for (; rs != null; rs = resultScanner.next())

                {

                    for (KeyValue kv : rs.list())

                    {

                        System.out.println("-------------------------------");

                        System.out.println("rowkey:        " + new String(kv.getRow()));

                        System.out.println("Column Family: " + new String(kv.getFamily()));

                        System.out.println("Column       :" + new String(kv.getQualifier()));

                        System.out.println("value        : " + new String(kv.getValue()));

                    }

                }

        } catch (IOException e) {

            // TODO Auto-generated catch block

            e.printStackTrace();

        }

十、ResultScanner

见9中Scan

返回值	函数	描述
void	close()	关闭scanner并释放分配给它的资源
Result	next()	获取下一行的值

eg：

    Scan scan = new Scan();

        scan.addColumn(Bytes.toBytes(columnFamily),Bytes.toBytes(column));

        Filter f = new RowFilter(CompareFilter.CompareOp.LESS_OR_EQUAL, new BinaryComparator(Bytes.toBytes(condition)));

        scan.setFilter(f);

        HTablePool pool = new HTablePool(cfg, 1000);

        try {

            ResultScanner resultScanner = pool.getTable(tableName).getScanner(scan);

            Result rs = resultScanner.next();

                for (; rs != null; rs = resultScanner.next())

                {

                    for (KeyValue kv : rs.list())

                    {

                        System.out.println("-------------------------------");

                        System.out.println("rowkey:        " + new String(kv.getRow()));

                        System.out.println("Column Family: " + new String(kv.getFamily()));

                        System.out.println("Column       :" + new String(kv.getQualifier()));

                        System.out.println("value        : " + new String(kv.getValue()));

                    }

                }

        } catch (IOException e) {

            // TODO Auto-generated catch block

            e.printStackTrace();

        }

参考：http://www.cnblogs.com/NicholasLee/archive/2012/09/13/2683432.html

HBase Java API入门的更多相关文章

HBase编程 API入门系列之create（管理端而言）（8）
大家,若是看过我前期的这篇博客的话,则 HBase编程 API入门系列之put(客户端而言)(1) 就知道,在这篇博文里,我是在HBase Shell里创建HBase表的. 这里,我带领大家,学习更高 ...
HBase编程 API入门系列之delete（客户端而言）（3）
心得,写在前面的话,也许,中间会要多次执行,连接超时,多试试就好了. 前面的基础,如下 HBase编程 API入门系列之put(客户端而言)(1) HBase编程 API入门系列之get(客户端而言) ...
HBase编程 API入门系列之get（客户端而言）（2）
心得,写在前面的话,也许,中间会要多次执行,连接超时,多试试就好了. 前面是基础,如下 HBase编程 API入门系列之put(客户端而言)(1) package zhouls.bigdata.Hba ...
HBase编程 API入门系列之delete（管理端而言）（9）
大家,若是看过我前期的这篇博客的话,则 HBase编程 API入门之delete(客户端而言) 就知道,在这篇博文里,我是在客户端里删除HBase表的. 这里,我带领大家,学习更高级的,因为,在开发中 ...
HBase编程 API入门系列之HTable pool（6）
HTable是一个比较重的对此,比如加载配置文件,连接ZK,查询meta表等等,高并发的时候影响系统的性能,因此引入了“池”的概念. 引入“HBase里的连接池”的目的是: 为了更高的,提高程序的并发 ...
HBase 学习之路（六）——HBase Java API 的基本使用
一.简述截至到目前(2019.04),HBase 有两个主要的版本,分别是1.x 和 2.x ,两个版本的Java API有所不同,1.x 中某些方法在2.x中被标识为@deprecated过时.所 ...
HBase 系列（六）——HBase Java API 的基本使用
一.简述截至到目前 (2019.04),HBase 有两个主要的版本,分别是 1.x 和 2.x ,两个版本的 Java API 有所不同,1.x 中某些方法在 2.x 中被标识为 @depreca ...
【Hbase学习之三】Hbase Java API
环境虚拟机:VMware 10 Linux版本:CentOS-6.5-x86_64 客户端:Xshell4 FTP:Xftp4 jdk8 hadoop-2.6.5 hbase-0.98.12.1-h ...
hbase java api样例（版本1.3.1，新API）
hbase版本:1.3.1 目的:HBase新API的使用方法. 尝试并验证了如下几种java api的使用方法. 1.创建表 2.创建表(预分区) 3.单条插入 4.批量插入 5.批量插入(客户端缓 ...

随机推荐

Android 图标右上角添加数字提醒
方法一:使用开源项目ViewBadger,github上的地址:https://github.com/jgilfelt/android-viewbadger 效果如图所示: <TextView ...
在 foreach 里使用引用要注意的陷阱(转)
从一道面试题开始在开始本节内容前,我们先来看看一道还算比较常见的PHP面试题: 1 $arr = array('1','2','3'); 2 3 foreach($arr as &$v) ...
[转] Maven镜像配置
参考:许晓斌的<Maven实战> 镜像是为了提供更快的服务如图:X就认为是Y的一个镜像. 编辑settings.xml配置中央仓库镜像: <settings> ... < ...
Linux开发工具之gdb（上）
三.gdb调试(上) 01.gdb:gdb是GNU debugger的缩写,是编程调试工作. 功能: 启动程序,可以按照用户自定义的要求随心所欲的运行程序: 可让被调试的程序在用户所指定的调试 ...
Windows Azure上的Odoo(OpenERP)
OpenERP 改名为 Odoo 了,感觉名字怪怪的.Windows Azure也进入国内了,学习了一段时间的Azure,把它门结合在一起搞搞吧!本系列文章不涉及开发,纯属环境搭建及Odoo 系统功能 ...
Overload和Override的区别？
Overload和Override的区别? Override是重写:方法名称.参数个数,类型,顺序,返回值类型都是必须和父类方法一致的.它的关系是父子关系Overload是重载:方法名称不变,其余的都 ...
C#操作word封装
在项目中添加Microsoft.Office.Interop.Word.dll引用 Codepublic class WordAPI{ private object _template; ...
织梦dede自定义内容分页，datalist运用实例
在/plus文件夹中新建一个ceshi.php文件..<?php require(dirname(__FILE__)."/../include/common.inc.php" ...
Android客户端采用Http 协议Post方式请求与服务端进行数据交互（转）
http://blog.csdn.net/javanian/article/details/8194265
关于#include后面<>和" "的区别
1.以尖括号制定头文件,如下所示: #include <stdio.h> 用尖括号来制定文件时,预处理器是以特定的方式来寻找文件,一般是环境中或编译器命令行指定的某种寻找路径.这种设置寻找 ...

HBase Java API入门

概括