Java代码通过API操作HBase的最佳实践
HBase提供了丰富的API。这使得用Java连接HBase非常方便。
有时候大家会使用HTable table=new HTable(config,tablename);的方式来实例化一个HTable对象,实际上这并不是最好的实例化HTable的办法。最好的办法是使用HTablePool,并且每个线程都使用独立的HTable(参见《HBase The Definitive Guide》 4.4 HtablePool 和3.1 客户端API 概述)。因为HTable实例的创建非常耗时,需要扫描.META表确认表是否存在,是否可用等,还需要做其他的一些操作,所以,最好在系统启动的时候创建实例,如果需要多个HTable,考虑使用HTablePool。
比如我在webservice中,需要对HTable进行查询,并将数据返回,我是这么做的:
可以在提供服务的类的构造函数里完成HTablePool的初始化,弃用下面的方法。
先在静态代码块中把系统中需要用到的表都获取一遍,获取完之后立即关闭该表,以期增加真正的服务的代码中,第一次实例化HTable对象的效率。
//这是我对外提供服务的类
public class HBaseQu
{ // SignHBase.getConfiguration()是从配置文件中获取
//org.apache.hadoop.conf.Configuration的一个对象
// 定义一个全局的HTablePool
public static HTablePool hTablePool = new HTablePool(
SignHBase.getConfiguration(), Integer.MAX_VALUE);
// 初始化所用到的HTablePool,从pool中get一个需要用到的表,get完毕,立即关闭,
// 以后每增加一个接口,如果需要用到一个新表的话,就在此处增加一次获取表,然后关闭它的代码。
static
{
HTable table = null;
//从池里获取一个表,然后关闭它(类似于充血) try {
table = (HTable) hTablePool.getTable(tableName);
if (null != table)
{
table.close();
}
}
catch (IOException e)
{
e.printStackTrace();
} //获取另外一个表
try
{
table = (HTable) hTablePool.getTable(tableName2);
if (null != table)
{
table.close();
}
}
catch (IOException e)
{
e.printStackTrace();
}
}
}
在真正的服务的代码中,直接使用pool.getTable(tableName)即可快速实例化该表。如下所示:
HTable table = null;//定义HTable
ResultScanner rs = null;//定义接收结果的ResultScanner对象
try
{
//实例化HTable对象
table = (HTable) HBaseQu.hTablePool.getTable(tablename);
Scan s = new Scan();//实例化Scan对象
s.setFilter(new PrefixFilter(rowPrifix.getBytes()));//添加过滤器
s.addColumn(Bytes.toBytes(family), Bytes.toBytes(qualifier));
rs = table.getScanner(s);//获取结果
for (Result r : rs)
{//循环处理行
KeyValue[] kv = r.raw();
for (int i = 0; i < kv.length; i++)
{
value.add(new String(kv[i].getRow(), "UTF-8") + ":---:"
+ new String(kv[i].getFamily()) + ":"
+ new String(kv[i].getQualifier()) + ":---:"
+ new String(kv[i].getValue())); }
}
}
catch (Exception e)
{
e.printStackTrace();
return null;
}
finally
{
//关闭打开的资源
if (null != rs)
{
rs.close();
}
try
{
if (null != table)
{
table.close();
}
}
catch (IOException e)
{
e.printStackTrace();
}
}
本文已同步至大数据技术( http://cloudera.org.cn ),文章地址:http://cloudera.org.cn/?p=43
Java代码通过API操作HBase的最佳实践的更多相关文章
- HBase 6、用Phoenix Java api操作HBase
开发环境准备:eclipse3.5.jdk1.7.window8.hadoop2.2.0.hbase0.98.0.2.phoenix4.3.0 1.从集群拷贝以下文件:core-site.xml.hb ...
- jsp页面:js方法里嵌套java代码(是操作数据库的),如果这个js 方法没被调用,当jsp页面被解析的时候,不管这个js方法有没有被调用这段java代码都会被执行?
jsp页面:js方法里嵌套java代码(是操作数据库的),如果这个js 方法没被调用,当jsp页面被解析的时候,不管这个js方法有没有被调用这段java代码都会被执行? 因为在解析时最新解析的就是JA ...
- 《深入理解Java虚拟机:JVM高级特性与最佳实践》【PDF】下载
<深入理解Java虚拟机:JVM高级特性与最佳实践>[PDF]下载链接: https://u253469.pipipan.com/fs/253469-230062566 内容简介 作为一位 ...
- .NET API 接口数据传输加密最佳实践
.NET API 接口数据传输加密最佳实践 我们在做 Api 接口时,相信一定会有接触到要给传输的请求 body 的内容进行加密传输.其目的就是为了防止一些敏感的内容直接被 UI 层查看或篡改. 其实 ...
- 读书笔记-《深入理解Java虚拟机:JVM高级特性与最佳实践》
目录 概述 第一章: 走进Java 第二章: Java内存区域与内存溢出异常 第三章: 垃圾收集器与内存分配策略 第四章: 虚拟机性能监控与故障处理 第五章: 调优案例分析与实战 第六章: 类文件结构 ...
- restful api的10个最佳实践
Web API在过去的几年里非常盛行,因为它有着语法简单.规范化和轻量级的优点,因为得到广泛的推崇,很多过往的技术手段都慢慢转换为使用Web API来开发.而Web API通常使用的设计方式是REST ...
- Java API 操作HBase Shell
HBase Shell API 操作 创建工程 本实验的环境实在ubuntu18.04下完成,首先在改虚拟机中安装开发工具eclipse. 然后创建Java项目名字叫hbase-test 配置运行环境 ...
- linux 下通过过 hbase 的Java api 操作hbase
hbase版本:0.98.5 hadoop版本:1.2.1 使用自带的zk 本文的内容是在集群中创建java项目调用api来操作hbase,主要涉及对hbase的创建表格,删除表格,插入数据,删除数据 ...
- 大数据技术之_11_HBase学习_02_HBase API 操作 + HBase 与 Hive 集成 + HBase 优化
第6章 HBase API 操作6.1 环境准备6.2 HBase API6.2.1 判断表是否存在6.2.2 抽取获取 Configuration.Connection.Admin 对象的方法以及关 ...
随机推荐
- 关于 qtchooser
关于这个工具,我有一万个 mmp 要讲.之前为了图省事,直接手动把 qmake 的链给改掉了,总觉得这样不大科学. 恩,系统既然提供了 qtchooser 那就用用吧.但是,尝试之后觉得做得跟屎一样. ...
- 分布式锁和Redisson实现
http://thoreauz.com/2017/08/20/language/java/%E5%9F%BA%E7%A1%80/%E5%88%86%E5%B8%83%E5%BC%8F%E9%94%81 ...
- javascript 如何打印、输出数组内容(将数组内容以字符串的形式展示出来)
1.情景展示 在实际开发过程中,为了调试,有时我们需要看数组中具体包含了哪些数据,但是, 如果我们直接打印该数组对象,显示的结果却不是我们想要的. 如何才能将数组内容打印出来呢?(将数组内容以 ...
- Dom4j完整教程,操作XML教程
目录 1.DOM4J简介 2.XML文档操作1 2.1.读取XML文档: 2.2.获取根节点 2.3.. 新增一个节点以及其下的子节点与数据 2.4. 写入XML文件 2. 5. 遍历xml节点 2. ...
- MSVC下使用Boost的自动链接
简述 好久没有用过boost库了,以前用也是在linux下,需要哪个部分就添加哪个部分到Makefile中. 最近要在Windows下使用,主要是mongocxx库依赖它,不想自己去编译它了,就直接在 ...
- 一个进程(Process)最多可以生成多少个线程(Thread)
1.进程中创建线程的限制 默认情况下,一个线程的栈要预留1M的内存空间,而一个进程中可用的内存空间只有2G,所以理论上一个进程中最多可以开2048个线程,但是内存当然不可能完全拿来作线程的栈,所以实际 ...
- Dapper 的输出参数使用示范
-- 普通SQL 示范-- Queries with output parameters. Hide Shrink Copy Code // output parameters // the para ...
- 子类化QTreeWidgetItem实现增加Item的属性
因为有需求是点击QTreeWidgetItem需要获取该Item的节点的相关属性,Item需要保存关联的属性,那么就需要扩展QTreeWidgetItem,当然,C++中扩展修改一个类或组件的方式就是 ...
- 解决 Class not found和Base table or view not found: 1051 问题
1.解决class not found的方法: 如果你用的是homestead虚拟机,那么,你要到虚拟机下执行: composer dump-autoload 2.解决Base table or vi ...
- 自己动手做——简易下载工具 SimpleDownloader
一.说明 二.开发 三.源代码 源代码:https://github.com/FrankFan/SimpleDownloader 可执行文件下载地址