HBase 二次开发 java api和demo

1. 试用thrift python/java以及hbase client api。结论例如以下：

1.1 thrift的安装和公布繁琐。可能会遇到未知的错误，且hbase.thrift的版本号在变化中。

长处代码简单，须要打包的内容少。

1.2 hbase client api，须要的jar非常多，公布版的容量也非常大。打包后近百兆。

长处是。明白。无歧义。

2. 推荐用hbase client api的方式搞定。

3. 下面均为技术细节。

4. 有一台机器/一个集群，在执行hadoop，也执行了基于这个hadoop集群的hbase集群，同一时候，也执行了一个zookeeper集群，我们统称它是A。

5. 有一台集群负责开发，我们在上面写代码。编译代码，执行代码。我们称它是B。

6. 在B上，要改动/etc/hosts，把A的随意一台zookeeperserver的hostname和相应的ip地址放进去。由于hbase client须要连接到zookeeper，以便获得hbase的hmast信息---hbase集群有多个hmast。一个是主hmast。其它是备用hmaster，假设主hmaster挂了，备用的会顶上，避免单点故障问题。

7. 在B上开发。在elipse建立一个java项目。加入一个lib文件夹，把A上的hadoop, hbase, zookeeper的全部jar包，注意。是全部jar包，各级子文件夹的也算在内，都拷贝到lib文件夹。大概有130个左右，90M。然后，再把它们加入到buildpath。这么做的优点是，不用一点点找到底哪个类在哪个包。生命短暂，不要把时间浪费在这里。浪费点磁盘空间没关系。

假设hadoop，hbase, zookeeper都安装在一个文件夹下，能够用一个shell语句搞定：

for i in `find . -name "*.jar"`; do cp $i ~/alljars; done;

然后再把alljars下的jar包都拷贝到B的lib文件夹。

8. 写一个最简单的hbase demo。在hbase里检查一个表是否存在，假设不存在，就创建它。

-----------------------------------------

package hbasedemo;

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.hbase.HBaseConfiguration;

import org.apache.hadoop.hbase.client.HBaseAdmin;

import org.apache.hadoop.hbase.HTableDescriptor;

import org.apache.hadoop.hbase.HColumnDescriptor;

import org.apache.hadoop.hbase.TableName;

public class Main {

public static void main(String[] args) throws IOException{

Configuration hbase_conf = new Configuration();

hbase_conf.set("hbase.zookeeper.quorum", "brianxxxooo"); //brianxxxooo是A里的zookeeper机器的hostname

hbase_conf.set("hbase.zookeeper.property.clientPort","2181");

Configuration conf = HBaseConfiguration.create(hbase_conf);

String tablename="scores";

String[] familys = {"grade", "course"};

HBaseAdmin admin = new HBaseAdmin(conf);

if (admin.tableExists(tablename)){

System.out.println("table exist, return!");

return;

}

HTableDescriptor td = new HTableDescriptor(TableName.valueOf(tablename));

for(int i = 0; i < familys.length; i++){

td.addFamily(new HColumnDescriptor(familys[i]));

}

admin.createTable(td);

System.out.println("create table "+tablename+" ok.");

}

}

-----------------------------------------

9. 注意事项，hbase client的版本号变化甚多，详细api调用要依据版本号来，有时候须要參考多个版本号来。比方，0.96.x的HTableDescripter更接近http://hbase.apache.org/apidocs/index.html
, 而不是0.94的api。

但HBaseAdmin在0.94的api是有的，在2.0.0里没有。很混乱。

预计这个局面还要持续一段时间。

10. 更具体的样例

------------------------------------------

package hbasedemo;

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.hbase.*;

import org.apache.hadoop.hbase.client.*;

import org.apache.hadoop.hbase.util.Bytes;

public class Main {

public static void main(String[] args) throws IOException{

Configuration hbase_conf = new Configuration();

hbase_conf.set("hbase.zookeeper.quorum", "brianvxxxxooooo");

hbase_conf.set("hbase.zookeeper.property.clientPort","2181");

Configuration conf = HBaseConfiguration.create(hbase_conf);

String tablename="scores";

String[] familys = {"grade", "course"};

HBaseAdmin admin = new HBaseAdmin(conf);

if (admin.tableExists(tablename)){

System.out.println("table exist!");

}else{

HTableDescriptor td = new HTableDescriptor(TableName.valueOf(tablename));

for(int i = 0; i < familys.length; i++){

td.addFamily(new HColumnDescriptor(familys[i]));

}

admin.createTable(td);

System.out.println("create table "+tablename+" ok.");

}

HTable table = new HTable(conf, "scores");

Put put = new Put(Bytes.toBytes("row1"));

//create

put.add(Bytes.toBytes("grade"), Bytes.toBytes("g1"), Bytes.toBytes(781));

put.add(Bytes.toBytes("grade"), Bytes.toBytes("g2"), Bytes.toBytes("this is test"));

table.put(put);

//read

Get get = new Get(Bytes.toBytes("row1"));

get.addColumn(Bytes.toBytes("grade"), Bytes.toBytes("g1"));

Result result = table.get(get);

byte[] val = result.getValue(Bytes.toBytes("grade"), Bytes.toBytes("g1"));

System.out.println(Bytes.toInt(val));

}

}

------------------------------------------

其它各种操作于此相似，不再一一列出。

HBase 二次开发 java api和demo的更多相关文章

HBase学习（二）基本命令 Java api
一.Hbase shell 1.Region信息观察创建表指定命名空间在创建表的时候可以选择创建到bigdata17这个namespace中,如何实现呢? 使用这种格式即可:'命名空间名称:表名' ...
HBase二次开发之搭建HBase调试环境，如何远程debug HBase源代码
版本 HDP:3.0.1.0 HBase:2.0.0 一.前言之前的文章也提到过,最近工作中需要对HBase进行二次开发(参照HBase的AES加密方法,为HBase增加SMS4数据加密类型).研究 ...
Ubuntu下搭建Hbase单机版并实现Java API访问
工具:Ubuntu12.04 .Eclipse.Java.Hbase 1.在Ubuntu上安装Eclipse,可以在Ubuntu的软件中心直接安装,也可以通过命令安装,第一次安装失败了,又试了一次,开 ...
HBase 增删改查Java API
1. 创建NameSpaceAndTable package com.HbaseTest.hdfs; import java.io.IOException; import org.apache.had ...
ElasticSearch7.3学习(二十三)----RestHighLevelClient Java api实现match_all、ids、match、term、multi_match、bool、filter、sort等不同的搜索方式
1.数据准备首先创建book索引 PUT /book/ { "settings": { "number_of_shards": 1, "number ...
hadoop学习记录（二）HDFS java api
FSDateinputStream 对象 FileSystem对象中的open()方法返回的是FSDateInputStream对象,改类继承了java.io.DateInoutStream接口.支持 ...
python开发初期及二次开发C api
1,python2 or python 区别, https://wiki.python.org/moin/Python2orPython3 python software foundation 2,p ...
HBase里的官方Java API
见 https://hbase.apache.org/apidocs/index.html
ElasticSearch排序Java api简单Demo
代码: String time1 = ConstValue.GetCurrentDate(); SortBuilder sortBuilder = SortBuilders.fieldSort(&qu ...

随机推荐

RP2837 IN1-IN2 对应关系 2路ＤＩ
RP2837 IN1-IN2 对应关系: IN1 ARM-IO2 PA16 IN2 ARM-IO6 PA4 root@sama5d3-linux:~ echo 16 > /sy ...
STM32CubeMX软件工程描述_USART配置过程
推荐分享一个朋友的人工智能教程,零基础!通俗易懂!希望你也加入到人工智能的队伍中来! http://www.captainbed.net/strongerhuang Ⅰ.写在前面学习本文之前可以查 ...
php之道
PHP The Right Way. Tweet 欢迎目前网络上充斥着大量的过时资讯,让 PHP 新手误入歧途,并且传播着错误的实践以及不安全的代码.PHP 之道收集了现有的 PHP 最佳实践.编 ...
datagrid.celltips.js
/** * Created with JetBrains WebStorm. * User: cao.guanghui * Date: 13-6-26 * Time: 下午11:27 * To cha ...
JavaBeans wiki 摘译
20161013最新提示:既然来到这了,为什么不看看 JavaBeans 官方文档学习 ? 鉴于Spring的beans包遵守JavaBean specs,有必要认真研究下JavaBean specs ...
下列哪个为JSP的小脚本的标签？(选择1项)
下列哪个为JSP的小脚本的标签?(选择1项) A．<% %> B．<@ %> C．<%! %> D．<%– %> 解答:A
【NLP】新词发现
http://www.csdn.net/article/2013-05-08/2815186 http://blog.csdn.net/yuyu2223/article/details/7725705 ...
Leetcode: Anagrams(颠倒字母而成的字)
题目 Given an array of strings, return all groups of strings that are anagrams. Note: All inputs will ...
cocos lua 加密方案
cocos2d使用的是luajit,lua原生编译出来的bytecode和luajit是不兼容的,所以直接用luac法编译出来的bytecode脚本无法在cocos2d中使用. 目前所指的解决方案有2 ...
IOS内购支付服务器验证模式
IOS 内购支付两种模式: 内置模式服务器模式内置模式的流程: app从app store 获取产品信息用户选择需要购买的产品 app发送支付请求到app store app store 处理支 ...

HBase 二次开发 java api和demo

HBase 二次开发 java api和demo的更多相关文章

随机推荐

热门专题