HBase之四--(1)：Java操作Hbase进行建表、删表以及对数据进行增删改查，条件查询

1、搭建环境

新建JAVA项目，添加的包有:

有关Hadoop的hadoop-core-0.20.204.0.jar

有关Hbase的hbase-0.90.4.jar、hbase-0.90.4-tests.jar以及Hbase资源包中lib目录下的所有jar包

2、主要程序

package com.sf.study.hbase;

import java.io.IOException;

import java.util.ArrayList;

import java.util.List;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.hbase.HBaseConfiguration;

import org.apache.hadoop.hbase.HColumnDescriptor;

import org.apache.hadoop.hbase.HTableDescriptor;

import org.apache.hadoop.hbase.KeyValue;

import org.apache.hadoop.hbase.MasterNotRunningException;

import org.apache.hadoop.hbase.ZooKeeperConnectionException;

import org.apache.hadoop.hbase.client.Delete;

import org.apache.hadoop.hbase.client.Get;

import org.apache.hadoop.hbase.client.HBaseAdmin;

import org.apache.hadoop.hbase.client.HTable;

import org.apache.hadoop.hbase.client.HTablePool;

import org.apache.hadoop.hbase.client.Put;

import org.apache.hadoop.hbase.client.Result;

import org.apache.hadoop.hbase.client.ResultScanner;

import org.apache.hadoop.hbase.client.Scan;

import org.apache.hadoop.hbase.filter.CompareFilter.CompareOp;

import org.apache.hadoop.hbase.filter.Filter;

import org.apache.hadoop.hbase.filter.FilterList;

import org.apache.hadoop.hbase.filter.SingleColumnValueFilter;

import org.apache.hadoop.hbase.util.Bytes;

public class HbaseOperateTest {

    public static Configuration configuration;

    static {

        configuration = HBaseConfiguration.create();

        configuration.set("hbase.zookeeper.property.clientPort", "2181");

        configuration.set("hbase.zookeeper.quorum", "10.202.34.200");

        configuration.set("hbase.master", "http://10.202.34.200:16010");

    }

    public static void main(String[] args) {

         createTable("sfabc");

         insertData("sfabc");

         QueryAll("sfabc");

         QueryByCondition1("sfabc");

         QueryByCondition2("sfabc");

         QueryByCondition3("sfabc");

         deleteRow("sfabc","abcdef");

        deleteByCondition("sfabc", "abcdef");

    }

    /**

     * 创建表

     *

     * @param tableName

     */

    public static void createTable(String tableName) {

        System.out.println("start create table ......");

        try {

            HBaseAdmin hBaseAdmin = new HBaseAdmin(configuration);

            if (hBaseAdmin.tableExists(tableName)) {// 如果存在要创建的表，那么先删除，再创建

                hBaseAdmin.disableTable(tableName);

                hBaseAdmin.deleteTable(tableName);

                System.out.println(tableName + " is exist,detele....");

            }

            HTableDescriptor tableDescriptor = new HTableDescriptor(tableName);

            tableDescriptor.addFamily(new HColumnDescriptor("column1"));

            tableDescriptor.addFamily(new HColumnDescriptor("column2"));

            tableDescriptor.addFamily(new HColumnDescriptor("column3"));

            hBaseAdmin.createTable(tableDescriptor);

        } catch (MasterNotRunningException e) {

            e.printStackTrace();

        } catch (ZooKeeperConnectionException e) {

            e.printStackTrace();

        } catch (IOException e) {

            e.printStackTrace();

        }

        System.out.println("end create table ......");

    }

    /**

     * 插入数据

     *

     * @param tableName

     */

    public static void insertData(String tableName) {

        System.out.println("start insert data ......");

        HTablePool pool = new HTablePool(configuration, 1000);

        HTable table = (HTable) pool.getTable(tableName);

        Put put = new Put("112233bbbcccc".getBytes());// 一个PUT代表一行数据，再NEW一个PUT表示第二行数据,每行一个唯一的ROWKEY，此处rowkey为put构造方法中传入的值

        put.add("column1".getBytes(), null, "aaa".getBytes());// 本行数据的第一列

        put.add("column2".getBytes(), null, "bbb".getBytes());// 本行数据的第三列

        put.add("column3".getBytes(), null, "ccc".getBytes());// 本行数据的第三列

        try {

            table.put(put);

        } catch (IOException e) {

            e.printStackTrace();

        }

        System.out.println("end insert data ......");

    }

    /**

     * 删除一张表

     *

     * @param tableName

     */

    public static void dropTable(String tableName) {

        try {

            HBaseAdmin admin = new HBaseAdmin(configuration);

            admin.disableTable(tableName);

            admin.deleteTable(tableName);

        } catch (MasterNotRunningException e) {

            e.printStackTrace();

        } catch (ZooKeeperConnectionException e) {

            e.printStackTrace();

        } catch (IOException e) {

            e.printStackTrace();

        }

    }

    /**

     * 根据 rowkey删除一条记录

     *

     * @param tablename

     * @param rowkey

     */

    public static void deleteRow(String tablename, String rowkey) {

        try {

            HTable table = new HTable(configuration, tablename);

            List list = new ArrayList();

            Delete d1 = new Delete(rowkey.getBytes());

            list.add(d1);

            table.delete(list);

            System.out.println("删除行成功!");

        } catch (IOException e) {

            e.printStackTrace();

        }

    }

    /**

     * 组合条件删除

     *

     * @param tablename

     * @param rowkey

     */

    public static void deleteByCondition(String tablename, String rowkey) {

        // 目前还没有发现有效的API能够实现 根据非rowkey的条件删除 这个功能能，还有清空表全部数据的API操作

    }

    /**

     * 查询所有数据

     *

     * @param tableName

     */

    public static void QueryAll(String tableName) {

        HTablePool pool = new HTablePool(configuration, 1000);

        HTable table = (HTable) pool.getTable(tableName);

        try {

            ResultScanner rs = table.getScanner(new Scan());

            for (Result r : rs) {

                System.out.println("获得到rowkey:" + new String(r.getRow()));

                for (KeyValue keyValue : r.raw()) {

                    System.out.println(

                            "列：" + new String(keyValue.getFamily()) + "====值:" + new String(keyValue.getValue()));

                }

            }

        } catch (IOException e) {

            e.printStackTrace();

        }

    }

    /**

     * 单条件查询,根据rowkey查询唯一一条记录

     *

     * @param tableName

     */

    public static void QueryByCondition1(String tableName) {

        HTablePool pool = new HTablePool(configuration, 1000);

        HTable table = (HTable) pool.getTable(tableName);

        try {

            Get scan = new Get("abcdef".getBytes());// 根据rowkey查询

            Result r = table.get(scan);

            System.out.println("获得到rowkey:" + new String(r.getRow()));

            for (KeyValue keyValue : r.raw()) {

                System.out

                        .println("列：" + new String(keyValue.getFamily()) + "====值:" + new String(keyValue.getValue()));

            }

        } catch (IOException e) {

            e.printStackTrace();

        }

    }

    /**

     * 单条件按查询，查询多条记录

     *

     * @param tableName

     */

    public static void QueryByCondition2(String tableName) {

        try {

            HTablePool pool = new HTablePool(configuration, 1000);

            HTable table = (HTable) pool.getTable(tableName);

            Filter filter = new SingleColumnValueFilter(Bytes.toBytes("column1"), null, CompareOp.EQUAL,

                    Bytes.toBytes("aaa")); // 当列column1的值为aaa时进行查询

            Scan s = new Scan();

            s.setFilter(filter);

            ResultScanner rs = table.getScanner(s);

            for (Result r : rs) {

                System.out.println("获得到rowkey:" + new String(r.getRow()));

                for (KeyValue keyValue : r.raw()) {

                    System.out.println(

                            "列：" + new String(keyValue.getFamily()) + "====值:" + new String(keyValue.getValue()));

                }

            }

        } catch (Exception e) {

            e.printStackTrace();

        }

    }

    /**

     * 组合条件查询

     *

     * @param tableName

     */

    public static void QueryByCondition3(String tableName) {

        try {

            HTablePool pool = new HTablePool(configuration, 1000);

            HTable table = (HTable) pool.getTable(tableName);

            List<Filter> filters = new ArrayList<Filter>();

            Filter filter1 = new SingleColumnValueFilter(Bytes.toBytes("column1"), null, CompareOp.EQUAL,

                    Bytes.toBytes("aaa"));

            filters.add(filter1);

            Filter filter2 = new SingleColumnValueFilter(Bytes.toBytes("column2"), null, CompareOp.EQUAL,

                    Bytes.toBytes("bbb"));

            filters.add(filter2);

            Filter filter3 = new SingleColumnValueFilter(Bytes.toBytes("column3"), null, CompareOp.EQUAL,

                    Bytes.toBytes("ccc"));

            filters.add(filter3);

            FilterList filterList1 = new FilterList(filters);

            Scan scan = new Scan();

            scan.setFilter(filterList1);

            ResultScanner rs = table.getScanner(scan);

            for (Result r : rs) {

                System.out.println("获得到rowkey:" + new String(r.getRow()));

                for (KeyValue keyValue : r.raw()) {

                    System.out.println(

                            "列：" + new String(keyValue.getFamily()) + "====值:" + new String(keyValue.getValue()));

                }

            }

            rs.close();

        } catch (Exception e) {

            e.printStackTrace();

        }

    }

}

注意：可能大家没看到更新数据的操作，其实更新的操作跟添加完全一致，只不过是添加呢rowkey不存在，更新呢rowkey已经存在，并且timstamp相同的情况下，还有就是目前好像还没办法实现hbase数据的分页查询，不知道有没有人知道怎么做

HBase性能优化建议：

针对前面的代码，有很多不足之处，在此我就不修改上面的代码了，只是提出建议的地方，大家自己加上

1)配置

当你调用create方法时将会加载两个配置文件:hbase-default.xml and hbase-site.xml,利用的是当前的java类路径，代码中configuration设置的这些配置将会覆盖hbase-default.xml和hbase-site.xml中相同的配置,如果两个配置文件都存在并且都设置好了相应参上面的属性下面的属性即可

2)关于建表

public void createTable(HTableDescriptor desc)

HTableDescriptor 代表的是表的schema, 提供的方法中比较有用的有

setMaxFileSize，指定最大的region size

setMemStoreFlushSize 指定memstore flush到HDFS上的文件大小

增加family通过 addFamily方法

public void addFamily(final HColumnDescriptor family)

HColumnDescriptor代表的是column的schema，提供的方法比较常用的有

setTimeToLive:指定最大的TTL,单位是ms,过期数据会被自动删除。

setInMemory:指定是否放在内存中，对小表有用，可用于提高效率。默认关闭

setBloomFilter:指定是否使用BloomFilter,可提高随机查询效率。默认关闭

setCompressionType:设定数据压缩类型。默认无压缩。

setMaxVersions:指定数据最大保存的版本个数。默认为3。

注意的是，一般我们不去setInMemory为true,默认是关闭的

3)关于入库

官方建议

table.setAutoFlush(false); //数据入库之前先设置此项为false

table.setflushCommits();//入库完成后，手动刷入数据

注意：

在入库过程中，put.setWriteToWAL(true/flase);

关于这一项如果不希望大量数据在存储过程中丢失，建议设置为true,如果仅是在测试演练阶段，为了节省入库时间建议设置为false

4)关于获取表实例

HTablePool pool = new HTablePool(configuration, Integer.MAX_VALUE);

HTable table = (HTable) pool.getTable(tableName);

建议用表连接池的方式获取表，具体池有什么作用，我想用过数据库连接池的同学都知道，我就不再重复

不建议使用new HTable(configuration,tableName);的方式获取表

5)关于查询

建议每个查询语句都放入try catch语句块，并且finally中要进行关闭ResultScanner实例以及将不使用的表重新放入到HTablePool中的操作，具体做法如下

public static void QueryAll2(String tableName) throws IOException {

        HTablePool pool = new HTablePool(configuration, Integer.MAX_VALUE);

        HTable table = null;

        ResultScanner rs = null;

        try {

            Scan scan = new Scan();

            table = (HTable) pool.getTable(tableName);

            rs = table.getScanner(scan);

            for (Result r : rs) {

                System.out.println("获得到rowkey:" + new String(r.getRow()));

                for (KeyValue keyValue : r.raw()) {

                    System.out.println("列：" + new String(keyValue.getFamily())

                            + "====值:" + new String(keyValue.getValue()));

                }

            }

        } catch (IOException e) {

            e.printStackTrace();

        }finally{

            rs.close();// 最后还得关闭

            pool.putTable(table); //实际应用过程中，pool获取实例的方式应该抽取为单例模式的，不应在每个方法都重新获取一次(单例明白？就是抽取到专门获取pool的逻辑类中，具体逻辑为如果pool存在着直接使用，如果不存在则new)

        }

    }

所以，以上代码有缺陷的地方，感兴趣的同学可以针对优化建议作出相应修改

HBase之四--(1)：Java操作Hbase进行建表、删表以及对数据进行增删改查，条件查询的更多相关文章

HDFS只支持文件append操作, 而依赖HDFS的HBase如何完成数据的增删改查
转:http://www.th7.cn/db/nosql/201510/135382.shtml 1. HDFS的文件append功能早期版本的HDFS不支持任何的文件更新操作,一旦一个文件创建.写 ...
OracleHelper(对增删改查分页查询操作进行了面向对象的封装，对批量增删改操作的事务封装)
公司的一个新项目使用ASP.NET MVC开发,经理让我写个OracleHelper,我从网上找了一个比较全的OracleHelper类,缺点是查询的时候返回DataSet,数据增删改要写很多代码(当 ...
SQLAlchemy02 /SQLAlchemy对数据的增删改查操作、属性常用数据类型详解
SQLAlchemy02 /SQLAlchemy对数据的增删改查操作.属性常用数据类型详解目录 SQLAlchemy02 /SQLAlchemy对数据的增删改查操作.属性常用数据类型详解 1.用se ...
SQLAlchemy（二)：SQLAlchemy对数据的增删改查操作、属性常用数据类型详解
SQLAlchemy02 /SQLAlchemy对数据的增删改查操作.属性常用数据类型详解目录 SQLAlchemy02 /SQLAlchemy对数据的增删改查操作.属性常用数据类型详解 1.用se ...
利用Java针对MySql封装的jdbc框架类 JdbcUtils 完整实现(包含增删改查、JavaBean反射原理，附源码)
最近看老罗的视频,跟着完成了利用Java操作MySql数据库的一个框架类JdbcUtils.java,完成对数据库的增删改查.其中查询这块,包括普通的查询和利用反射完成的查询,主要包括以下几个函数接口 ...
利用Java针对MySql封装的jdbc框架类 JdbcUtils 完整实现(包括增删改查、JavaBean反射原理，附源代码)
近期看老罗的视频,跟着完毕了利用Java操作MySql数据库的一个框架类JdbcUtils.java,完毕对数据库的增删改查.当中查询这块,包含普通的查询和利用反射完毕的查询,主要包含以下几个函数接口 ...
Java Maven：spring boot + Mybatis连接MySQL，通用mapper的增删改查，映射实现多表查询
1. MySQL自带库test添加表user.role 角色表role 用户表user 2. 添加依赖,配置属性相关依赖:百度即可,此处略 application.properties spring ...
java使用原生MySQL实现数据的增删改查以及数据库连接池技术
一.工具类及配置文件准备工作 1.1 引入jar包使用原生MySQL,只需要用到MySQL连接的jar包,maven引用方式如下: <dependency> <groupId> ...
Yii数据库操作增删改查-[增加\查询\更新\删除 AR模式]
在Yii的开发中常常需要去使用Yii的增删改查方法,这些方法又可以多次变化和组合,带来全方位的实现对数据库的处理,下面对这些方法做一些简单的整理和梳理,有遗漏或是BUG,敬请指出.灰常感谢!!! 一. ...
Python教程：连接数据库，对数据进行增删改查操作
各位志同道合的同仁可以点击上方关注↑↑↑↑↑↑ 本教程致力于程序员快速掌握Python语言编程. 本文章内容是基于上次课程Python教程:操作数据库,MySql的安装详解和python基础知识之上 ...

随机推荐

disruptor 核心链路应用场景
核心链路一般比较复杂并且需要考虑:服务之间相互依赖性.流程能够走完.人员的变动等情况要考虑:兜底.补偿. 常见解决方案是:1)完全解耦 2)模板模式其他解决方案:1)有限状态机框架:spring- ...
C标准提前定义宏，调试时加打印非常实用
#include<stdio.h> int main(int argc, char *argv[]) { printf("File:[%s]\r\n", __FILE_ ...
uml精粹——10.状态机图
10.状态机图state machine diagram 状态机图是常见的描写叙述一个系统行为的技术. 在面向对象的方法中,为单个类绘制一个状态机图来展示单个对象的生命周期行为. 见图10.1 图 ...
Android4.42-Setting源代码分析之蓝牙模块Bluetooth（下）
接着上一篇Android4.42-Settings源代码分析之蓝牙模块Bluetooth(上) 继续蓝牙模块源代码的研究 THREE.蓝牙模块功能实现 switch的分析以及本机蓝牙重命名和可见性的分 ...
java开始到熟悉61
本此主题:多维数组----矩阵运算矩阵的运算规则是将对应位置的值进行运算,如上图所示. package array; public class Matrix { /** * 打印矩阵 * @para ...
openwrt gstreamer实例学习笔记（七. gstreamer 缓冲区(Buffers)和事件(Events)）
1)概述管道的数据流由一组缓冲区和事件组成,缓冲区包括实际的管道数据,事件包括控制信息,如寻找信息和流的终止信号.所有这些数据流在运行的时候自动的流过管道. 2) 缓冲区(Buffers) 缓冲区包 ...
Arcgis Engine（ae）接口详解（5）：IGeometry几何高级操作
IPoint point = new PointClass(); point.PutCoords(, ); //ITopologicalOperator接口用于几何对象的几何操作 ITopologic ...
reviews of learn python3 the hard way
Almost every time,I try my best to write a long review of the book I have read. But this time I want ...
sql建表，建索引注意事项
建表注意 .建议字段定义为NOT NULL 搜索引擎 MyISAM InnoDB 区别 InnoDB和MyISAM是许多人在使用MySQL时最常用的两个表类型,这两个表类型各有优劣,视具体应用而定.基 ...
Java程序员从笨鸟到菜鸟之（十五）Html基础积累总结（下）
本文来自:曹胜欢博客专栏.转载请注明出处:http://blog.csdn.net/csh624366188 一:表格 1.表格的基本语法 <table>...</table> ...

HBase之四--(1)：Java操作Hbase进行建表、删表以及对数据进行增删改查，条件查询

HBase之四--(1)：Java操作Hbase进行建表、删表以及对数据进行增删改查，条件查询的更多相关文章

随机推荐

热门专题