hbase 过滤器 rowfilter

HBase为筛选数据提供了一组过滤器，通过这个过滤器可以在HBase中的数据的多个维度（行，列，数据版本）上进行对数据的筛选操作，也就是说过滤器最终能够筛选的数据能够细化到具体的一个存储单元格上（由行键，列明，时间戳定位）。通常来说，通过行键，值来筛选数据的应用场景较多。

1.创建测试表studnet1

Vi Student1.java

import java.io.IOException;

import org.apache.hadoop.hbase.HBaseConfiguration;

import org.apache.hadoop.hbase.client.HBaseAdmin;

import org.apache.hadoop.hbase.client.HTable;

import org.apache.hadoop.hbase.HColumnDescriptor;

import org.apache.hadoop.hbase.HTableDescriptor;

import org.apache.hadoop.hbase.util.Bytes;

import org.apache.hadoop.hbase.client.Put;

public class Student1{

  public static void main(String[] args){

    HBaseConfiguration config = new HBaseConfiguration();

    config.set("hbase.zookeeper.quorum", "h201,h202,h203");

    String tablename = new String("student1");

   try{

    HBaseAdmin admin = new HBaseAdmin(config);

    if(admin.tableExists(tablename)){

       admin.disableTable(tablename);

       admin.deleteTable(tablename);

      }

     HTableDescriptor tableDesc = new HTableDescriptor(tablename);

     tableDesc.addFamily(new HColumnDescriptor("cf1"));

     admin.createTable(tableDesc);

     admin.close();

      HTable table = new HTable(config, Bytes.toBytes("student1"));

      Put put1 = new Put(Bytes.toBytes("a101"));

      put1.add(Bytes.toBytes("cf1"),Bytes.toBytes("name"),Bytes.toBytes("zs1"));

      Put put2 = new Put(Bytes.toBytes("a102"));

      put2.add(Bytes.toBytes("cf1"),Bytes.toBytes("name"),Bytes.toBytes("ls1"));

      Put put3 = new Put(Bytes.toBytes("a103"));

      put3.add(Bytes.toBytes("cf1"),Bytes.toBytes("name"),Bytes.toBytes("ww1"));

      table.put(put1);

      table.put(put2);

      table.put(put3);

      table.close();

    } catch(IOException e) {

            e.printStackTrace();

        }

  }

}

使用过滤器

1.1

RowFilter：筛选出匹配的所有的行，对于这个过滤器的应用场景，是非常直观的：使用BinaryComparator可以筛选出具有某个行键的行，或者通过改变比较运算符（CompareFilter.CompareOp.EQUAL）来筛选出符合某一条件的多条数据

RowFilter用于过滤row key

Operator	Description
LESS	小于
LESS_OR_EQUAL	小于等于
[EQUAL	等于
NOT_EQUAL	不等于
GREATER_OR_EQUAL	大于等于
GREATER	大于
NO_OP	排除所有

Comparator	Description
BinaryComparator	使用Bytes.compareTo()比较
BinaryPrefixComparator	和BinaryComparator差不多，从前面开始比较
RegexStringComparator	正则表达式
SubstringComparator	把数据当成字符串，用contains()来判断

import java.io.IOException;

import org.apache.hadoop.hbase.HBaseConfiguration;

import org.apache.hadoop.hbase.client.HTable;

import org.apache.hadoop.hbase.client.Scan;

import org.apache.hadoop.hbase.client.ResultScanner;

import org.apache.hadoop.hbase.client.Result;

import org.apache.hadoop.hbase.util.Bytes;

import org.apache.hadoop.hbase.KeyValue;

import org.apache.hadoop.hbase.filter.RowFilter;

import org.apache.hadoop.hbase.filter.Filter;

import org.apache.hadoop.hbase.filter.BinaryComparator;

import org.apache.hadoop.hbase.filter.CompareFilter;

public class hss1{

  public static void main(String[] args){

   HBaseConfiguration config = new HBaseConfiguration();

   config.set("hbase.zookeeper.quorum", "h201,h202,h203");

  try{

   HTable table = new HTable(config, Bytes.toBytes("student1"));

   Scan scan = new Scan();

   Filter filter1 = new RowFilter(CompareFilter.CompareOp.EQUAL,new BinaryComparator("a101".getBytes()));

   scan.setFilter(filter1);

   ResultScanner rst = table.getScanner(scan);

   for (Result r:rst){

      for (KeyValue kv : r.raw()) {

         StringBuffer s1 = new StringBuffer()

                            .append(Bytes.toString(kv.getRow())).append(":")

                             .append(Bytes.toString(kv.getFamily())).append(",")

                             .append(Bytes.toString(kv.getQualifier())).append(",")

                             .append(Bytes.toString(kv.getValue()));

        System.out.println(s1.toString());

     }

   }

    rst.close();

    table.close();

    } catch(IOException e) {

            e.printStackTrace();

        }

  }

}

1.2
PrefixFilter：筛选出具有特定前缀的行键的数据。这个过滤器所实现的功能其实也可以由RowFilter结合RegexStringComparator来实现，不过这里提供了一种简便的使用方法

import org.apache.hadoop.hbase.filter.PrefixFilter;
Filter filter2 = new PrefixFilter(Bytes.toBytes("a"));
scan.setFilter(filter2);

1.3
RegexComparator 正则过滤
import org.apache.hadoop.hbase.filter.RegexStringComparator;
Filter filter3 = new RowFilter(CompareFilter.CompareOp.EQUAL,new RegexStringComparator("^a.*"));
scan.setFilter(filter3);

hbase 过滤器 rowfilter的更多相关文章

HBase学习——4.HBase过滤器
1.过滤器基础API中的查询操作在面对大量数据的时候是非常苍白的,这里Hbase提供了高级的查询方法:Filter.Filter可以根据簇.列.版本等更多的条件来对数据进行过滤,基于Hbase本身提 ...
HBase（七）Hbase过滤器
一.过滤器(Filter) 基础API中的查询操作在面对大量数据的时候是非常苍白的,这里Hbase提供了高级的查询方法:Filter.Filter可以根据簇.列.版本等更多的条件来对数据进行过滤,基于 ...
Hbase过滤器
Hbase过滤器简介 HBase的基本API,包括增.删.改.查等,增.删都是相对简单的操作,与传统的RDBMS相比,这里的查询操作略显苍白,只能根据特性的行键进行查询(Get)或者根据行键的范围来查 ...
HBase 学习之路（七）——HBase过滤器详解
一.HBase过滤器简介 Hbase提供了种类丰富的过滤器(filter)来提高数据处理的效率,用户可以通过内置或自定义的过滤器来对数据进行过滤,所有的过滤器都在服务端生效,即谓词下推(predica ...
HBase 系列（七）——HBase 过滤器详解
一.HBase过滤器简介 Hbase 提供了种类丰富的过滤器(filter)来提高数据处理的效率,用户可以通过内置或自定义的过滤器来对数据进行过滤,所有的过滤器都在服务端生效,即谓词下推(predic ...
HBase过滤器（转载）
HBase为筛选数据提供了一组过滤器,通过这个过滤器可以在HBase中的数据的多个维度(行,列,数据版本)上进行对数据的筛选操作,也就是说过滤器最终能够筛选的数据能够细化到具体的一个存储单元格上(由行 ...
入门大数据---Hbase 过滤器详解
一.HBase过滤器简介 Hbase 提供了种类丰富的过滤器(filter)来提高数据处理的效率,用户可以通过内置或自定义的过滤器来对数据进行过滤,所有的过滤器都在服务端生效,即谓词下推(predic ...
Hadoop生态圈-Hbase过滤器（Filter）
Hadoop生态圈-Hbase过滤器(Filter) 作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任.
Hbase过滤器Filter的使用心得(爬坑经验)
Hbase 的过滤器是个好东西.. 给这种非关系型数据库本来不能复杂查询的情况得到了很好的扩展..提供了很多的帮助.. 但是Filter的种类何其之多..让人眼花缭乱.. 譬如..分页类型的PageF ...

随机推荐

cshtml中正则表达式使用后台代码
//定义变量 bool a = false; //正则表达式 string b = @" ^ (13[0 - 9] | 14[5 | 7] | 15[0 | 1 | 2 | 3 | 5 | ...
Java中三目运算符不为人知的坑
一.思考题以下代码可能有什么错误?为什么? import java.util.HashMap; import java.util.Map; public class Test { public st ...
boostrap中模态框显示在阴影之下
boostrap中模态框显示在阴影之下出现这种情况的原因我开始也搞了很久,问题出现在哪里呢? 有事问百度,在百度上查了一下资料,他们主要的解决办法:是修改标签的z-index属性的值, 我试着改了 ...
Android底部导航栏(可滑动)----TabLayout+viewPager
[TabLayout] ①TabLayout是选项卡,在屏幕空间有限的情况下,对不同的空间进行分组.属于android support design,更多的用于新闻上,如果放在底部也可做底部导航栏 ② ...
【普及篇】通信能力API及其前景分析
** 1.目前通信行业发展背景**运营商基础通信能力的价值逐渐提升进入数字化时代以来,信息产业正迎来新变革与新发展——网络信息技术与社会各领域全面深度融合,为工业制造.智慧城市等各行业赋能.运营商传统 ...
Cocoa包管理器之Carthage详解及CocoaPods中心化+Carthage的二进制化
上篇博客详细的聊了CocoaPods的相关内容,今天我们就来介绍另一个Cocoa的包管理器Carthage.在上家公司用Swift开发工程时,用的就是Carthage.Carthage诞生于14年11 ...
吴恩达机器学习笔记59-向量化：低秩矩阵分解与均值归一化（Vectorization: Low Rank Matrix Factorization & Mean Normalization）
一.向量化:低秩矩阵分解之前我们介绍了协同过滤算法,本节介绍该算法的向量化实现,以及说说有关该算法可以做的其他事情. 举例:1.当给出一件产品时,你能否找到与之相关的其它产品.2.一位用户最近看上一 ...
webpack打包The 'mode' option has not been set,错误提示
学习到webpack打包这个工具的时候,总是报错.在这里记录一下...... 我是window系统当使用npm安装好webpack后,你去查看如果出现一下问题. 出现以上问题,我的做法是先将web ...
使用 Moq 测试.NET Core 应用 -- 其它
第一篇文章, 关于Mock的概念介绍: https://www.cnblogs.com/cgzl/p/9294431.html 第二篇文章, 关于方法Mock的介绍: https://www.cnbl ...
DotNetCore跨平台~认识环境和环境变量
回到目录环境环境,对于开发来说就是部署的一种场景,你可以是调试场景,测试场景,生产场景,当然还可以有很多其它的场景,只要你的项目需要就可以自定义,微软帮我们定义了三种标准的环境变量,下面来说一下． ...

hbase 过滤器 rowfilter

hbase 过滤器 rowfilter的更多相关文章

随机推荐

热门专题