HBase第三章过滤器

1 列值过滤器

　　SingleColumnValueFilter 对列值进行过滤。

    @Test

    public void scanDataByFilter() throws IOException {

        Table table = connection.getTable(TableName.valueOf("user"));

        Scan scan = new Scan();

        SingleColumnValueFilter singleColumnValueFilter = new SingleColumnValueFilter(Bytes.toBytes("info1"),

                Bytes.toBytes("name"), CompareOp.GREATER, Bytes.toBytes("lisi"));

        scan.setFilter(singleColumnValueFilter);

        ResultScanner scanner = table.getScanner(scan);

        for (Result result : scanner) {

            byte[] name = result.getValue(Bytes.toBytes("info1"), Bytes.toBytes("name"));

            byte[] sex = result.getValue(Bytes.toBytes("info1"), Bytes.toBytes("sex"));

            byte[] age = result.getValue(Bytes.toBytes("info1"), Bytes.toBytes("age"));

            byte[] address = result.getValue(Bytes.toBytes("info1"), Bytes.toBytes("address"));

            System.out.println("name=" + Bytes.toString(name) + ",sex=" + Bytes.toInt(sex) + ",age=" + Bytes.toInt(age)

                    + ",address=" + Bytes.toString(address));

        }

    }

　　扫描全表，用过滤器进行匹配，找出出满足过滤条件的元素。

　　SingleColumnValueFilter

　　参数：列族、列名、操作符、列值

　　操作符可以为：

　　CompareOp.LESS：小于

　　CompareOp.LESS_OR_EQUAL：小于或者等于

　　CompareOp.EQUAL：等于

　　CompareOp.NOT_EQUAL：不等于

　　CompareOp.GREATER_OR_EQUAL：大于或者等于

　　CompareOp.GREATER：大于

　　CompareOp.NO_OP：不比较

2 列名前缀过滤器

　　ColumnPrefixFilter 对列名进行过滤

@Test

    public void scanDataByFilter2() throws IOException {

        Table table = connection.getTable(TableName.valueOf("user"));

        Scan scan = new Scan();

        ColumnPrefixFilter columnPrefixFilter = new ColumnPrefixFilter(Bytes.toBytes("name_"));

        scan.setFilter(columnPrefixFilter);

        ResultScanner scanner = table.getScanner(scan);

        for (Result result : scanner) {

            Cell[] rawCells = result.rawCells();

            for (Cell cell : rawCells) {

                System.out.println("value = " + Bytes.toString(CellUtil.cloneValue(cell)));

                System.out.println("family = " + Bytes.toString(CellUtil.cloneFamily(cell)));

                System.out.println("qualifier = " + Bytes.toString(CellUtil.cloneQualifier(cell)));

            }

        }

    }

　　找出user表中，以'name_'开头的列

3 多个列值前缀过滤器

    @Test

    public void testMultipleColumnPrefixFilter() throws IOException {

        Table table = connection.getTable(TableName.valueOf("user"));

        Scan scan = new Scan();

        byte[][] prefixes = new byte[][] { Bytes.toBytes("name"), Bytes.toBytes("age") };

        MultipleColumnPrefixFilter multipleColumnPrefixFilter = new MultipleColumnPrefixFilter(prefixes);

        scan.setFilter(multipleColumnPrefixFilter);

        ResultScanner scanner = table.getScanner(scan);

        for (Result result : scanner) {

            Cell[] rawCells = result.rawCells();

            for (Cell cell : rawCells) {

                System.out.println("value = " + Bytes.toString(CellUtil.cloneValue(cell)));

                System.out.println("family = " + Bytes.toString(CellUtil.cloneFamily(cell)));

                System.out.println("qualifier = " + Bytes.toString(CellUtil.cloneQualifier(cell)));

            }

        }

    }

　　用于匹配多列，找出以‘name’和‘age’开头的列

4 rowKey过滤器　　

@Test

    public void testRowFilter() throws IOException {

        Table table = connection.getTable(TableName.valueOf("user"));

        Scan scan = new Scan();

        RowFilter rowFilter = new RowFilter(CompareOp.EQUAL, new RegexStringComparator("^00004"));

        scan.setFilter(rowFilter);

        ResultScanner scanner = table.getScanner(scan);

        for (Result result : scanner) {

            Cell[] rawCells = result.rawCells();

            for (Cell cell : rawCells) {

                System.out.println("value = " + Bytes.toString(CellUtil.cloneValue(cell)));

                System.out.println("family = " + Bytes.toString(CellUtil.cloneFamily(cell)));

                System.out.println("qualifier = " + Bytes.toString(CellUtil.cloneQualifier(cell)));

            }

        }

    }

　　RegexStringComparator("^00004")正则计较器，支持正则表达式。过滤rowkey是以‘’00004‘开头的行。

HBase第三章过滤器的更多相关文章

HBase in Action前三章笔记
近期接触HBase,看了HBase In Action的英文版.開始认为还行,做了些笔记.可是兴许看下去,越来越感觉到实战这本书比較偏使用上的细节,对于HBase的具体设计涉及得很少.把前三章的一些笔 ...
Hbase学习（三）过滤器 java API
Hbase学习(三)过滤器 HBase 的基本 API,包括增.删.改.查等. 增.删都是相对简单的操作,与传统的 RDBMS 相比,这里的查询操作略显苍白,只能根据特性的行键进行查询(Get)或者根 ...
《Django By Example》第三章中文翻译（个人学习，渣翻）
书籍出处:https://www.packtpub.com/web-development/django-example 原作者:Antonio Melé (译者注:第三章滚烫出炉,大家请不要吐槽文中 ...
精通Web Analytics 2.0 （5）第三章：点击流分析的奇妙世界：指标
精通Web Analytics 2.0 : 用户中心科学与在线统计艺术第三章:点击流分析的奇妙世界:指标新的Web Analytics 2.0心态:搞定它.新的闪亮系列工具:是的.准备好了吗?当然 ...
Mysql技术内幕-笔记-第三章查询处理
第三章查询处理逻辑查询处理:(8) SELECT (9) DISTINCT <select_list> (1) FROM <left_table> (3) <join ...
第三章Hibernate关联映射
第三章Hibernate关联映射一.关联关系类与类之间最普通的关系就是关联关系,而且关联是有方向的. 以部门和员工为列,一个部门下有多个员工,而一个员工只能属于一个部门,从员工到部门就是多对一关联 ...
CentOS 7.4 初次手记：第三章 CentOS基础了解
第三章 CentOS基础了解... 36 第一节语言编码.终端... 36 I 查看语言编码... 36 II Tty?.pts/?. 36 第二节 bash/sh command. 38 I 查找 ...
[转]TEC1401.Report开发技术总结 - 第三章使用Oracle Reports开发报表-创建一个分组报表（2/4）
本文转自:http://blog.csdn.net/deepsea_allen/article/details/53900284 第三章创建一个分组报表 1. 建立数据模型数据模型用于 ...
CentOS6安装各种大数据软件第三章：Linux基础软件的安装
相关文章链接 CentOS6安装各种大数据软件第一章:各个软件版本介绍 CentOS6安装各种大数据软件第二章:Linux各个软件启动命令 CentOS6安装各种大数据软件第三章:Linux基础 ...

随机推荐

angular cli
1. 安装cnpm: npm install -g cnpm --registry=https://registry.npm.taobao.org 2. 安装angular/cli: cnpm ins ...
Vue动态实现评分效果
1.图片分为三种 on:half: off <style> .star{ font-size: 0; } .star-item{ display: inline-block; backg ...
map详讲<二>
查找元素: Map可以根据健来查找元素,提供方法find(key),如果是这个健对应的元素存在,则返回的是这个健的迭代器iterator,否则返回的是std::end(): 使用find()函数有点笨 ...
windows下更新npm的命令实现
Set-ExecutionPolicy Unrestricted -Scope CurrentUser -Force npm install -g npm-windows-upgrade npm-wi ...
AWR报告分析
AWR报告分析 awr报告是oracle 10g下提供的一种性能收集和分析工具,它能提供一个时间段内整个系统资源使用情况的报告,通过这个报告,我们就可以了解一个系统的整个运行情况,这就像一个人全面的体 ...
AMQ(approximate membership queries)介绍
目录简介举例 Bloom Filter 算法过程 1)位数组: 2)添加元素,k个独立hash函数 3)判断元素是否存在集合 Quotient Filter and Cascade Filter ...
orcal 数据库 maven架构 ssh框架的全xml环境模版及常见异常解决
创建maven项目后,毫不犹豫,超简单傻瓜式搞定dependencies(pom.xml 就是maven的依赖管理),这样你就有了所有你要的包 <project xmlns="http ...
NodeJ node.js基础
因为是Node服务器端的,怎样实现前台和后台请求以及回应 URL(由什么组成的 ),传输的内容:表单数据文件数据 [图片.压缩包.各种后缀文件] URL的组成 URL由三部分组成: 协议类型 , ...
Linux基础-5.利用vi编辑器创建和编辑正文文件
1.vi编辑器简介 1)掌握vi编辑器的定义:vi编辑器是Linux和Unix上最基本的文本编辑器,工作在字符模式下.由于不需要图形界面,vi是效率很高的文本编辑器.尽管在Linux上也有很多图形界面 ...
学习tp5的第二天（路由）
一.学习路由 1.phpstudy版本的环境去掉indx.php 直接访问url phpstudy配置的环境需要设置入口目录的 .htaccess文件如下: <IfModule mod_rew ...

HBase第三章 过滤器

1 列值过滤器

2 列名前缀过滤器

3 多个列值前缀过滤器

4 rowKey过滤器

HBase第三章 过滤器的更多相关文章

随机推荐

热门专题

HBase第三章过滤器

4 rowKey过滤器　　

HBase第三章过滤器的更多相关文章