参考:

Phoenix与HBase集成进行数据分析

HBase查询速度慢原因排查

操作1,执行查询,如下:

: jdbc:phoenix:node3::/hbase> SELECT * FROM ASSET_RECORD WHERE ASSET_ID='设345-1149640126759047168';
+-----------------------------------+---------------------------+-------------------+---------------+-----------------------------------+--------+
|                ID                 |         ASSET_ID          | MANAGEMENT_TABLE  | INTRODUCTION  |           MANAGEMENT_ID           |        |
+-----------------------------------+---------------------------+-------------------+---------------+-----------------------------------+--------+
| 0292ebbfdf3e4d97a6e9fc930ed126d4  | 设345-  | ASSET_SEAL        |               | dd9ff0fc0ad4486bb0812e78fa53ce0e  | - |
+-----------------------------------+---------------------------+-------------------+---------------+-----------------------------------+--------+
 row selected (0.081 seconds)

操作2,重复以上查询,如下:

: jdbc:phoenix:node3::/hbase> SELECT * FROM ASSET_RECORD WHERE ASSET_ID='设345-1149640126759047168';
+-----------------------------------+---------------------------+-------------------+---------------+-----------------------------------+--------+
|                ID                 |         ASSET_ID          | MANAGEMENT_TABLE  | INTRODUCTION  |           MANAGEMENT_ID           |        |
+-----------------------------------+---------------------------+-------------------+---------------+-----------------------------------+--------+
| 0292ebbfdf3e4d97a6e9fc930ed126d4  | 设345-  | ASSET_SEAL        |               | dd9ff0fc0ad4486bb0812e78fa53ce0e  | - |
+-----------------------------------+---------------------------+-------------------+---------------+-----------------------------------+--------+
 row selected (0.077 seconds)

操作3,使用explain重复以上查询,如下:

: jdbc:phoenix:node3::/hbase> explain SELECT * FROM ASSET_RECORD WHERE ASSET_ID='设345-1149640126759047168';
+----------------------------------------------------------------------------------------------------+-----------------+----------------+--------+
|                                                PLAN                                                | EST_BYTES_READ  | EST_ROWS_READ  |  EST_I |
+----------------------------------------------------------------------------------------------------+-----------------+----------------+--------+
| CLIENT -CHUNK  ROWS  BYTES PARALLEL -WAY ROUND ROBIN FULL SCAN OVER ASSET_RECORD  |        |          |  |
|     SERVER FILTER BY ASSET_ID =        |          |  |
+----------------------------------------------------------------------------------------------------+-----------------+----------------+--------+
 rows selected (0.015 seconds)

操作4,在表上建索引,如下:

: jdbc:phoenix:node3::/hbase> create index IDX_ASSET_RECORD on ASSET_RECORD(ASSET_ID,MANAGEMENT_TABLE);
, rows affected (6.25 seconds)

操作5,强制使用索引执行查询,如下:

: jdbc:phoenix:node3::/hbase> SELECT /*+ INDEX(ASSET_RECORD IDX_ASSET_RECORD)*/ * FROM ASSET_RECORD WHERE ASSET_ID='设345-1149640126759047168;
+-----------------------------------+---------------------------+-------------------+---------------+-----------------------------------+--------+
|                ID                 |         ASSET_ID          | MANAGEMENT_TABLE  | INTRODUCTION  |           MANAGEMENT_ID           |        |
+-----------------------------------+---------------------------+-------------------+---------------+-----------------------------------+--------+
| 0292ebbfdf3e4d97a6e9fc930ed126d4  | 设345-  | ASSET_SEAL        |               | dd9ff0fc0ad4486bb0812e78fa53ce0e  | - |
+-----------------------------------+---------------------------+-------------------+---------------+-----------------------------------+--------+
 row selected (0.058 seconds)

操作6,强制使用索引执行查询,如下:

: jdbc:phoenix:node3::/hbase> SELECT /*+ INDEX(ASSET_RECORD IDX_ASSET_RECORD)*/ * FROM ASSET_RECORD WHERE ASSET_ID='设345-1149640126759047168';
+-----------------------------------+---------------------------+-------------------+---------------+-----------------------------------+--------+
|                ID                 |         ASSET_ID          | MANAGEMENT_TABLE  | INTRODUCTION  |           MANAGEMENT_ID           |        |
+-----------------------------------+---------------------------+-------------------+---------------+-----------------------------------+--------+
| 0292ebbfdf3e4d97a6e9fc930ed126d4  | 设345-  | ASSET_SEAL        |               | dd9ff0fc0ad4486bb0812e78fa53ce0e  | - |
+-----------------------------------+---------------------------+-------------------+---------------+-----------------------------------+--------+
 row selected (0.033 seconds)

操作7,使用explain强制使用索引执行查询,如下:

: jdbc:phoenix:node3::/hbase> explain SELECT /*+ INDEX(ASSET_RECORD IDX_ASSET_RECORD)*/ * FROM ASSET_RECORD WHERE ASSET_ID='设345-114964012679047168';
+------------------------------------------------------------------------------------------------------------------+-----------------+-----------+
|                                                       PLAN                                                       | EST_BYTES_READ  | EST_ROWS_ |
+------------------------------------------------------------------------------------------------------------------+-----------------+-----------+
| CLIENT -CHUNK  ROWS  BYTES PARALLEL -WAY ROUND ROBIN FULL SCAN OVER ASSET_RECORD                | null            | null      |
|     SKIP-SCAN-JOIN TABLE                                                                                        | null            | null      |
|         CLIENT -CHUNK PARALLEL -WAY ROUND ROBIN RANGE SCAN OVER IDX_ASSET_RECORD ['设345-1149640126759047168']  | null            | null      |
|             SERVER FILTER BY FIRST KEY ONLY                                                                      | null            | null      |
|     DYNAMIC SERVER FILTER BY .$)                                                      | null            | null      |
+------------------------------------------------------------------------------------------------------------------+-----------------+-----------+
 rows selected (0.045 seconds)

操作8,删除索引,如下:

: jdbc:phoenix:node3::/hbase> drop index IDX_ASSET_RECORD on ASSET_RECORD;
No rows affected (3.688 seconds)

计算操作1和操作2的平均执行时间,建索引后,计算操作5和操作6的平均执行时间,经比较发现使用索引确实提高了查询的速度。

Phoenix具有索引同步更新机制,增删改一条或多条数据以后,索引会自动更新;但是,如果原来的表增加了字段,那就需要更新建在表上的索引。

表的属性越多,条目越多,建索引节约的时间越多,如下是82个属性和195821条记录的表:

: jdbc:phoenix:node3::/hbase> SELECT COUNT(*) FROM ASSET_NORMAL;
+-----------+
| COUNT()  |
+-----------+
|     |
+-----------+
 row selected (4.54 seconds)
: jdbc:phoenix:node3::/hbase> create index IDX_ASSET_NORMAL on ASSET_NORMAL(ASSET_ID,ASSET_NAME,USER_ID);
, rows affected (8.887 seconds)
: jdbc:phoenix:node3::/hbase> SELECT /*+ INDEX(ASSET_NORMAL IDX_ASSET_NORMAL)*/ * FROM ASSET_NORMAL WHERE ASSET_ID='仪1-1151470269278326784';
+-----------------------------------+-------------------------+-------------+------------------------+--------------------------+----------------+
|                ID                 |        ASSET_ID         | ASSET_NAME  | ASSET_FIRST_DEGREE_ID  | ASSET_FIRST_DEGREE_NAME  | ASSET_SECOND_D |
+-----------------------------------+-------------------------+-------------+------------------------+--------------------------+----------------+
| 002e028151e24b07a21e0a0e9ce7f74c  | 仪1-  | 测量仪器        |                 | 仪表                       |      |
+-----------------------------------+-------------------------+-------------+------------------------+--------------------------+----------------+
 row selected (0.209 seconds)
: jdbc:phoenix:node3::/hbase> SELECT * FROM ASSET_NORMAL WHERE ASSET_ID='仪1-1151470269278326784';
+-----------------------------------+-------------------------+-------------+------------------------+--------------------------+----------------+
|                ID                 |        ASSET_ID         | ASSET_NAME  | ASSET_FIRST_DEGREE_ID  | ASSET_FIRST_DEGREE_NAME  | ASSET_SECOND_D |
+-----------------------------------+-------------------------+-------------+------------------------+--------------------------+----------------+
| 002e028151e24b07a21e0a0e9ce7f74c  | 仪1-  | 测量仪器        |                 | 仪表                       |      |
+-----------------------------------+-------------------------+-------------+------------------------+--------------------------+----------------+
 row selected (4.306 seconds)

参考:

https://my.oschina.net/puwenchao/blog/1935302

基于Phoenix对HBase建索引的更多相关文章

  1. hbase建索引的两种方式

    转载自http://blog.csdn.net/ryantotti/article/details/13295325 在二级索引的实现技术上一般有几个方案: 1.      表索引 使用单独的hbas ...

  2. Spark教程——(6)Spark-shell基于Phoenix访问HBase数据

    package statistics import common.util.timeUtil import org.apache.spark.{SparkConf, SparkContext} imp ...

  3. phoenix中添加二级索引

    Phoenix创建Hbase二级索引 官方文档 1. 配置Hbase支持Phoenix创建二级索引   1.  添加如下配置到Hbase的Hregionserver节点的hbase-site.xml  ...

  4. phoenix连接hbase数据库,创建二级索引报错:Error: org.apache.phoenix.exception.PhoenixIOException: Failed after attempts=36, exceptions: Tue Mar 06 10:32:02 CST 2018, null, java.net.SocketTimeoutException: callTimeou

    v\:* {behavior:url(#default#VML);} o\:* {behavior:url(#default#VML);} w\:* {behavior:url(#default#VM ...

  5. HBase之八--(2):HBase二级索引之Phoenix

    1. 介绍 Phoenix 是 Salesforce.com 开源的一个 Java 中间件,可以让开发者在Apache HBase 上执行 SQL 查询.Phoenix完全使用Java编写,代码位于 ...

  6. 「从零单排HBase 12」HBase二级索引Phoenix使用与最佳实践

    Phoenix是构建在HBase上的一个SQL层,能让我们用标准的JDBC APIs对HBase数据进行增删改查,构建二级索引.当然,开源产品嘛,自然需要注意“避坑”啦,阿丸会把使用方式和最佳实践都告 ...

  7. 通过phoenix在hbase上创建二级索引,Secondary Indexing

    环境描述: 操作系统版本:CentOS release 6.5 (Final) 内核版本:2.6.32-431.el6.x86_64 phoenix版本:phoenix-4.10.0 hbase版本: ...

  8. Hadoop生态圈-phoenix(HBase)的索引配置

    Hadoop生态圈-phoenix(HBase)的索引配置 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 创建索引是为了优化查询,我们可以在phoenix上配置索引方式. 一.修改 ...

  9. Phoenix系列:二级索引(1)

    Phoenix使用HBase作为后端存储,对于HBase来说,我们通常使用字典序的RowKey来快速访问数据,除此之外,也可以使用自定义的Filter来搜索数据,但是它是基于全表扫描的.而Phoeni ...

随机推荐

  1. 「luogu3380」【模板】二逼平衡树(树套树)

    「luogu3380」[模板]二逼平衡树(树套树) 传送门 我写的树套树--线段树套平衡树. 线段树上的每一个节点都是一棵 \(\text{FHQ Treap}\) ,然后我们就可以根据平衡树的基本操 ...

  2. 基于MACVLAN配置VMWARE虚拟机中容器网络

    基于MACVLAN配置VMWARE虚拟机中容器网络 测试部环境组 201711 0 文档说明 MACVLAN是docker的一种支持跨主机网络的driver.macvlan本身是linux kerne ...

  3. laravel 邮箱认证

    修改 User 模型,将 Laravel 自带的邮箱认证功能集成到我们的程序中 <?php namespace App\Models; use Illuminate\Notifications\ ...

  4. 无数据库模式kong/kong-ingress-controller

    apiVersion: v1kind: Namespacemetadata:  name: kong---apiVersion: apiextensions.k8s.io/v1beta1kind: C ...

  5. ANSYS 瞬态热分析--样件加热

    目录 1. 要求 2. ANSYS有限元分析 2.1 APDL建模 1. 要求 一块0.8m*0.4m*0.2m厚的钢板,在300℃的炉子中进行加热,其材料参数如下表所示: 材料参数 序号 名称 参数 ...

  6. openjudge 和为给定数(二分答案)

    嗯... 题目链接:http://noi.openjudge.cn/ch0111/07/ 这道题是一道不太明显,但很好二分的二分答案的一道题... 首先排序(二分要满足单调性),然后枚举每一个数,在[ ...

  7. leetCode练题——20. Valid Parentheses

    1.题目 20. Valid Parentheses——Easy  Given a string containing just the characters '(', ')', '{', '}',  ...

  8. Vulnhub_bossplayersCTF 记录

    目录 经验 & 总结 步骤流水 经验 & 总结 CTF这种东西还是有一些脑洞和约定俗成的东西: 比如多次编码 比如cmd参数传入执行的命令 步骤流水 端口信息搜集nmap -A 192 ...

  9. 项目中常用的全局宏定义#define

    一 关于屏幕大小 #pragma mark - 屏幕宽高 #define SCREEN_BOUNDS ([UIScreen mainScreen].bounds) #define SCREEN_WID ...

  10. openstack搭建之旅(原创)

    1.什么是openstack是一个集中管理虚拟机的平台,整合了各种虚拟化的技术.虚拟机的具体创建交给具体的虚拟化技术实现,而Openstack是整合这些虚拟化技术,提供一个统一管理的视图,对虚拟机进行 ...