apach hadoop2.6 集群利用Phoenix 4.6-hbase 批量导入并自动创建索引

基础环境：

1、安装apach 版本hadoop2.6

2、部署hbase1.0.0

3、下载phoenix-4.6.0-HBase-1.0。下载地址（http://mirror.nus.edu.sg/apache/phoenix/phoenix-4.6.0-HBase-1.0/bin/phoenix-4.6.0-HBase-1.0-bin.tar.gz）

4、phoenix 集成HBase ：将hoenix-4.6.0-HBase-1.0-server.jar拷贝到每一个RegionServer下的hbase lib目录下

配置hbse-site.xml 文件

在hbase-site.xml加入如下配置

  <property>

          <name>hbase.regionserver.wal.codec</name>

            <value>org.apache.hadoop.hbase.regionserver.wal.IndexedWALEditCodec</value>

            </property>

                    <property>

                      <name>hbase.regionserver.wal.codec</name>

                        <value>org.apache.hadoop.hbase.regionserver.wal.IndexedWALEditCodec</value>

                        </property>

<property>

  <name>hbase.region.server.rpc.scheduler.factory.class</name>

    <value>org.apache.hadoop.hbase.ipc.PhoenixRpcSchedulerFactory</value>

      <description>Factory to create the Phoenix RPC Scheduler that uses separate queues for index and metadata updates</description>

      </property>

<property>

  <name>hbase.rpc.controllerfactory.class</name>

    <value>org.apache.hadoop.hbase.ipc.controller.ServerRpcControllerFactory</value>

      <description>Factory to create the Phoenix RPC Scheduler that uses separate queues for index and metadata updates</description>

      </property>

<property>

  <name>hbase.coprocessor.regionserver.classes</name>

    <value>org.apache.hadoop.hbase.regionserver.LocalIndexMerger</value>

    </property>

<property>

  <name>hbase.master.loadbalancer.class</name>

    <value>org.apache.phoenix.hbase.index.balancer.IndexLoadBalancer</value>

    </property>

    <property>

      <name>hbase.coprocessor.master.classes</name>

        <value>org.apache.phoenix.hbase.index.master.IndexMasterObserver</value>

        </property>

否则在创建索引的时候会出现如下错误：

java.sql.SQLException: ERROR 1029 (42Y88): Mutable secondary indexes must have the hbase.regionserver.wal.codec property

set to org.apache.hadoop.hbase.regionserver.wal.IndexedWALEditCodec in the hbase-sites.xml of every region server tableName=INDEX_CUSTOM

5、进入phoenix 如下

6、创建表和索引

CREATE TABLE IF NOT EXISTS USPO (
state CHAR(2) NOT NULL,
city VARCHAR NOT NULL,
population BIGINT CONSTRAINT my_pk PRIMARY KEY (state,city));

create index index_pupulation on population(city,state);

查看表是否创建成功：

7、将测试数据上传到hdfs 上：

uopu.csv
NY,New York,8143197
CA,Los Angeles,3844829
IL,Chicago,2842518
TX,Houston,2016582
PA,Philadelphia,1463281
AZ,Phoenix,1461575
TX,San Antonio,1256509
CA,San Diego,1255540
TX,Dallas,1213825
CA,San Jose,912332

8、执行命令：

hadoop jar /home/hadoop/phoenix-4.6.0-HBase-1.0-bin/phoenix-4.6.0-HBase-1.0-client.jar org.apache.phoenix.mapreduce.CsvBulkLoadTool -t uspo -i /phoenix/uopu.csv -z node3,node4,node7:2181

会执行Mapredue过程

9、查询数据：

10、查询hbase数据

问题：

发现查询phoenix 上的uspo 数据是空的。

本文参考地址：https://phoenix.apache.org/secondary_indexing.html

apach hadoop2.6 集群利用Phoenix 4.6-hbase 批量导入并自动创建索引的更多相关文章

hadoop2.610集群配置(包含HA和Hbase )
.修改Linux主机名2.修改IP3.修改主机名和IP的映射关系######注意######如果你们公司是租用的服务器或是使用的云主机(如华为用主机.阿里云主机等)/etc/hosts里面要配置的是内 ...
Hadoop2.2集群安装配置-Spark集群安装部署
配置安装Hadoop2.2.0 部署spark 1.0的流程一.环境描写叙述本实验在一台Windows7-64下安装Vmware.在Vmware里安装两虚拟机分别例如以下主机名spark1(19 ...
Hadoop2.x 集群搭建
Hadoop2.x 集群搭建一些重复的细节参考Hadoop1.X集群完全分布式模式环境部署 1 HADOOP 集群搭建 1.1 集群简介 HADOOP 集群具体来说包含两个集群:HDFS 集群和YA ...
读者来信 | 刚搭完HBase集群，Phoenix一启动，HBase就全崩了，是什么原因?（已解决）
前言:之前有朋友加好友与我探讨一些问题,我觉得这些问题倒挺有价值的:于是就想在本公众号开设一个问答专栏,方便技术交流与分享,专栏名就定为:<读者来信>.如遇到本人能力有限难以解决的问题,我 ...
Hadoop HA高可用集群搭建（Hadoop+Zookeeper+HBase）
声明:作者原创,转载注明出处. 作者:帅气陈吃苹果一.服务器环境主机名 IP 用户名密码安装目录 master188 192.168.29.188 hadoop hadoop /home/ha ...
阿里云ECS服务器部署HADOOP集群（二）：HBase完全分布式集群搭建（使用外置ZooKeeper）
本篇将在阿里云ECS服务器部署HADOOP集群(一):Hadoop完全分布式集群环境搭建的基础上搭建,多添加了一个 datanode 节点 . 1 节点环境介绍: 1.1 环境介绍: 服务器:三台阿里 ...
Apache Hadoop集群离线安装部署(三)——Hbase安装
Apache Hadoop集群离线安装部署(一)——Hadoop(HDFS.YARN.MR)安装:http://www.cnblogs.com/pojishou/p/6366542.html Apac ...
Hadoop2.20集群搭建
hadoop2.0已经发布了稳定版本了,增加了很多特性,比如HDFS HA.YARN等. 注意:apache提供的hadoop-2.2.0的安装包是在32位操作系统编译的,因为hadoop依赖一些C+ ...
虚拟机centos6.5 --hadoop2.6集群环境搭建
一.环境说明虚拟机:virtualBox 系统:centos6.5,64位集群:3个节点 master 192.168.12.232 slave01 192.168.12.233 slave02 ...

随机推荐

input file转base64
不想用canvas转 <input type="file" id="file" accept="image/*" onchange=& ...
Linux（三）—— 项目部署环境搭建
目录项目部署环境搭建一.linux上网二.rpm包管理 1.光盘挂载 2.安装卸载rpm包 3.查询是否安装 4.查看软件包 5.互相依赖关系的软件包三.yum包管理 1.使用aliyun的y ...
Java不可变对象
在创建状态后无法更改其状态的对象称为不可变对象.一个对象不可变的类称为不可变类.不变的对象可以由程序的不同区域共享而不用担心其状态改变. 不可变对象本质上是线程安全的. 示例以下代码创建了不可变类的 ...
Eureka 系列（04）客户端源码分析
Eureka 系列(04)客户端源码分析 [TOC] 0. Spring Cloud 系列目录 - Eureka 篇在上一篇 Eureka 系列(01)最简使用姿态中对 Eureka 的简单用法做 ...
C# 网络编程 TcpListener
1.服务断代码 public partial class Server : Form { private bool lk = true; public Server() { InitializeCom ...
sql 查询库是否存在
网上查了很多,但是都是不完整的,很多坑,后面终于摸索出来了:DROP DATABASE IF EXISTS 库名(不要加引号); 这句话的意思就是如果库存在,就删除库,然后再新建库就行了.
【java】记录一下java的常用用法
1.二维数组 public static void main(String[] args) { //定义 int a[][] = {{1,2,3},{4,5,6},{7,8,9}}; int [][] ...
window 下搭建流媒体服务器ffmpeg nginx-rmtp-module
媒体介绍和需要下载需要软件 1.FFmpeg是一套可以用来记录.转换数字音频.视频,并能将其转化为流的开源计算机程序.在这里我只用到了它的视屏格式转换功能,将rtsp协议的视频流转成rtmp 2.ng ...
String转list
String l = "63, 47, 51, 35, 36, 52, 37, 53, 38, 54, 39, 55, 40, 56, 41, 57, 42";List<In ...
Nodejs常用代码段
1､利用createReadStream方式计算大文件的md5签名 const fs = require('fs'); const crypto = require('crypto'); let pa ...

apach hadoop2.6 集群利用Phoenix 4.6-hbase 批量导入并自动创建索引

apach hadoop2.6 集群利用Phoenix 4.6-hbase 批量导入并自动创建索引的更多相关文章

随机推荐

热门专题