Hive集成HBase
配置
将hive的lib/中的HBase.jar包用实际安装的Hbase的jar包替换掉
cd /opt/hive/lib/
ls hbase-0.94.2* 
rm -rf hbase-0.92*
cp /opt/hbase/hbase-0.94.2* 
将Hive的lib/中的zookeeper.jar包用HBase中lib/中的替换掉
步骤同上
 
在hive-site.xml中添加:
<property>
        <name>hive.aux.jars.path</name>
        <value>file:///opt/hive/lib/hive-hbase-handler-0.9.0.jar,file:///opt/hive/lib/hbase-0.94.2.jar,file:///opt/hive/lib/zookeeper-3.4.3.jar</value>
</property>
 
运行
cd /opt/hive/bin
./hive -hiveconf hbase.master=master:60000
 
 
流程如下:
先启动hbase,才能在hive里创建表;
在hive创建表后,在hbase你添加数据;
===========启动hbase,并在其中添加数据==============
[hadoop@localhost bin]$ cd /opt/hbase/bin 
[hadoop@localhost bin]$ ./start-hbase.sh
[hadoop@localhost bin]$ ./hbase shell
在hbase中添加数据
hbase(main):004:0> put 'htest','1','f:values','test'
hbase(main):005:0> scan 'htest'
 
===============启动hive,并创建表格===========
cd /opt/hive/bin
./hive -hiveconf hbase.master=master:60000
hive> create table htest(key int,value string) stored by 'org.apache.hadoop.hive.hbase.HBaseStorageHandler' with serdeproperties ('hbase.columns.mapping'=':key,f:value') tblproperties('hbase.table.name'='htest');
hive> show tables; 
hive> select * from htest;
 
 
 
安装Pig
解压并安装
tar -zxvf pig-0.10.0.tar.gz /opt/
mv pig-0.10.0/ pig
chown -R hadoop:hadoop pig
 
配置
因为pig/conf里没有xxx-en.vsh文件,所以在pig/bin理修改pig
cd /opt/pig/bin
vi pig
添加下面内容:
export JAVA_HOME=/usr/program/jdk1.6.0_13/
export PIG_INSTALL=/opt/pig
export HADOOP_INSTALL=/home/hadoop/hadoop-env/hadoop-1.0.1/
export PATH=$PIG_INSTALL/bin:HADOOP_INSTALL/bin:$PATH
export PIG_CLASSPATH=$HADOOP_INSTALL/conf
 
执行
先启动hadoop,再启动hivve
cd /opt/hive/bin
./pig
 
 
=======上传数据到hadoop hdfs=========================
 
hadoop fs -copyFromLocal /opt/data/test.txt /opt/data/test.txt 将电脑数据上传到hadoop fs中
hadoop fs -ls /opt/data/test.txt 
hadoop fs -cat /opt/data/test.txt
 
=========pig中显示数据========================
grunt>A = LOAD '/opt/data/test.txt' USING PigStorage('#') AS (id,name);
grunt> B = FOREACH A GENERATE name;
grunt> STORE B INTO 'opt/data/dist.txt' USING PigStorage('\t'); 
grunt> dump A;
 
 
 
Pig Latin常用命令
LOAD....USING PigStorage('')......AS......;
FOREACH......GENERATE......;
FILTER......BY......;
DUMP;
STORE......INTO;
GROUP ......BY;
 
[hadoop@localhost bin]$ hadoop fs -ls /user/hive/warehouse/my 
查看hive中的数据仓库

Hive集成HBase;安装pig的更多相关文章

  1. Hive集成HBase详解

    摘要 Hive提供了与HBase的集成,使得能够在HBase表上使用HQL语句进行查询 插入操作以及进行Join和Union等复杂查询   应用场景 1. 将ETL操作的数据存入HBase 2. HB ...

  2. 大数据技术之_11_HBase学习_02_HBase API 操作 + HBase 与 Hive 集成 + HBase 优化

    第6章 HBase API 操作6.1 环境准备6.2 HBase API6.2.1 判断表是否存在6.2.2 抽取获取 Configuration.Connection.Admin 对象的方法以及关 ...

  3. hive 集成 hbase NoClassDefFoundError: org/apache/htrace/Trace

    更新了hive版本后,在创建hive外部表 级联hbase 的时候报如下异常: hive (default)> create external table weblogs(id string,d ...

  4. Hive集成HBase实践

    #step1: create hive table 't_test' hive -e "create table test.t_user(id int,name string,age int ...

  5. Hortonwork Ambari配置Hive集成Hbase的java开发maven配置

    集群环境 ambari 2.7.3 hdp/hortonwork 2.6.0.3 maven <dependency> <groupId>org.apache.hive< ...

  6. hbase与hive集成:hive读取hbase中数据

    1.创建hbase jar包到hive lib目录软连接 hive需要jar包: hive-hbase-handler-0.13.1-cdh5.3.6.jar zookeeper-3.4.5-cdh5 ...

  7. 集成Hive和HBase

    1. MapReduce 用MapReduce将数据从本地文件系统导入到HBase的表中, 比如从HBase中读取一些原始数据后使用MapReduce做数据分析. 结合计算型框架进行计算统计查看HBa ...

  8. Hive On HBase实战

    1.概述 HBase是一款非关系型.分布式的KV存储数据库.用来存储海量的数据,用于键值对操作.目前HBase是原生是不包含SQL操作,虽然说Apache Phoenix可以用来操作HBase表,但是 ...

  9. hive和hbase整合的原因和原理

    为什么要进行hive和hbase的整合? hive是高延迟.结构化和面向分析的: hbase是低延迟.非结构化和面向编程的. Hive集成Hbase就是为了使用hbase的一些特性.或者说是中和它们的 ...

随机推荐

  1. 如何在IDEA 中使用Git

    1,下载最新的 git 包 地址: https://git-scm.com/download/win 下载便携版 64,32 根据个人爱好   2,解压后随便放个位置即可,例如图: (不太建议使用它自 ...

  2. sqlserver和Oracle内部的错误数据修复(DBCC、DBMS_REPAIR)

    数据库长时间运行后,因断电.操作系统.物理存储等的原因可能会造成数据库内部的逻辑或物理错误,我们可以使用一般的方式尝试修复. 对于sqlserver 我们可以使用DBCC命令: -- sqlserve ...

  3. Oracle10g RAC关闭及启动步骤

    情况1:需要关闭DB(所有实例),OS及Server 停RAC的顺序是: 1)数据库 -〉 2)ASM   -〉 3)CRS a.首先停止Oracle10g环境 $ lsnrctl stop (每个节 ...

  4. 免装版tomcat注册成windows系统服务方法

    如果一台服务器要部署两个应用,而且又各自不受影响的话,只能使用两个端口两个tomcat分别管理 在这里吐槽一下tomcat,为毛停止服务就把所有应用都停了,更新其中一个,就要把所有的都停了,然后更新完 ...

  5. matlab global 不能传向量/矩阵

    matlab global 不能传向量/矩阵 只能传1个数值 而函数变量可以传向量/矩阵

  6. Python 文件常见操作

    # -*-coding:utf8 -*- ''''' Python常见文件操作示例 os.path 模块中的路径名访问函数 分隔 basename() 去掉目录路径, 返回文件名 dirname()  ...

  7. How to backup your blogs on cnblogs

    This is an alternative to OfflineExplorer. Thanks for this article[1] which is listed in Reference s ...

  8. AES--高级数据加密标准

    AES--高级数据加密标准 对称密码体制的发展趋势将以分组密码为重点.分组密码算法通常由密钥扩展算法和加密(解密)算法两部分组成.密钥扩展算法将b字节用户主密钥扩展成r个子密钥.加密算法由一个密码学上 ...

  9. C指针详解(经典,非常详细)

    前言:复杂类型说明要了解指针,多多少少会出现一些比较复杂的类型,所以我先介绍一下如何完全理解一个复杂类型,要理解复杂类型其实很简单,一个类型里会出现很多运算符,他们也像普通的表达式一样,有优先级,其优 ...

  10. oracle 导库建立测试库

    由于客户要定制的关系,需要对产品的数据进行相关的修改,所以需要复制原来的库出来,然后在此基础上再进行修改.步骤如下: 在PL/SQL下操作: /*分为四步 *//*第1步:创建临时表空间  */cre ...