Hive集成HBase
配置
将hive的lib/中的HBase.jar包用实际安装的Hbase的jar包替换掉
cd /opt/hive/lib/
ls hbase-0.94.2* 
rm -rf hbase-0.92*
cp /opt/hbase/hbase-0.94.2* 
将Hive的lib/中的zookeeper.jar包用HBase中lib/中的替换掉
步骤同上
 
在hive-site.xml中添加:
<property>
        <name>hive.aux.jars.path</name>
        <value>file:///opt/hive/lib/hive-hbase-handler-0.9.0.jar,file:///opt/hive/lib/hbase-0.94.2.jar,file:///opt/hive/lib/zookeeper-3.4.3.jar</value>
</property>
 
运行
cd /opt/hive/bin
./hive -hiveconf hbase.master=master:60000
 
 
流程如下:
先启动hbase,才能在hive里创建表;
在hive创建表后,在hbase你添加数据;
===========启动hbase,并在其中添加数据==============
[hadoop@localhost bin]$ cd /opt/hbase/bin 
[hadoop@localhost bin]$ ./start-hbase.sh
[hadoop@localhost bin]$ ./hbase shell
在hbase中添加数据
hbase(main):004:0> put 'htest','1','f:values','test'
hbase(main):005:0> scan 'htest'
 
===============启动hive,并创建表格===========
cd /opt/hive/bin
./hive -hiveconf hbase.master=master:60000
hive> create table htest(key int,value string) stored by 'org.apache.hadoop.hive.hbase.HBaseStorageHandler' with serdeproperties ('hbase.columns.mapping'=':key,f:value') tblproperties('hbase.table.name'='htest');
hive> show tables; 
hive> select * from htest;
 
 
 
安装Pig
解压并安装
tar -zxvf pig-0.10.0.tar.gz /opt/
mv pig-0.10.0/ pig
chown -R hadoop:hadoop pig
 
配置
因为pig/conf里没有xxx-en.vsh文件,所以在pig/bin理修改pig
cd /opt/pig/bin
vi pig
添加下面内容:
export JAVA_HOME=/usr/program/jdk1.6.0_13/
export PIG_INSTALL=/opt/pig
export HADOOP_INSTALL=/home/hadoop/hadoop-env/hadoop-1.0.1/
export PATH=$PIG_INSTALL/bin:HADOOP_INSTALL/bin:$PATH
export PIG_CLASSPATH=$HADOOP_INSTALL/conf
 
执行
先启动hadoop,再启动hivve
cd /opt/hive/bin
./pig
 
 
=======上传数据到hadoop hdfs=========================
 
hadoop fs -copyFromLocal /opt/data/test.txt /opt/data/test.txt 将电脑数据上传到hadoop fs中
hadoop fs -ls /opt/data/test.txt 
hadoop fs -cat /opt/data/test.txt
 
=========pig中显示数据========================
grunt>A = LOAD '/opt/data/test.txt' USING PigStorage('#') AS (id,name);
grunt> B = FOREACH A GENERATE name;
grunt> STORE B INTO 'opt/data/dist.txt' USING PigStorage('\t'); 
grunt> dump A;
 
 
 
Pig Latin常用命令
LOAD....USING PigStorage('')......AS......;
FOREACH......GENERATE......;
FILTER......BY......;
DUMP;
STORE......INTO;
GROUP ......BY;
 
[hadoop@localhost bin]$ hadoop fs -ls /user/hive/warehouse/my 
查看hive中的数据仓库

Hive集成HBase;安装pig的更多相关文章

  1. Hive集成HBase详解

    摘要 Hive提供了与HBase的集成,使得能够在HBase表上使用HQL语句进行查询 插入操作以及进行Join和Union等复杂查询   应用场景 1. 将ETL操作的数据存入HBase 2. HB ...

  2. 大数据技术之_11_HBase学习_02_HBase API 操作 + HBase 与 Hive 集成 + HBase 优化

    第6章 HBase API 操作6.1 环境准备6.2 HBase API6.2.1 判断表是否存在6.2.2 抽取获取 Configuration.Connection.Admin 对象的方法以及关 ...

  3. hive 集成 hbase NoClassDefFoundError: org/apache/htrace/Trace

    更新了hive版本后,在创建hive外部表 级联hbase 的时候报如下异常: hive (default)> create external table weblogs(id string,d ...

  4. Hive集成HBase实践

    #step1: create hive table 't_test' hive -e "create table test.t_user(id int,name string,age int ...

  5. Hortonwork Ambari配置Hive集成Hbase的java开发maven配置

    集群环境 ambari 2.7.3 hdp/hortonwork 2.6.0.3 maven <dependency> <groupId>org.apache.hive< ...

  6. hbase与hive集成:hive读取hbase中数据

    1.创建hbase jar包到hive lib目录软连接 hive需要jar包: hive-hbase-handler-0.13.1-cdh5.3.6.jar zookeeper-3.4.5-cdh5 ...

  7. 集成Hive和HBase

    1. MapReduce 用MapReduce将数据从本地文件系统导入到HBase的表中, 比如从HBase中读取一些原始数据后使用MapReduce做数据分析. 结合计算型框架进行计算统计查看HBa ...

  8. Hive On HBase实战

    1.概述 HBase是一款非关系型.分布式的KV存储数据库.用来存储海量的数据,用于键值对操作.目前HBase是原生是不包含SQL操作,虽然说Apache Phoenix可以用来操作HBase表,但是 ...

  9. hive和hbase整合的原因和原理

    为什么要进行hive和hbase的整合? hive是高延迟.结构化和面向分析的: hbase是低延迟.非结构化和面向编程的. Hive集成Hbase就是为了使用hbase的一些特性.或者说是中和它们的 ...

随机推荐

  1. mysql之高可靠

    6.mysql主-从备份 主-主备份,首先AB机要保持数据一致,即先手工备份A机数据,然后在B机上恢复,之后就很简单了,只需要在B机上创建一个同步账号,并在A机上输入B机的那些参数然后启动slave ...

  2. web编程

    展示层 html/css/javascript/jquery/jquery easyUI/ajax bootstrap web层 varnish/haproxy/squid----lvs/keepal ...

  3. Ansible Tower

    # Generated by iptables-save v1.4.7 on Tue Aug 23 04:58:34 2016 *filter :INPUT ACCEPT [0:0] :FORWARD ...

  4. 警告:隐式声明与内建函数'exit'不兼容解决方案

    警告:隐式声明与内建函数'exit'不兼容解决方案 #include <stdio.h> int main() { printf("hello world!/n"); ...

  5. 在CentOS 6.x中支持exfat格式的U盘(移动硬盘)

    参考资料:http://linux.cn/article-1503-1.html CentOS系列一直没有默认支持使用exfat格式的大容量U盘(移动硬盘),但可以通过添加fuse-exfat模块来支 ...

  6. PHP 模拟POST请求

    /** * 模拟post进行url请求 * @param string $url * @param array $post */ function request_post($url, $post = ...

  7. 搭建sonar,推动代码质量管理

    最近比较关注devops相关的文章,尝试搭建sonarqube服务,进行代码质量的分析和管理,先记录下本地环境的搭建和分析过程. 一.sonarqube服务搭建 官网地址:http://www.son ...

  8. R语言-基本图形

    barplot() 条形图 spine() 棘状图 pie() 饼图 hist() 直方图 plot(density(x))核密度图 boxplot(X) 箱线图 vioplot() 小提琴图 dot ...

  9. sqlserver2008 创建定时任务

    SQL2008如何创建定时作业?此方法也适应于Sql Server2005数据库,有兴趣的可以来看下! 1.打开[SQL Server Management Studio],在[对象资源管理器]列表中 ...

  10. Laravel学习笔记(五)数据库 数据库迁移案例2——创建数据结构,数据表,修改数据结构

    默认假设 所有的列在定义的时候都有默认的假设,你可以根据需要重写. Laravel假定每个表都有一个数值型的主键(通常命名为”id”),确保新加入的每一行都是唯一的.Laravel只有在每个表都有数值 ...