将CDH中的hive和hbase相互整合使用

一、.hbase与hive的兼容版本：

hive0.90与hbase0.92是兼容的，早期的hive版本与hbase0.89/0.90兼容，不需要自己编译。

hive1.x与hbase0.98.x或则更低版本是兼容的，不需要自己编译。

hive2.x与hbase1.x及比hbase1.x更高版本兼容，不需要自己编译。

hive 1.x 与 hbase 1.x整合时，需要自己编译

二、.hbase与hive的整合过程：

1.修改 hive 的conf目录下 hive-site.xml文件

<property>

                <name>hive.zookeeper.quorum</name>

                <value>node1,node2,node3</value>

          </property>

          <property>

                <name>hive.server2.enable.doAs</name>

                <value>false</value>

          </property>

1.可通过Hive -> 操作 -> 下载客户端配置的方式查看hive-site.xml文件内容，可得知 hive.zookeeper.quorum 配置的内容，默认配置即为 node1,node2,node3 即可。

2.可得知 hive.server2.enable.doAs 默认为 true，推荐修改为false，否则在使用官方推荐的hiveserver2/beeline的方式操作时，在利用HQL语句创建HBase时可能会出现异常。

3.可通过Hive -> 配置 -> 搜索栏中搜索 hive.server2.enable.doAs ，默认为勾选，取消勾选即可，即能修改配置为 false。

再当我们通过Hive -> 操作 -> 下载客户端配置的方式查看hive-site.xml文件内容，即可查看到hive.server2.enable.doAs已为false

2.重启 hive、hbase

3.使用命令 beeline -u jdbc:hive2://node1:10000 -n root 进行连接

4.HIVE执行创建表语句：hbase表映射 hive表，写入的数据存储在 hbase表中，"hbase.mapred.output.outputtable"可指定数据写入到hbase表中

1.create database rimengshe;

2.use rimengshe;

3.创建hive表的同时也会创建出hbase表

# Hive中的表名test_tb；key字段映射hbase表中的rowkey；value字段映射cf1列簇下的val字段

CREATE TABLE ushio(key int, value string)

# 指定存储处理器

STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler'

# 声明列簇，列名

WITH SERDEPROPERTIES ("hbase.columns.mapping" = ":key,cf1:val")

# hbase.table.name声明HBase表名，为可选属性默认与Hive的表名相同

# hbase.mapred.output.outputtable指定插入数据时写入的表，如果以后需要往该表插入数据就需要指定该值

TBLPROPERTIES ("hbase.table.name" = "ushio", "hbase.mapred.output.outputtable" = "ushio");

3.hbase表中添加数据：put '表名','rowkey值','列簇名:列名','列值'

put 'ushio','98','cf1:val','val_98'

put 'ushio','99','cf1:val','val_99'

put 'ushio','100','cf1:val','val_100'

4.hive表中添加数据：（会运行yarn）INSERT INTO table_name (field1, field2,...fieldN ) VALUES (value1, value2,...valueN );

insert into ushio values(2,'ushio');

5.hbase表查询表中的所有数据：scan '表名'

scan 'ushio'

6.hive表查询表中的所有数据：

select * from ushio;

将CDH中的hive和hbase相互整合使用的更多相关文章

hive与hbase的整合
Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为MapReduce任务进行运行.其优点学习成本低,可以通过类S ...
Hive与Hbase关系整合
近期工作用到了Hive与Hbase的关系整合,虽然从网上参考了很多的资料,但是大多数讲的都不是很细,于是决定将这块知识点好好总结一下供大家分享,共同掌握! 本篇文章在具体介绍Hive与Hbase整合之 ...
Hadoop Hive与Hbase关系整合
用hbase做数据库,但因为hbase没有类sql查询方式,所以操作和计算数据很不方便,于是整合hive,让hive支撑在hbase数据库层面的 hql查询.hive也即做数据仓库 1. 基于Ha ...
Hadoop Hive与Hbase整合+thrift
Hadoop Hive与Hbase整合+thrift 1. 简介 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句 ...
数据导入(一):Hive On HBase
Hive集成HBase可以有效利用HBase数据库的存储特性,如行更新和列索引等.在集成的过程中注意维持HBase jar包的一致性.Hive与HBase的整合功能的实现是利用两者本身对外的API接口 ...
集成Hive和HBase
1. MapReduce 用MapReduce将数据从本地文件系统导入到HBase的表中, 比如从HBase中读取一些原始数据后使用MapReduce做数据分析. 结合计算型框架进行计算统计查看HBa ...
hive和hbase整合的原因和原理
为什么要进行hive和hbase的整合? hive是高延迟.结构化和面向分析的: hbase是低延迟.非结构化和面向编程的. Hive集成Hbase就是为了使用hbase的一些特性.或者说是中和它们的 ...
大数据工具篇之Hive与HBase整合完整教程
大数据工具篇之Hive与HBase整合完整教程一.引言最近的一次培训,用户特意提到Hadoop环境下HDFS中存储的文件如何才能导入到HBase,关于这部分基于HBase Java API的写入方 ...
十、Hadoop学习笔记————Hive与Hbase以及RDBMS（关系型数据库）的关系
Hive目的是为了简化MapReduce编程实际应用中,Hive与Hbase不经常链接

随机推荐

Go语言学习——如何实现一个过滤器
1.过滤器使用场景做业务的时候我们经常要使用过滤器或者拦截器(听这口音就是从Java过来的).常见的场景如一个HTTP请求,需要经过鉴权过滤器.白名单校验过滤.参数验证过滤器等重重关卡最终拿到数据. ...
StackOverflow 周报 - 这些高关注的问题你是否都会
我从 Stack Overflow 上找的了一些高关注度且高赞的问题.这些问题可能平时我们遇不到,但既然是高关注的问题和高点赞的回答说明是被大家普遍认可的,如果我们提前学到了以后不管工作中还是面试中处 ...
JS实现停留几秒sleep，Js中for循环的阻塞机制，setTimeout延迟执行
//第一种,使用while循环 function sleep(delay) { var start = (new Date()).getTime(); while((new Date()).getTi ...
springboot2.X 使用spring-data组件对MongoDB做CURD
springboot2.X 使用spring-data组件对MongoDB做CURD 使用背景基于快速开发,需求不稳定的情况, 我决定使用MongoDB作为存储数据库,搭配使用spring-data ...
C# 本地xml文件进行增删改查
项目添加XML文件:FaceXml.xml,并复制到输出目录 FaceXml.xml <?xml version="1.0" encoding="utf-8&quo ...
第7章使用springMVC构建Web应用程序 7.1 springMVC配置
最近在看spring in action第3版,这里搭建一个简单的spring mvc,也算书没白看,当然老鸟可以不屑了,这里只是给自己做个笔记,配置也尽量删烦就简, Spring MVC的核心是Di ...
渗透之路基础 -- SQL进阶（盲注和报错注入）
SQL注入之盲注实战过程中,大多情况下很少会有回显,这个时候就要去使用盲注技术盲注,Blind SQL Injection,听这名字就感觉整个过程就是一个盲目的过程当注入时,没有任何提示的时候, ...
Webstorm 的设置
背景色
自定义Hive UDAF 实现相邻去重
内置的两个聚合函数(UDAF) collect_list():多行字符串拼接为一行collect_set():多行字符串拼接为一行并去重多行字符串拼接为一行并相邻去重UDAF:Concat() con ...
Erlcron分析学习
介绍 Erlcron实现类似Linux下面的cron的计划任务. 源码下载地址:https://github.com/erlware/erlcron 原理 Erlcron进程监控树 ecrn_cron ...

将CDH中的hive和hbase相互整合使用

将CDH中的hive和hbase相互整合使用的更多相关文章

随机推荐

热门专题