HIVE部署安装(笔记)

1、下载hive:wget http://mirrors.cnnic.cn/apache/hive/hive-0.12.0/hive-0.12.0.tar.gz
2、解压hive安装文件 tar -zvxf hive-0.12.0.tar.gz
3、配置hive环境变量，初始化hive在hdfs上的工作目录（因此在部署hive之前，请确保已经完整的部署了hadoop，并设置好相关的环境，hadoop版本是2.2.0,才和此hive版本相符）
vi /etc/profile 添加环境变量值
export HIVE_HOME=/home/likehua/hive/hive-0.12.0
export PATH = $HIVE_HOME/bin:$PATH
source /etc/profile 使修改的环境变量立即生效

初始化hadoop 环境变量
./hadoop fs -mkdir /tmp
./hadoop fs -mkdir /usr/hive/warehouse
./hadoop fs -chmod g+w /tmp
./hadoop fs -chmod g+w /usr/hive/warehouse

配置hive相关的配置文件：/home/likehua/hive/hive-0.12.0/conf
讲hive-default.xml.template改为hive-site.xml
hive-log4j.properties.template改为hive-log4j.properties
hive-exec-log4j.properties.template改为hive-exec-log4j.properties

执行命令：cd $HIVE_HOME/bin ./hive
默认将会进入hive的控制台，执行：show tables;如果不出错，则表明默认版本的hive安装成功

(其实会报错，是一个xml的错误，没有想到hive的发布版，xml居然也会有错误，汗！xml的开始标签和结束标签要
一致，根据错误信息，将auth标签改为value，ok。

如果报错“SLF4J: Actual binding is of type [org.slf4j.impl.Log4jLoggerFactory]

MetaException(message:Version information not found in metastore. )” 则修改hive-site.xml中hive.metastore.schema.verification 为false

)。
默认版本hive的metastore保存在一个叫derby的数据库的，该
数据库是一个嵌入式数据库，如果同时有两个人或者多个人操作，就会报错。下面介绍，如果将hive的metasotre
信息保存到关系型数据库中，本文以oracle为例，具体步骤如下：
1）、下载oracle jdbc驱动 ojdbc6.jar，放到$HIVE_HOME/lib文件夹下，如果不存在lib则创建。
2）、修改$HIVE_HOME/conf下配置文件hive-site.xml。主要修改：连接字符串、驱动、用户名、密码等几处。
具体参数有：
连接字符串
<property>
   <name>javax.jdo.option.ConnectionURL</name>
   <value>jdbc:oracle:thin:@192.98.12.60:1521/ORCL</value>
   <description>[jdbc:thin:db11gx64.geoway.net/db11g]JDBC connect string for a JDBC metastore</description>
</property>
数据库jdbc驱动
<property>
  <name>javax.jdo.option.ConnectionDriverName</name>
  <value>oracle.jdbc.driver.OracleDriver</value>
   <description>Driver class name for a JDBC metastore</description>
</property>
用户名
<property>
   <name>javax.jdo.option.ConnectionUserName</name>
  <value>portal</value>
  <description>username to use against metastore database</description>
</property>
密码
<property>
   <name>javax.jdo.option.ConnectionPassword</name>
   <value>portal</value>
  <description>password to use against metastore database</description>
   </property>
   3）、将上面几处修改以后，在目录$HIVE_HOME/bin下执行./hive 命令进入控制台，执行show talbes;如果不报错，则
   表名部署成功，如果失败，则需要在日志文件中定位错误信息(在linux中部署程序，如果没有日志信息，那是很悲剧的。记得上面有修改配置文件的步骤
   hive-log4j.properties中，会记录日志的存放路径，默认路径：hive.log.dir=/tmp/${user.name}下面的hive.log文件里，${usr.name}表示
   登录的用户名。加入，登录用户为root，那么它的log日志访问路径为:/tmp/root/hive.log.)
       日志文件中的错误主要有以下几类：a、数据库驱动不存在。b、数据库连接参数错误。c、表或则视图不存在。
    第三种情况较多,因为当你修改默认的metastore存储方式时，在新的数据库中，很多元信息是没有初始化的。需要我们手动在目标数据库中初始化。有关
    初始化脚本存放在$HIVE_HOME/scripts/metastore/upgrade目录下，在该目录中默认会有derby、mysql、oracle、postgres几类数据库的初始化或者更新脚本。
    由于笔者使用oracle数据库，所以就进入$HIVE_HOME/scripts/metastore/upgrade/oracle目录，进去之后，你会发现有很多sql脚本，真是一团糟，不知道怎么更新
    或者初始化怎么办，教你一个土方法，那就是都执行一遍，然后来回启动hive，查看日志解决问题，最终会把问题解决的，但是，实际上有些规律的，找到
    010-HIVE-3072.oracle.sql、011-HIVE-3649.oracle.sql、012-HIVE-1362.oracle.sql、013-HIVE-3255.oracle.sql、014-HIVE-3764.oracle.sql这四个脚本依次执行
    ，由于我的hive的版本是hive-0.12.0，那么我再执行hive-schema-0.12.0.oracle.sql脚本，然后再进入hive shell执行，show tables；如果没有报错，那说明一切ok,
    如果还有错误，那么根据日志的错误信息，在网上搜索找到解决方案。

4)、另外一种方式来初始化hive在关系型数据库上的metastore的初始化，但是我一直没有初始化成功，那就是配置好hive以后执行命令 ./hive --service metastore,
此问题以后研究。

HIVE部署安装(笔记)的更多相关文章

Hadoop 2.2.0部署安装（笔记，单机安装）
SSH无密安装与配置具体配置步骤: ◎ 在root根目录下创建.ssh目录 (必须root用户登录) cd /root & mkdir .ssh chmod 700 .ssh & c ...
Hive的安装与部署（MySQL作为元数据库）
Hive的安装与部署(MySQL作为元数据) (开始之前确保Hadoop环境已经启动,确保Linux下的MySQL已经安装好) 1. 安装Hive (1)下载安装包可从apache上下载hi ...
【Hadoop离线基础总结】Hive的安装部署以及使用方式
Hive的安装部署以及使用方式安装部署 Derby版hive直接使用 cd /export/softwares 将上传的hive软件包解压:tar -zxvf hive-1.1.0-cdh5.14. ...
Docker学习笔记_04 Rancher的部署安装(编排选用K8S)
原文地址:http://dbase.cc/2018/01/12/docker/04_rancher的部署安装/ 为什么要使用Rancher Rancher是一个开源的企业级容器管理平台.通过Ranch ...
[Hadoop大数据]——Hive部署入门教程
Hive是为了解决hadoop中mapreduce编写困难,提供给熟悉sql的人使用的.只要你对SQL有一定的了解,就能通过Hive写出mapreduce的程序,而不需要去学习hadoop中的api. ...
HIve体系结构，hive的安装和mysql的安装，以及hive的一些简单使用
Hive体系结构: 是建立在hadoop之上的数据仓库基础架构. 和数据库相似,只不过数据库侧重于一些事务性的一些操作,比如修改,删除,查询,在数据库这块发生的比较多.数据仓库主要侧重于查询.对于相同 ...
_00024 尼娜抹微笑伊拉克_云计算ClouderaManager以及CHD5.1.0群集部署安装文档V1.0
笔者博文:妳那伊抹微笑 itdog8 地址链接 : http://www.itdog8.com(个人链接) 博客地址:http://blog.csdn.net/u012185296 博文标题:_000 ...
《Programming Hive》读书笔记（一）Hadoop和hive环境搭建
<Programming Hive>读书笔记(一)Hadoop和Hive环境搭建先把主要的技术和工具学好,才干更高效地思考和工作. Chapter 1.Int ...
hive的安装和升级
目录 [toc] 安装升级安装 nohup hive –service hiveserver & 启动: sudo nohup ./hive --service metastore &am ...

随机推荐

weighttp 使用
Weighttp 地址 http://redmine.lighttpd.net/projects/weighttp/wiki Weighttp的介绍:weighttp is a lightweigh ...
SQL SERVER中获取表间主外键关系
sql server 2008中的主外键关系获取方式: 转自:http://www.cnblogs.com/ke10/archive/2012/06/11/2544655.html SELECT OB ...
【洛谷】1852：[国家集训队]跳跳棋【LCA】【倍增？】
P1852 [国家集训队]跳跳棋题目背景原<奇怪的字符串>请前往 P2543 题目描述跳跳棋是在一条数轴上进行的.棋子只能摆在整点上.每个点不能摆超过一个棋子. 我们用跳跳棋来做一个 ...
bzoj 2150 最小路径覆盖
最小路径覆盖问题是:给定一个DAG,该DAG的一个路径覆盖是一个路径的集合,使得每个点属于且仅属于其中一条路径,问题就是求一个大小最小的路径集合. 做法是将每个点A拆成两个点A1,A2,如果A-> ...
PowerDesigner导出图片
但是通过上面导出的图片会比较模糊不清晰,但是可以通过这样解决: 1.放大设计,然后全选复制全部 2.打开画图工具 3.粘贴到画图工具
NAS（Network Attached Storage：网络附属存储）
NAS(Network Attached Storage:网络附属存储)按字面简单说就是连接在网络上,具备资料存储功能的装置,因此也称为"网络存储器".它是一种专用数据存储服务器. ...
linux内核源码中常见宏定义
http://blog.csdn.net/yangdelong/article/details/5508057
Geeks 一般二叉树的LCA
不是BST,那么搜索两节点的LCA就复杂点了,由于节点是无序的. 以下是两种方法,都写进一个类里面了. 当然须要反复搜索的时候.能够使用多种方法加速搜索. #include <iostream& ...
python性能优化建议
参考: https://segmentfault.com/a/1190000000666603 http://blog.csdn.net/zhoudaxia/article/details/23853 ...
[Shell学习笔记] 命令行下的高级网络工具cURL命令
原文: http://www.1987.name/365.html Linux curl命令是一个利用URL规则在命令行下工作的文件传输工具.它支持文件的上传和下载,所以是综合传输工具,但按传统,习惯 ...

HIVE部署安装(笔记)

HIVE部署安装(笔记)的更多相关文章

随机推荐

热门专题