Spark入门到精通--（第九节）环境搭建（Hive搭建）

　　上一节搭建完了Hadoop集群，这一节我们来搭建Hive集群，主要是后面的Spark SQL要用到Hive的环境。

Hive下载安装

　　下载Hive 0.13的软件包，可以在百度网盘进行下载。链接: http://pan.baidu.com/s/1gePE9O3 密码: unmt。

　　下载完用Xftp上传到spark1服务器，我是放在/home/software目录下。

[root@spark1 ~]# cd /home/software/

[root@spark1 software]# tar -zxf apache-hive-0.13.1-bin.tar.gz   //解压

[root@spark1 software]# mv apache-hive-0.13.1-bin /usr/lib/hive  //重命名并移到/usr/lib目录下

[root@spark1 software]# cd /usr/lib

　　设置hive环境变量。

[root@spark1 lib]# vi ~/.bashrc    //配置环境变量

//添加变量，别忘了Path的变量也要修改

export HIVE_HOME=/usr/lib/hive

export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$HIVE_HOME/bin    //加上hive的路径

　　保存退出，是文件生效。

[root@spark1 lib]# source ~/.bashrc

　　完了之后，我们使用基于MYSQL来启动Hive，将Hive的元数据库放在MYSQL。这里就不说MYSQL的安装了（偷个懒），不懂得朋友可以自行度娘，比较简单。

　　完成之后我们将MYSQL的连接包放到/usr/lib/hive/lib目录下。

[root@spark1 lib]# cp /home/software/mysql-connector-java-5.1.34.jar /usr/lib/hive/lib/

　　接下来我们用MYSQL对hive元数据库进行授权。

[root@spark1 lib]# mysql

mysql> create database if not exists hive_metadata;    //创建 hive_metadata的数据库

mysql> grant all privileges on hive_metadata.* to 'hive'@'%' identified by 'hive';

mysql> grant all privileges on hive_metadata.* to 'hive'@'localhost' identified by 'hive';

mysql> grant all privileges on hive_metadata.* to 'hive'@'spark1' identified by 'hive';

mysql> flush privileges;    //刷新权限

mysql> use hive_metadata;

mysql> exit

　　完成之后我们开始配置hive的配置文件。

修改hive-default.xml.template文件，并且重命名为hive-site.xml

[root@spark1 hive]# cd /usr/lib/hive/conf/

[root@spark1 conf]# mv hive-default.xml.template hive-site.xml    //重命名

[root@spark1 conf]# vi hive-site.xml

//修改相关的property

//修改javax.jdo.option.ConnectionURL

<property>

  <name>javax.jdo.option.ConnectionURL</name>

  <value>jdbc:mysql://spark1:3306/hive_metadata?createDatabaseIfNotExist=true</value>

  <description>JDBC connect string for a JDBC metastore</description>

</property>

//修改javax.jdo.option.ConnectionDriverName

<property>

  <name>javax.jdo.option.ConnectionDriverName</name>

  <value>com.mysql.jdbc.Drive</value>

  <description>Driver class name for a JDBC metastore</description>

</property>

//修改数据库用户名

//和之前的mysql里授权创建的相对应，用户名：hive，密码：hive

<property>

  <name>javax.jdo.option.ConnectionUserName</name>

  <value>hive</value>

  <description>username to use against metastore database</description>

</property>

<property>

  <name>javax.jdo.option.ConnectionPassword</name>

  <value>hive</value>

  <description>password to use against metastore database</description>

</property>

//修改hive.metastore.warehouse.dir

<property>

  <name>hive.metastore.warehouse.dir</name>

  <value>/user/hive/warehouse</value>

  <description>location of default database for the warehouse</description>

</property>

　　修改完成保存退出。

配置hive-env.sh.template重命名为hive-env.sh。

[root@spark1 conf]# mv hive-env.sh.template hive-env.sh    //重命名

修改/hive/bin/hive-config.sh

[root@spark1 conf]# cd ../bin

[root@spark1 bin]# vi hive-config.sh

//配置hadoop、java、hive的环境变量，添加

#environment variables

export JAVA_HOME=/usr/java/jdk1.7.0_21

export HADOOP_HOME=/usr/lib/hadoop

export HIVE_HOME=/usr/lib/hive

验证hive是否安装成功

[root@spark1 lib]# hive

16/08/07 16:39:03 WARN conf.HiveConf: DEPRECATED: hive.metastore.ds.retry.* no longer has any effect.  Use hive.hmshandler.retry.* instead

Logging initialized using configuration in jar:file:/usr/lib/hive/lib/hive-common-0.13.1.jar!/hive-log4j.properties

hive>

　　出现上述表明hive安装成功。

Spark入门到精通--（第九节）环境搭建（Hive搭建）的更多相关文章

Spark入门：第1节 Spark概述：1 - 4
2.spark概述 2.1 什么是spark Apache Spark™ is a unified analytics engine for large-scale data processing. ...
Spark入门到精通--（第十节）环境搭建（ZooKeeper和kafka搭建）
上一节搭建完了Hive,这一节我们来搭建ZooKeeper,主要是后面的kafka需要运行在上面. ZooKeeper下载和安装下载ZooKeeper 3.4.5软件包,可以在百度网盘进行下载.链接 ...
Spark入门到精通--（第七节）环境搭建（服务器搭建）
Spark搭建集群比较繁琐,需要的内容比较多,这里主要从Centos.Hadoop.Hive.ZooKeeper.kafka的服务器环境搭建开始讲.其中Centos的搭建不具体说了,主要讲下集群的配置 ...
Spark入门到精通--（第八节）环境搭建（Hadoop搭建）
上一节把Centos的集群免密码ssh登陆搭建完成,这一节主要讲一下Hadoop的环境搭建. Hadoop下载安装下载官网的Hadoop 2.4.1的软件包.http://hadoop.apache ...
Spark修炼之道（进阶篇）——Spark入门到精通：第九节 Spark SQL执行流程解析
1.总体执行流程使用下列代码对SparkSQL流程进行分析.让大家明确LogicalPlan的几种状态,理解SparkSQL总体执行流程 // sc is an existing SparkCont ...
Spark入门到精通--（第二节）Scala编程详解基础语法
Scala是什么? Scala是以实现scaleable language为初衷设计出来的一门语言.官方中,称它是object-oriented language和functional languag ...
Spark入门到精通--（第一节）Spark的前世今生
最近由于公司慢慢往spark方面开始转型,本人也开始学习,今后陆续会更新一些spark学习的新的体会,希望能够和大家一起分享和进步. Spark是什么? Apache Spark™ is a fast ...
Spark入门到精通--（外传）Cloudera CDH5.5.4搭建
http://www.mamicode.com/info-detail-601202.html continue...
Spark入门：第2节 Spark集群安装：1 - 3；第3节 Spark HA高可用部署：1 - 2
三. Spark集群安装 3.1 下载spark安装包下载地址spark官网:http://spark.apache.org/downloads.html 这里我们使用 spark-2.1.3-bi ...

随机推荐

Windows Internals 笔记——线程
1.进程有两个组成部分,一个进程内核对象和一个地址空间.线程也有两个组成部分: 一个是线程的内核对象,操作系统用它管理线程.系统还用内核对象来存放线程统计信息的地方. 一个线程栈,用于维护线程执行时所 ...
Emacs Org-mode 1 下载、安装、基本使用
1.1 总述 Org 是一种帮助我们做笔记.日常事件或者项目计划的快速高效的文本格式系统. Org 有以下特点: Org mode 基于组织结构(outline-mode)对文本进行组织.具有良好的快 ...
Python学习笔记六
Python课堂笔记六常用模块已经可以在单位实际项目中使用,可以实现运维自动化.无需手工备份文件,数据库,拷贝,压缩. 常用模块 time模块 time.time time.localtime ti ...
MongoDB超级简明入门教程
1.概念篇 MongoDB和MySQL分别作为非关系型数据库和关系型数据库的代表,通过它们之间的对比可以很快的建立起对MongoDB的认知. MongoDB MySQL 数据库(Database) 数 ...
ionic2自定义radio样式
刚开始以为用的是字体图标,结果翻了代码一看竟然是通过纯css实现的,图标模式用的是ios,代码如下: .radio-ios .radio-checked { margin:; border-radiu ...
Python学习（三十六）—— Cookie、Session和自定义分页
一.Django中操作Cookie 获取Cookie request.COOKIES['key'] request.get_signed_cookie(key, default=RAISE_ERROR ...
UOJ#218. 【UNR #1】火车管理线段树主席树
原文链接https://www.cnblogs.com/zhouzhendong/p/UOJ218.html 题解如果我们可以知道每次弹出栈之后新的栈顶是什么,那么我们就可以在一棵区间覆盖.区间求和 ...
pandas 必背函数操作
1.五个常用属性 index,columns,shape,values,dtypes2.常用函数:set_index,reset_index,del df['column_name'],pd.read ...
h5页面
<!DOCTYPE html><html lang="utf-8"><head> <meta charset="UTF-8&qu ...
使用javascript和css模拟帧动画的几种方法浅析
我们平时在开发前端页面的时候,经常会播放一段帧序列.这段帧序列就像gif图片那样,反复循环播放.那大家可能会说,直接用gif图片就好了,干嘛还去模拟呢?那是因为要做得更加灵活,我们要做到以下几点: 1 ...

Spark入门到精通--（第九节）环境搭建（Hive搭建）

Spark入门到精通--（第九节）环境搭建（Hive搭建）的更多相关文章

随机推荐

热门专题