hive 集群搭建

软件环境：centos7 + hadoop2.7.6

1.hive 下载 apache-hive-2.1.0-bin.tar.gz

2.copy apache-hive-2.1.0-bin.tar.gz 到/user/local 目录并解压

tar -zxvf apache-hive-2.1.-bin.tar.gz

3.安装msyql

授权root 可以远程登陆mysql

mysql> GRANT ALL PRIVILEGES ON *.* TO 'root'@'%' IDENTIFIED BY '' WITH GRANT OPTION;

Query OK,  rows affected,  warning (0.03 sec)

mysql> FLUSH PRIVILEGES;

Query OK,  rows affected (0.01 sec)

mysql>

4.配置hive

1）hive-env.sh

[hadoop@ns1 conf]$ cd /usr/local/apache-hive-2.1.-bin/conf/

[hadoop@ns1 conf]$ cp hive-env.sh.template hive-env.sh

[hadoop@ns1 conf]$ vim hive-env.sh

根据自己的环境添加如下内容

JAVA_HOME=/usr/local/jdk

HADOOP_HOME=/usr/local/hadoop

HIVE_HOME=/usr/local/apache-hive-2.1.-bin/

export HIVE_CONF_DIR=${HIVE_HOME}/conf

export HIVE_AUX_JARS_PATH=/usr/local/spark-2.2.-bin-hadoop2./jars/spark-hive_2.-2.2..jar

export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib:$HADOOP_HOME/lib:$HIVE_HOME/lib

export HADOOP_OPTS="-Dorg.xerial.snappy.tempdir=/tmp -Dorg.xerial.snappy.lib.name=libsnappyjava.jnilib $HADOOP_OPTS"

2）hive-site.xml

cp hive-default.xml.template hive-site.xml

vim hive-site.xml 添加如下内容

<?xml version="1.0" encoding="UTF-8" standalone="no"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<configuration>

    <property>

        <name>javax.jdo.option.ConnectionURL</name>

        <value>jdbc:mysql://ns1:3306/hive?createDatabaseIfNotExist=true</value>

        <description>JDBC connect string for a JDBC metastore</description>

    </property>

    <property>

        <name>javax.jdo.option.ConnectionDriverName</name>

        <value>com.mysql.jdbc.Driver</value>

        <description>Driver class name for a JDBC metastore</description>

    </property>

    <property>

        <name>javax.jdo.option.ConnectionUserName</name>

        <value>root</value>

        <description>username to use against metastore database</description>

    </property>

    <property>

        <name>javax.jdo.option.ConnectionPassword</name>

        <value></value>

        <description>password to use against metastore database</description>

    </property>

    <property>

        <name>datanucleus.autoCreateSchema</name>

        <value>true</value>

    </property>

    <property>

        <name>datanucleus.autoCreateTables</name>

        <value>true</value>

    </property>

    <property>

        <name>datanucleus.autoCreateColumns</name>

        <value>true</value>

    </property>

    <!-- 设置 hive仓库的HDFS上的位置 -->

    <property>

        <name>hive.metastore.warehouse.dir</name>

        <value>/user/hive/warehouse</value>

        <description>location of default database for the warehouse</description>

    </property>

    <!--资源临时文件存放位置 -->

    <property>

        <name>hive.downloaded.resources.dir</name>

        <value>/home/hadoop/hive/tmp/resources</value>

        <description>Temporary local directory for added resources in the remote file system.</description>

    </property>

    <!-- Hive在0.9版本之前需要设置hive.exec.dynamic.partition为true, Hive在0.9版本之后默认为true -->

    <property>

        <name>hive.exec.dynamic.partition</name>

        <value>true</value>

    </property>

    <property>

        <name>hive.exec.dynamic.partition.mode</name>

        <value>nonstrict</value>

    </property>

    <!-- 修改日志位置 -->

    <property>

        <name>hive.exec.local.scratchdir</name>

        <value>/home/hadoop/hive/tmp/HiveJobsLog</value>

        <description>Local scratch space for Hive jobs</description>

    </property>

    <property>

        <name>hive.downloaded.resources.dir</name>

        <value>/home/hadoop/hive/tmp/ResourcesLog</value>

        <description>Temporary local directory for added resources in the remote file system.</description>

    </property>

    <property>

        <name>hive.querylog.location</name>

        <value>/home/hadoop/hive/tmp/HiveRunLog</value>

        <description>Location of Hive run time structured log file</description>

    </property>

    <property>

        <name>hive.server2.logging.operation.log.location</name>

        <value>/home/hadoop/hive/tmp/OpertitionLog</value>

        <description>Top level directory where operation tmp are stored if logging functionality is enabled

        </description>

    </property>

    <!-- 配置HWI接口 -->

    <property>

        <name>hive.hwi.war.file</name>

        <value>/usr/local/apache-hive-2.1.-bin/lib/hive-hwi-2.1..jar</value>

        <description>This sets the path to the HWI war file, relative to ${HIVE_HOME}.</description>

    </property>

    <property>

        <name>hive.hwi.listen.host</name>

        <value>ns1</value>

        <description>This is the host address the Hive Web Interface will listen on</description>

    </property>

    <property>

        <name>hive.hwi.listen.port</name>

        <value></value>

        <description>This is the port the Hive Web Interface will listen on</description>

    </property>

    <!-- Hiveserver2已经不再需要hive.metastore.local这个配置项了(hive.metastore.uris为空，则表示是metastore在本地，否则就是远程)远程的话直接配置hive.metastore.uris即可 -->

    <!-- property>

        <name>hive.metastore.uris</name>

        <value>thrift://m1:9083</value>

        <description>Thrift URI for the remote metastore. Used by metastore client to connect to remote metastore.</description>

    </property -->

    <property>

        <name>hive.server2.thrift.bind.host</name>

        <value>ns1</value>

    </property>

    <property>

        <name>hive.server2.thrift.port</name>

        <value></value>

    </property>

    <property>

        <name>hive.server2.thrift.http.port</name>

        <value></value>

    </property>

    <property>

        <name>hive.server2.thrift.http.path</name>

        <value>cliservice</value>

    </property>

    <!-- HiveServer2的WEB UI -->

    <property>

        <name>hive.server2.webui.host</name>

        <value>ns1</value>

    </property>

    <property>

        <name>hive.server2.webui.port</name>

        <value></value>

    </property>

    <property>

        <name>hive.scratch.dir.permission</name>

        <value></value>

    </property>

    <!-- 下面hive.aux.jars.path这个属性里面你这个jar包地址如果是本地的记住前面要加file://不然找不到, 而且会报org.apache.hadoop.hive.contrib.serde2.RegexSerDe错误 -->

    <!--property>

        <name>hive.aux.jars.path</name>

        <value>file:///home/centos/soft/spark/lib/spark-assembly-1.6.0-hadoop2.6.0.jar</value>

    </property-->

    <property>

        <name>hive.server2.enable.doAs</name>

        <value>false</value>

    </property>

    <!-- property>

        <name>hive.server2.authentication</name>

        <value>NOSASL</value>

    </property -->

    <property>

        <name>hive.auto.convert.join</name>

        <value>false</value>

    </property>

    <property>

        <name>spark.dynamicAllocation.enabled</name>

        <value>true</value>

        <description>动态分配资源</description>

    </property>

    <!-- 使用Hive on spark时,若不设置下列该配置会出现内存溢出异常 -->

    <property>

        <name>spark.driver.extraJavaOptions</name>

        <value>-XX:PermSize=128M -XX:MaxPermSize=512M</value>

    </property>

</configuration>

3）hive-log4j2.properties

[hadoop@ns1 conf]$ cp hive-log4j2.properties.template hive-log4j2.properties

[hadoop@ns1 conf]$ vim hive-log4j2.properties  修改如下内容

property.hive.log.dir = /home/hadoop/hive/tmp

4）copy jdbc 包

copy mysql-connector-java-5.1.46.jar 到/usr/local/apache-hive-2.1.0-bin/lib/

5)copy jline 扩展包

cp jline-2.12.jar /usr/local/hadoop/share/hadoop/yarn/lib/

6）copy jdk tools.jar 到hive lib

cp /usr/local/jdk/lib/tools.jar /usr/local/apache-hive-2.1.-bin/lib/

7）hive 初始化

cd /usr/local/apache-hive-2.1.-bin/bin

./schematool -dbType mysql -initSchema

8)启动hive metastore

./hive --service metastore

9）打开另一个终端进入hive

hive> create database hadoop;

OK

Time taken: 0.365 seconds

hive> show databases;

OK

default

hadoop

Time taken: 0.027 seconds, Fetched:  row(s)

hive> use hadoop;

OK

5.hive 客户端安装

server与client区别：server安装了存储源数据的数据库，client则没有

将hive安装包复制到客户端机器

scp -r apache-hive-2.1.-bin/ root@dn1:/usr/local

修改hive-site.xml,添加

    <property>

                 <name>hive.metastore.uris</name>

        <value>thrift://ns1:9083</value>

        <description>Thrift URI for the remote metastore. Used by metastore client to connect to remote metastore.</description>
 </property>

客户端即可使用

hive 集群搭建的更多相关文章

大数据学习系列之七 ----- Hadoop+Spark+Zookeeper+HBase+Hive集群搭建图文详解
引言在之前的大数据学习系列中,搭建了Hadoop+Spark+HBase+Hive 环境以及一些测试.其实要说的话,我开始学习大数据的时候,搭建的就是集群,并不是单机模式和伪分布式.至于为什么先写单 ...
HADOOP+SPARK+ZOOKEEPER+HBASE+HIVE集群搭建(转)
原文地址:https://www.cnblogs.com/hanzhi/articles/8794984.html 目录引言目录一环境选择 1集群机器安装图 2配置说明 3下载地址二集群的相关 ...
Hadoop3集群搭建之——hive添加自定义函数UDTF （一行输入，多行输出）
上篇: Hadoop3集群搭建之——虚拟机安装 Hadoop3集群搭建之——安装hadoop,配置环境 Hadoop3集群搭建之——配置ntp服务 Hadoop3集群搭建之——hive安装 Hadoo ...
Hadoop3集群搭建之——hive添加自定义函数UDTF
上篇: Hadoop3集群搭建之——虚拟机安装 Hadoop3集群搭建之——安装hadoop,配置环境 Hadoop3集群搭建之——配置ntp服务 Hadoop3集群搭建之——hive安装 Hadoo ...
Hadoop3集群搭建之——hive添加自定义函数UDF
上篇: Hadoop3集群搭建之——虚拟机安装 Hadoop3集群搭建之——安装hadoop,配置环境 Hadoop3集群搭建之——配置ntp服务 Hadoop3集群搭建之——hive安装 Hadoo ...
Hadoop3集群搭建之——hive安装
Hadoop3集群搭建之——虚拟机安装 Hadoop3集群搭建之——安装hadoop,配置环境 Hadoop3集群搭建之——配置ntp服务 Hadoop3集群搭建之——hbase安装及简单操作现在到 ...
（四）Spark集群搭建-Java&Python版Spark
Spark集群搭建视频教程 1.优酷 2.YouTube 安装scala环境下载地址http://www.scala-lang.org/download/ 上传scala-2.10.5.tgz到m ...
Spark集群搭建简要
Spark集群搭建 1 Spark编译 1.1 下载源代码 git clone git://github.com/apache/spark.git -b branch-1.6 1.2 修改pom文件 ...
Shark集群搭建配置
一.Shark简单介绍 Shark是基于Spark与Hive之上的一种SQL查询引擎,官网的架构图及性能測试图例如以下:(Ps:本人也做了一个性能測试见Shark性能測试报告) 我们涉及到了2个依赖组 ...

随机推荐

SpringBoot整合Spring Data Elasticsearch
Spring Data Elasticsearch提供了ElasticsearchTemplate工具类,实现了POJO与elasticsearch文档之间的映射 elasticsearch本质也是存 ...
list转json数组
lights为arraylist java后台代码: try { org.tempuri.TLight[] lights = phlightSoapProxy.getLights(); ...
React渲染和事件处理
一.列表渲染 ①在列表中,绑定数组成员会直接把成员渲染 <div id="app"></div> <script src="node_mod ...
Reactive Extensions (Rx) 入门(3) —— Rx的事件编程
译文:https://blog.csdn.net/fangxing80/article/details/7628322 原文:http://www.atmarkit.co.jp/fdotnet/int ...
同余方程组（EXCRT）（luogu4777）
#include<cstdio> #include<algorithm> #define ll long long using namespace std; ll k; ll ...
hotspot的Heap Memory和Native Memory
JVM管理的内存可以总体划分为两部分:Heap Memory和Native Memory.前者供Java应用程序使用的:后者也称为C-Heap,是供JVM自身进程使用的.Native Memory没有 ...
ansible-playbook-常用
创建软链:file: - name: create link hosts: "{{hosts_ip}}" tasks: - name: create link file: src= ...
spring boot整合websocket之使用自带tomcat启动项目报错记录
项目中用到websocket,就将原来写好的websocket工具类直接拿来使用,发现前端建立连接的时候报404,经查找发现是因为原来用的是配置的外部tomcat启动,这次是spring boot自带 ...
冰多多团队Beta阶段发布说明
Bingduoduo 语音Coding(Beta):项目Github地址 Beta版本新功能介绍在beta阶段我们很好地将alpha阶段已经设计好的编辑器和shell整合了起来,推出了一个完整的ID ...
Object changed by Unknown
https://documentation.red-gate.com/soc7/troubleshooting/object-changed-by-unknown https://documentat ...

hive 集群搭建

hive 集群搭建的更多相关文章

随机推荐

热门专题