0.安装环境和版本

Ubuntu16,hadoop版本是2.7.2 ,选择Hive版本为  hive-2.1.17

1. Hive安装包下载

地址: https://mirrors.tuna.tsinghua.edu.cn/apache/hive/

2.上传到服务器后解压

sudo mv apache-hive-2.1.1-bin.tar.gz /usr/local

sudo tar zxvf apache-hive-2.1.1-bin.tar.gz

sudo mv apache-hive-2.1.1-bin  hive

sudo chown –R hadoop:hadoop hive

3.配置

sudo vi /etc/profile.d/hadoop.sh

添加以下内容:

#For Hive

export HIVE_HOME=/usr/local/hive

export HIVE_CONF_DIR=$HIVE_HOME/conf

export CLASSPATH=$CLASSPATH:$HIVE_HOME/lib

export PATH=$PATH:$HIVE_HOME/bin

保存后使用命令:source /etc/profile使环境变量立即生效

4.下载并设置好jdbc connector

从此处下载:https://dev.mysql.com/downloads/connector/j/

记住,将解压出来的jar放入hive 的lib中

sudo cp mysql-connector-java-5.1.42-bin.jar $HIVE_HOME/lib/

ln -s /usr/share/java/mysql-connector-java-5.1.42-bin.jar $HIVE_HOME/lib/mysql-connector-java-5.1.42-bin.jar

5. 配置MySQL作为Hive的元数据存储库

如果没有安装好MySQL,先在服务器装好MySQL。

1) 创建hive数据库和用户

GRANT all privileges on *.* TO 'hive' identified by 'Hive@12345';

create database hive;

flush privileges;  

6. 配置hive-site.xml文件

1) 配置hive-site.xml文件

cd $HIVE_HOME/conf

cp hive-default.xml.template hive-site.xml

修改:

<name>hive.metastore.schema.verification</name>

<value>true</value>

改为

<name>hive.metastore.schema.verification</name>

    <value>false</value>

设置HIVE元数据库连接信息:

<property>  

   <name>javax.jdo.option.ConnectionURL</name>  

   <value>jdbc:mysql://master:3306/hive?createDatabaseIfNotExist=true</value>  

   <description>JDBC connect string for a JDBC metastore</description>  

</property>  

<property>  

  <name>javax.jdo.option.ConnectionDriverName</name>  

  <value>com.mysql.jdbc.Driver</value>  

  <description>Driver class name for a JDBC metastore</description>  

</property>  

<property>  

  <name>javax.jdo.option.ConnectionUserName</name>  

  <value>hive</value>  

  <description>username to use against metastore database</description>  

</property>  

<property>  

  <name>javax.jdo.option.ConnectionPassword</name>  

  <value>hive</value>  

  <description>password to use against metastore database</description>  

</property>  

6.初始化数据库

在使用hive或者hive --service cli来运行之前需要初始化数据库,如果在初始化之前已经运行了上述命令并且失败,则需要删除产生的metastore_db文件

使用命令schematool -initSchema -dbType mysql初始化mysql数据库

出现以下几行说明初始化成功:

7.启动Hive服务

启动hive常用的两个服务

# 使用这个服务,可以让metastore作为一个单独的(远程)进程运行

nohup hive --service metastore 2>&1 >> /var/log.log &

# 让Hive以提供Trift服务的服务器形式运行,允许用不同语言编写的客户端进行访问

nohup hive  -–service hiveserver2  2>&1 >> /var/log.log &

8. 复制hive到其他从节点

将hive文件夹scp到其他从节点中,这样在其他服务器上也能访问hive

9.报错解决

1) 异常信息:

异常信息:

Exception in thread "main" Java.lang.RuntimeException: java.lang.IllegalArgumentException: java.net.URISyntaxException: Relative path in absolute URI: ${system:java.io.tmpdir%7D/$%7Bsystem:user.name%7D

at org.apache.Hadoop.hive.ql.session.SessionState.start(SessionState.java:444)

解决:

查看hive-site.xml配置,会看到配置值含有"system:java.io.tmpdir"的配置项

2.新建文件夹在hive目录下新建一个tmp目录

3. ${system:java.io.tmpdir}/${system:user.name} 这两个一起替换为 /usr/local/hive/tmp 路径,有两个地方要替换

Ubuntu16下Hive 安装的更多相关文章

  1. ubuntu16.04下hive安装与配置

    Hive是什么? 由Facebook开源用于解决海量 结构化日志的数据统计: Hive是基于Hadoop的一个 数据仓库工具,可以将结构化的数据文件映射 成一张表,并提供类SQL查询功能: 构建在Ha ...

  2. Ubuntu16下Hadoop安装

    1. 安装Ubuntu 2. 新装Ubuntu常用软件安装和系统设置 (1) 安装vim yum install vim (2) 更改hostname为hadoop_master sudo vim / ...

  3. Ubuntu16下apache2安装ssl阿里云证书

    1.用下面的命令确保ssl模块已经加载进apache: a2enmod ssl 如果你看到了“Module ssl already enabled”这样的信息就说明你成功了,如果你看到了“Enabli ...

  4. ubuntu16下 Oracle安装完毕,测试是否安装成功的步骤

    1.查看oracle的环境变量,在终端输入命令 echo $ORACLE_BASE echo $ORACLE_HOME echo $PATH 看输出是不是安装时设置的路径 2.开启监听器 lsnrct ...

  5. DigitalOcean 推荐的ubuntu16下LAMP安装过程

    LAMP安装过程: How To Install Linux, Apache, MySQL, PHP (LAMP) stack on Ubuntu 16.04 (另一个参考例程:Ubuntu 16.0 ...

  6. Hive安装-windows(转载)

    1.安装hadoop 2.从maven中下载mysql-connector-java-5.1.26-bin.jar(或其他jar版本)放在hive目录下的lib文件夹 3.配置hive环境变量,HIV ...

  7. Ubuntu16.04下Hive的安装与配置

    一.系统环境 os : Ubuntu 16.04 LTS 64bit jdk : 1.8.0_161 hadoop : 2.6.4mysql : 5.7.21 hive : 2.1.0 在配置hive ...

  8. Ubuntu16.04 LTS下apt安装WireShark

    Ubuntu16.04 LTS下apt安装WireShark 安装与配置 首先通过apt安装WireShark: $ sudo apt install wireshark 会同时安装许多的依赖包,其中 ...

  9. Ubuntu16.04下编译安装OpenCV3.4.0(C++ & python)

    Ubuntu16.04下编译安装OpenCV3.4.0(C++ & python) 前提是已经安装了python2,python3 1)安装各种依赖库 sudo apt-get update ...

随机推荐

  1. 数字信号处理专题(1)——DDS函数发生器环路Demo

    一.前言 会FPGA硬件描述语言.设计思想和接口协议,掌握些基本的算法是非常重要的,因此开设本专题探讨些基于AD DA数字信号处理系统的一些简单算法,在数字通信 信号分析与检测等领域都会或多或少有应用 ...

  2. [spring boot] Table 'yhm.hibernate_sequence' doesn't exist

    在使用该注解时:@GeneratedValue要注意的几点: @GeneratedValue注解的strategy属性提供四种值: -AUTO主键由程序控制, 是默认选项 ,不设置就是这个 -IDEN ...

  3. Canadian-dollar_RMB

    import pandas as pd import matplotlib.pyplot as plt import statsmodels as sm from statsmodels.graphi ...

  4. 软件设计之Deep Module(深模块)

    类是不是越小越好?最近在读John Ousterhout的<A Philosophy of Software Design>,感到作者文笔流畅,书中内容具有启发性.这里摘要一部分内容,以供 ...

  5. ThreadLocal的使用及原理分析

    文章简介 ThreadLocal应该都比较熟悉,这篇文章会基于ThreadLocal的应用以及实现原理做一个全面的分析 内容导航 什么是ThreadLocal ThreadLocal的使用 分析Thr ...

  6. 关于Eclipse的版本、分支、衍生版本

    Eclipse 简介: Eclipse的历史: Eclipse的发布版本: Eclipse分支: 关于不同分支版本的区别,点击链接: http://www.eclipse.org/downloads/ ...

  7. 如何展开Linux Memory Management学习?

    Linux的进程和内存是两座大山,没有翻过这两座大山对于内核的理解始终是不完整的. 关于Linux内存管理,在开始之前做些准备工作. 首先bing到了Quora的<How can one rea ...

  8. 第三章 启动rabbitmq的webUI

    一.启动步骤 1.启动rabbitmq rabbitmq-server (前台启动)或者rabbitmq-server -detached(后台启动) 2.启动rabbitmq_management ...

  9. 迄今为止 .Net 平台功能最强大,性能最佳的 JSON 序列化和反序列化库。

    Swifter.Json 这是迄今为止 .Net 平台功能最强大,性能最佳的 JSON 序列化和反序列化库. Github : https://github.com/Dogwei/Swifter.Js ...

  10. MariaDB第四章:视图,事务,索引,外键--小白博客

    视图 对于复杂的查询,在多个地方被使用,如果需求发生了改变,需要更改sql语句,则需要在多个地方进行修改,维护起来非常麻烦 假如因为某种需求,需要将user拆房表usera和表userb,该两张表的结 ...