Centos搭建Hive

一、Hive简介
二、安装Hive

2.1hive下载
2.2上传解压
2.3配置hive相关的环境变量

三、Mysql

3.1安装mysql connector
3.2 将mysqld上创建 connector 拷贝到hive的lib包中
3.3在mysql上创建hive元数据库，并对hive进行授权

四、配置hive-site.xml
五、配置hive-env.sh和hive-config.sh
六、验证hive

一、Hive简介

Hive是在HDFS之上的架构，Hive中含有其自身的组件，解释器、编译器、执行器、优化器。解释器用于对脚本进行解释，编译器是对高级语言代码进行编译，执行器是对java代码的执行，优化器是在执行过程中进行优化。这里的代码就是Hadoop中的MapReduce，这里的MapReduce通过Hive往HDFS上执行、分析、查询数据。

上图展示hql的执行过程，一个hql脚本首先到hive的解释器，转化为MapReduce（当然例如“select * from table_name;”这样的语句不用转化成MapReduce），解释器是用于解释脚本的，MapReduce是由脚本生成的；然后编译器再对MapReduce程序进行编译；再然后执行器对代码的执行以及优化器在执行过程优化。可见，Hive并没有更改数据的存储介质，数据仍然在HDFS上。Hive只是通过MapReduce对数据进行查询和分析，这时MapReduce不用进行解释、编译、优化，hive会帮助完成。这时写一个MapReduce程序就变成了写一个hql语句/脚本（或者说类似sql语句/脚本）。

Hive的本质不是一个数据库，更不是一个服务，它不需要端口，没有监听客户端。正因为hive不是一个服务，所以不需要考虑HA和分布式方面的问题，hive实际上就是一种工具，是一种把sql语句转化成MapReduce，然后再放到hadoop去执行MapReduce的一种工具。可以将hive理解为hadoop的一个客户端，因为是hive去连接hdfs，是hive去提交MapReduce程序到hadoop中的ResourceManager主节点。

hive也有其不足之处。虽然hive可以替代一部分MapReduce，但只能做统计查询，以及一些简单的统计分析，要想做数据挖掘仍需写MapReduce。因为hive的特点是基于hql脚本进行操作的，它非常接近关系型数据库的sql语句，所以它的数据结构一定是要有关系的那种才适合统计分析，这种统计分析有局限性。

二、安装Hive

2.1hive下载

清华大学软件镜像站-hive下载

2.2上传解压

将安装包上传至服务器：

rz apach-hive-xxxx.tar.gz

解压：

tar -zxvf apach-hive-xxx.tar.gz

重命名hive:

mv apach-hive-xxx hive

2.3配置hive相关的环境变量

vi ~/.bashrc

export HIVE_HOME=/usr/local/hive

export PATH=$HIVE_HOME/bin

重启使配置生效：

source ~/.bashrc

三、Mysql

在Centos上需要安装Mysql服务，通过网上其他资源，参考安装mysql服务。

CentOS7下使用YUM安装MySQL5.6

yum install  -y  mysql-server

//启动mysql服务

service mysqld start

//开机启动

chkconfig mysqld on

3.1安装mysql connector

yum install -y mysql-connector-java

wget https://dev.mysql.com/get/Downloads/Connector-J/mysql-connector-java-5.1.31.tar.gz

tar zxf mysql-connector-java-5.1.31.tar.gz

3.2 将mysqld上创建 connector 拷贝到hive的lib包中

   cp mysql-connector-java-5.1.31/mysql-connector-java-5.1.31-bin.jar /home/hadoop/hive/lib/

3.3在mysql上创建hive元数据库，并对hive进行授权

 create user 'hive'@'localhost' identified by 'hive'; （创建hive用户）

 grant all privileges on *.* to 'hive'@'localhost' with grant option;（赋予权限）

 flush privileges;（刷新权限）

或：

create database if not existshive_metadata;

grant all privileges onhive_metadata.* to 'hive'@'%' identified by 'hive';

grant all privileges onhive_metadata.* to 'hive'@'localhost' identified by 'hive';

grant all privileges onhive_metadata.* to 'hive'@'spark1' identified by 'hive';

flush privileges;

use hive_metadata;

四、配置hive-site.xml

vi /hive/conf/hive-site.xml

<?xml version="1.0" encoding="UTF-8" standalone="no"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?><!--

   Licensed to the Apache Software Foundation (ASF) under one or more

   contributor license agreements.  See the NOTICE file distributed with

   this work for additional information regarding copyright ownership.

   The ASF licenses this file to You under the Apache License, Version 2.0

   (the "License"); you may not use this file except in compliance with

   the License.  You may obtain a copy of the License at

       http://www.apache.org/licenses/LICENSE-2.0

   Unless required by applicable law or agreed to in writing, software

   distributed under the License is distributed on an "AS IS" BASIS,

   WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.

   See the License for the specific language governing permissions and

   limitations under the License.

-->

<configuration>

                <!--Hive的元数据库，这是连接master.hadoop:3306端口的hive数据库，如果库不存在就可以创建-->

        <property>

                <name>javax.jdo.option.ConnectionURL</name>

                <value>jdbc:mysql://master.hadoop:3306/hive?createDatabaseIfNotExist=true</value>

        </property>

        <!--连接元数据的驱动名-->

        <property>

                <name>javac.jdo.option.ConnectionDriverName</name>

                <value>com.mysql.jdbc.Driver</value>

        </property>

        <!--数据库的用户名-->

        <property>

                <name>javax.jdo.option.ConnectionUserName</name>

                <value>hive</value>

        </property>

        <!--数据库的密码-->

        <property>

                <name>javax.jdo.option.ConnectionPassword</name>

                <value>hive</value>

        </property>

        <!--表示数据在hdfs中的存储位置-->

        <property>

                <name>hive.metastore.warehouse.dir</name>

                <value>hdfs://mycluster/user/hive/warehouse</value>

        </property>

        <!--动态分区的模式，默认strict，表示必须指定至少一个分区为静态分区，nonstrict模式表示允许所有的分区字段都可以使用动态分区。-->

        <property>

                <name>hive.exec.dynamic.partition.mode</name>

                <value>nonstrict</value>

        </property>

        <!--默认情况下，HiveServer2以提交查询的用户执行查询（true），如果hive.server2.enable.doAs设置为false，查询将以运行hiveserver2进程的用户运行。-->

        <property>

                <name>hive.server2.enable.doAs</name>

                <value>false</value>

        </property>

         <!-- hive.metastore.schema.verification值为false即可解决“Caused by: MetaException(message:Version information not found in metastore.)”-->

        <property>

                <name>hive.metastore.schema.verification</name>

                <value>false</value>

        </property>

</configuration>

五、配置hive-env.sh和hive-config.sh

mv hive-env.sh.template hive-env.sh

#若无hive-env.sh文件，则将hive-env.sh.template 改名为hive-env.sh

vi /usr/local/hive/bin/hive-config.sh

#增加环境变量

export JAVA_HOME=/usr/java/latest

export HIVE_HOME=/usr/local/hive

exportHADOOP_HOME=/usr/local/hadoop

六、验证hive

直接输入hive命令，即可进入hive命令行。

Centos搭建Hive的更多相关文章

Centos搭建mysql/Hadoop/Hive/Hbase/Sqoop/Pig
目录: 准备工作 Centos安装 mysql Centos安装Hadoop Centos安装hive JDBC远程连接Hive Hbase和hive整合 Centos安装Hbase 准备工作: 配置 ...
Linux 下搭建 Hive 环境
Linux 下搭建 Hive 环境作者:Grey 原文地址: 博客园:Linux 下搭建 Hive 环境 CSDN:Linux 下搭建 Hive 环境前置工作首先,需要先完成 Linux 下搭建 ...
基于Ubuntu Hadoop的群集搭建Hive
Hive是Hadoop生态中的一个重要组成部分,主要用于数据仓库.前面的文章中我们已经搭建好了Hadoop的群集,下面我们在这个群集上再搭建Hive的群集. 1.安装MySQL 1.1安装MySQL ...
CentOS 搭建LNMP服务器和LAMP服务器
CentOS 搭建LNMP服务器方法一:yum安装 1.更新YUM源 wget http://www.atomicorp.com/installers/atomic #下载atomic自动更新Y ...
在CentOS搭建Git服务器转
在CentOS搭建Git服务器来自 :http://www.jianshu.com/p/69ea5ded3ede 前言我们可以GitHub发布一些开源代码的公共仓库,但对于私密仓库就需要收费了.公 ...
基于CDH 5.9.1 搭建 Hive on Spark 及相关配置和调优
Hive默认使用的计算框架是MapReduce,在我们使用Hive的时候通过写SQL语句,Hive会自动将SQL语句转化成MapReduce作业去执行,但是MapReduce的执行速度远差与Spark ...
[记录]CentOS搭建SVN服务器(主从同步)
CentOS搭建SVN服务器(主从同步)1.安装步骤如下: 1)安装: #yum install subversion 2)查看安装位置: #rpm -ql subversion 3)查看版本: #/ ...
CentOS搭建Git服务器及权限管理
声明:本教程,仅作为配置的记录,细节不展开,需要您有一点linux的命令基础,仅作为配置参考. 1. 系统环境系统: Linux:CentOS 7.2 64位由于CentOS已经内置了OpenSS ...
ubuntu18.04搭建hive
hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行. 其优点是学习成本低,可以通过 ...

随机推荐

python-scrapy爬取某招聘网站(二)
首先要准备python3+scrapy+pycharm 一.首先让我们了解一下网站拉勾网https://www.lagou.com/ 和Boss直聘类似的网址设计方式,与智联招聘不同,它采用普通的页 ...
论JAVA实现MYSQL 行级锁(分布式锁实现方案一)
@Override @Transactional public String getCustomerId() { // return String.valueOf(getSequenceId(SEQ_ ...
JavaScript--总结二（流程控制+调试）
表达式和语句表达式------ 一个表达式可以产生一个值,有可能式运算,函数调用,有可能是字面量.表达式可以放在任何需要值的地方语句----- 语句可以理解为一个行为,循环语句和判断语句就是典型的 ...
Kubernetes官方java客户端之二：序列化和反序列化问题
欢迎访问我的GitHub https://github.com/zq2599/blog_demos 内容:所有原创文章分类汇总及配套源码,涉及Java.Docker.Kubernetes.DevOPS ...
Modbus 协议图文详解
1.概论 Modbus是一种串行通信协议,由于其协议简单易用,且没有版权要求,目前已经成为工业领域通信协议的实时标准.ModBus协议是又施耐德电气的前身Modicon公司在1979年提出的.Modb ...
SQL Server On Linux：基于实际项目案例，总结功能支持情况及相关问题解决方案，讲如何快速完成迁移
上个月,有个朋友问我说Sql Sever向Mysql迁移有什么好的经验分享,他们公司客户明确提出不再提供Windows服务器,现在计划Mysql迁移.我说Mysql迁移成本太高了,不妨可以了解一下SQ ...
【项目实践】一文带你搞定Spring Security + JWT
以项目驱动学习,以实践检验真知前言关于认证和授权,R之前已经写了两篇文章: [项目实践]在用安全框架前,我想先让你手撸一个登陆认证 [项目实践]一文带你搞定页面权限.按钮权限以及数据权限在这两篇 ...
js 数组的方法总结
1.Array.map() 此方法是将数组中的每个元素调用一个提供的函数,结果作为一个新的数组返回,并没有改变原来的数组 let arr = [1, 2, 3, 4, 5] let newAr ...
Java远程下载文件到本地（http协议和ssh2协议）
Java中java.io包为我们提供了输入流和输出流,对文件的读写基本上都依赖于这些封装好的关于流的类中来实现.前段时间遇到了以下两种需求: 1.与某系统对接,每天获取最新的图片并显示在前端页面.该系 ...
wpf 通过为DataGrid所绑定的数据源类型的属性设置Attribute改变DataGrid自动生成列的顺序
环境Win10 VS2019 .Net Framework4.8 在wpf中,如果为一个DataGrid绑定到一个数据源,默认情况下DataGrid会为数据源类型的每个属性生成一个列(Column)对 ...

Centos搭建Hive

Centos搭建Hive

一、Hive简介

二、安装Hive

2.1hive下载

2.2上传解压

2.3配置hive相关的环境变量

三、Mysql

3.1安装mysql connector

3.2 将mysqld上创建 connector 拷贝到hive的lib包中

3.3在mysql上创建hive元数据库，并对hive进行授权

四、配置hive-site.xml

五、配置hive-env.sh和hive-config.sh

六、验证hive

Centos搭建Hive的更多相关文章

随机推荐

热门专题