转自:https://www.cnblogs.com/upupfeng/p/13452385.html#%E9%83%A8%E7%BD%B2hive

使用docker快速搭建hive环境

 

记录一下使用docker快速搭建部署hive环境

写在前面

想练练Hive SQL,但是没有hive shell环境。现在只有一台空的CentOS 7机子,一想要弄jdk、hadoop、mysql、hive就头疼。

于是在网上找了找,发现用docker部署hive会快很多,在此记录一下部署过程。

以下过程每一步在文末都附有参考文档,出错的朋友可以去看对应的参考文档。

步骤

  1. 安装docker
  2. 安装git,配置github。因为用的是github上大佬写好的docker compose服务,所以要git clone下来。
  3. 部署hive
  4. 使用hive命令行
  5. 收尾工作

安装docker

要用到docker和docker-compose,我们依次来安装

安装docker

如果你之前安装过 docker,请先删掉

yum remove docker docker-common docker-selinux docker-engine

安装一些依赖

yum install -y yum-utils device-mapper-persistent-data lvm2

拉取docker-ce.repo

wget -O /etc/yum.repos.d/docker-ce.repo https://download.docker.com/linux/centos/docker-ce.repo

把软件仓库地址替换为 TUNA:

sed -i 's+download.docker.com+mirrors.tuna.tsinghua.edu.cn/docker-ce+' /etc/yum.repos.d/docker-ce.repo

最后安装(默认安装的是最新版docker):

yum makecache fast
yum install docker-ce

启动docker,设为开机自启,查看docker版本

systemctl start docker
systemctl enable docker
docker version

至此,不报错的话,docker就安装好了。

安装docker-compose

依次执行以下命令

curl -L "https://github.com/docker/compose/releases/download/1.26.2/docker-compose-$(uname -s)-$(uname -m)" -o /usr/local/bin/docker-compose

chmod +x /usr/local/bin/docker-compose

ln -s /usr/local/bin/docker-compose /usr/bin/docker-compose

docker-compose --version

配置docker国内镜像源(可选)

我在后面pull docker镜像时,速度很慢,所以又配了一下国内镜像加速源,可配可不配。

参考https://www.cnblogs.com/reasonzzy/p/11127359.html这篇文章,我配的是阿里云镜像。

安装git & 配置github

执行以下命令就可以安装git了

yum -y install git

配置github的话,比较常规的操作,可以参考https://www.cnblogs.com/smartwen666/p/7891108.html这篇文章。

部署Hive

准备工作都做完了,可以开始部署Hive了。

docker-hive

用的是大佬写好的docker-hive。

上链接:https://github.com/big-data-europe/docker-hive

可以根据README.md中的介绍,来进行部署、测试。

开始部署

依次执行以下命令

git clone git@github.com:big-data-europe/docker-hive.git

# 注:本文所有docker-compose都是在docker-hive目录下执行的
cd docker-hive # 这步在后台起一个hive,元数据库用的是postgresql
# 会费一点时间,需要耐心等待
docker-compose up -d

等上面命令运行完成后,可以执行docker-compose ps命令查看正在运行的镜像。

下图是我运行这个命令的截图:

可以看到有namenode、datanode、hive等,表示部署成功了。

使用Hive命令行

依次执行以下步骤

# 进入bash
docker-compose exec hive-server bash # 使用beeline客户端连接
/opt/hive/bin/beeline -u jdbc:hive2://localhost:10000

#或者直接用hive命令连接(退出exit):
hive

查看Hive表存储目录:

hadoop fs -ls /user/hive/warehouse


# 执行SQL。这两句是可以直接执行的,镜像带了example文件
CREATE TABLE pokes (foo INT, bar STRING);
LOAD DATA LOCAL INPATH '/opt/hive/examples/files/kv1.txt' OVERWRITE INTO TABLE pokes; # 查询
select * from pokes;

查询结果:

至此,就可以开始愉快的写Hive SQL了。

查找表信息:

hive> show create table pokes;
OK
CREATE TABLE `pokes`(
`foo` int,
`bar` string)
ROW FORMAT SERDE
'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe'
STORED AS INPUTFORMAT
'org.apache.hadoop.mapred.TextInputFormat'
OUTPUTFORMAT
'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
LOCATION
'hdfs://namenode:8020/user/hive/warehouse/pokes'
TBLPROPERTIES (
'transient_lastDdlTime'='1606614975')
Time taken: 1.068 seconds, Fetched: 13 row(s)

浏览器查看hdfs -> Utilities:

hive 分区(静态分区,动态分区):

分区表的的字段不能是定义表的字段,不然会报重复columns

hive> create table t1(
> id int
> ,name string
> ,hobby array<string>
> ,add map<String,string>
> )
> partitioned by (name string)
> row format delimited
> fields terminated by ','
> collection items terminated by '-'
> map keys terminated by ':'
> ;
FAILED: SemanticException [Error 10035]: Column repeated in partitioning columns

收尾工作

安装vi、lrzsz

准备sql表数据时,发现这个docker image默认没有安装vi,就自己安一个吧。

apt-get update

apt-get install vim

# lrzsz是一个上传下载文件的工作,也安装一下
apt-get install lrzsz

关闭相关命令

# 关闭hive相关服务
docker-compose kill # 关闭docker
systemctl stop docker # 跑路
init 0

END

一套操作下来,好像也没省多少事。但是有docker,部署乱七八糟的环境还是挺省心的。

安装过程有问题的小伙伴,可以看下面的参考链接,也可以评论交流。

参考链接

清华镜像站安装docker:https://mirror.tuna.tsinghua.edu.cn/help/docker-ce/

Centos7下安装Docker:https://blog.csdn.net/u014069688/article/details/100532774

Docker Compose教程:https://www.runoob.com/docker/docker-compose.html

Docker Compose详解:https://www.jianshu.com/p/658911a8cff3

配置docker国内镜像源:https://www.cnblogs.com/reasonzzy/p/11127359.html

git配置连接github:https://www.cnblogs.com/smartwen666/p/7891108.html

docker-hive github:https://github.com/big-data-europe/docker-hive

docker 安装Hive的更多相关文章

  1. docker安装hive笔记

    前两篇文章介绍了docker的基本命令如何安装hadoop 那么大家会比较了解docker的基本语法的安装过程.那么咱们今天来一起安装一下hive. 安装 1.下载gitHub,地址:https:// ...

  2. HADOOP docker(四):安装hive

    1.hive简介2.安装hive2.1 环境准备2.1.1 下载安装包2.1.2 设置hive用户的环境变量2.1.3 hive服务端配置文件2.1.4 hive客户端配置文件2.1.4 分发hive ...

  3. docker安装hadoop集群

    docker安装hadoop集群?图啥呢?不图啥,就是图好玩.本篇博客主要是来教大家如何搭建一个docker的hadoop集群.不要问 为什么我要做这么无聊的事情,答案你也许知道,因为没有女票.... ...

  4. Docker+Hadoop+Hive+Presto 使用Docker部署Hadoop环境和Presto

    Background 一. 什么是Presto Presto通过使用分布式查询,可以快速高效的完成海量数据的查询.如果你需要处理TB或者PB级别的数据,那么你可能更希望借助于Hadoop和HDFS来完 ...

  5. 调度系统Airflow1.10.4调研与介绍和docker安装

    Airflow1.10.4介绍与安装 现在是9102年,8月中旬.airflow当前版本是1.10.4. 随着公司调度任务增大,原有的,基于crontab和mysql的任务调度方案已经不太合适了,需要 ...

  6. 安装Hive(独立模式 使用mysql连接)

    安装Hive(独立模式 使用mysql连接) 1.默认安装了java+hadoop 2.下载对应hadoop版本的安装包 3.解压安装包 tar zxvf apache-hive-1.2.1-bin. ...

  7. 附录C 编译安装Hive

    如果需要直接安装Hive,可以跳过编译步骤,从Hive的官网下载编译好的安装包,下载地址为http://hive.apache.org/downloads.html . C.1  编译Hive C.1 ...

  8. 理解Docker(1):Docker 安装和基础用法

    本系列文章将介绍Docker的有关知识: (1)Docker 安装及基本用法 (2)Docker 镜像 (3)Docker 容器的隔离性 - 使用 Linux namespace 隔离容器的运行环境 ...

  9. docker安装

    系统要求:需要一个64位的centos7操作系统和版本3.10或更高版本的Linux内核 开始安装: uname -r   //查看内核版本yum -y update //更新系统更新到最新 #安装d ...

随机推荐

  1. SpringBoot通过Ajax批量将excel中数据导入数据库

    Spring Boot通过Ajax上传Excel并将数据批量读取到数据库中 适合场景:需要通过excel表格批量向数据库中导入信息 操作流程 [1]前端上传一个excel表格 [2] 后端接收这个ex ...

  2. 汉诺塔Python

    刚开始看python实现汉诺塔,自己想了很久才想明白,在这里记录一下,希望以后忘记能够立马记起. n=1时,可以直接a->c n=2时,可以借助b然后将a->c n=3时,可以将最上面的那 ...

  3. 记一次 .NET 某云采购平台API 挂死分析

    一:背景 1. 讲故事 大概有两个月没写博客了,关注我的朋友应该知道我最近都把精力花在了星球,这两个月时间也陆陆续续的有朋友求助如何分析dump,有些朋友太客气了,给了大大的红包,哈哈,手里面也攒了1 ...

  4. 【排序+模拟】魔法照片 luogu-1583

    题目描述 一共有n(n≤20000)个人(以1--n编号)向佳佳要照片,而佳佳只能把照片给其中的k个人.佳佳按照与他们的关系好坏的程度给每个人赋予了一个初始权值W[i].然后将初始权值从大到小进行排序 ...

  5. python使用正则+jsonpath处理接口依赖

    1.接口2的入参值依赖接口1的响应结果,如接口2的入参ids需要拿到接口1响应结果的id字段值,测试用例写在excel中,参数:{"ids":"${$..id}$&quo ...

  6. js学习笔记之日期倒计时(天,时,分,秒)

    <!doctype html> <html> <head> <meta charset="utf-8"> <title> ...

  7. Nature Cancer | 宋尔卫/苏士成团队揭示lncRNA调控巨噬细胞“双刃剑”作用新机制

    巨噬细胞 (macrophage, Mϕ) 是先天免疫系统中重要的免疫细胞,也是血液.淋巴和所有哺乳动物组织类型中最常见的吞噬细胞,具有极强的功能多样性.其中,肿瘤微环境组织中存在的巨噬细胞也被称作肿 ...

  8. MongoDB 批量插入和循环插入性能测试

    一万条数据批量插入和循环插入 循环插入 var startTime = (new Date()).getTime() var db = connect('log') for(var i = 0;i&l ...

  9. [TensorFlow2.0]-张量与常用函数

    本人人工智能初学者,现在在学习TensorFlow2.0,对一些学习内容做一下笔记.笔记中,有些内容理解可能较为肤浅.有偏差等,各位在阅读时如有发现问题,请评论或者邮箱(右侧边栏有邮箱地址)提醒. 若 ...

  10. Linux进程理解与实践(五)细谈守护进程

    一. 守护进程及其特性      守护进程最重要的特性是后台运行.在这一点上DOS下的常驻内存程序TSR与之相似.其次,守护进程必须与其运行前的环境隔离开来.这些环境包括未关闭的文件描述符,控制终端, ...