docker 安装Hive
转自:https://www.cnblogs.com/upupfeng/p/13452385.html#%E9%83%A8%E7%BD%B2hive
使用docker快速搭建hive环境
记录一下使用docker快速搭建部署hive环境
写在前面
想练练Hive SQL,但是没有hive shell环境。现在只有一台空的CentOS 7机子,一想要弄jdk、hadoop、mysql、hive就头疼。
于是在网上找了找,发现用docker部署hive会快很多,在此记录一下部署过程。
以下过程每一步在文末都附有参考文档,出错的朋友可以去看对应的参考文档。
步骤
- 安装docker
- 安装git,配置github。因为用的是github上大佬写好的docker compose服务,所以要git clone下来。
- 部署hive
- 使用hive命令行
- 收尾工作
安装docker
要用到docker和docker-compose,我们依次来安装
安装docker
如果你之前安装过 docker,请先删掉
yum remove docker docker-common docker-selinux docker-engine
安装一些依赖
yum install -y yum-utils device-mapper-persistent-data lvm2
拉取docker-ce.repo
wget -O /etc/yum.repos.d/docker-ce.repo https://download.docker.com/linux/centos/docker-ce.repo
把软件仓库地址替换为 TUNA:
sed -i 's+download.docker.com+mirrors.tuna.tsinghua.edu.cn/docker-ce+' /etc/yum.repos.d/docker-ce.repo
最后安装(默认安装的是最新版docker):
yum makecache fast
yum install docker-ce
启动docker,设为开机自启,查看docker版本
systemctl start docker
systemctl enable docker
docker version
至此,不报错的话,docker就安装好了。
安装docker-compose
依次执行以下命令
curl -L "https://github.com/docker/compose/releases/download/1.26.2/docker-compose-$(uname -s)-$(uname -m)" -o /usr/local/bin/docker-compose
chmod +x /usr/local/bin/docker-compose
ln -s /usr/local/bin/docker-compose /usr/bin/docker-compose
docker-compose --version
配置docker国内镜像源(可选)
我在后面pull docker镜像时,速度很慢,所以又配了一下国内镜像加速源,可配可不配。
参考https://www.cnblogs.com/reasonzzy/p/11127359.html这篇文章,我配的是阿里云镜像。
安装git & 配置github
执行以下命令就可以安装git了
yum -y install git
配置github的话,比较常规的操作,可以参考https://www.cnblogs.com/smartwen666/p/7891108.html这篇文章。
部署Hive
准备工作都做完了,可以开始部署Hive了。
docker-hive
用的是大佬写好的docker-hive。
上链接:https://github.com/big-data-europe/docker-hive
可以根据README.md中的介绍,来进行部署、测试。
开始部署
依次执行以下命令
git clone git@github.com:big-data-europe/docker-hive.git
# 注:本文所有docker-compose都是在docker-hive目录下执行的
cd docker-hive
# 这步在后台起一个hive,元数据库用的是postgresql
# 会费一点时间,需要耐心等待
docker-compose up -d
等上面命令运行完成后,可以执行docker-compose ps
命令查看正在运行的镜像。
下图是我运行这个命令的截图:
可以看到有namenode、datanode、hive等,表示部署成功了。
使用Hive命令行
依次执行以下步骤
# 进入bash
docker-compose exec hive-server bash
# 使用beeline客户端连接
/opt/hive/bin/beeline -u jdbc:hive2://localhost:10000
#或者直接用hive命令连接(退出exit):
hive
查看Hive表存储目录:
hadoop fs -ls /user/hive/warehouse
# 执行SQL。这两句是可以直接执行的,镜像带了example文件
CREATE TABLE pokes (foo INT, bar STRING);
LOAD DATA LOCAL INPATH '/opt/hive/examples/files/kv1.txt' OVERWRITE INTO TABLE pokes;
# 查询
select * from pokes;
查询结果:
至此,就可以开始愉快的写Hive SQL了。
查找表信息:
hive> show create table pokes;
OK
CREATE TABLE `pokes`(
`foo` int,
`bar` string)
ROW FORMAT SERDE
'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe'
STORED AS INPUTFORMAT
'org.apache.hadoop.mapred.TextInputFormat'
OUTPUTFORMAT
'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
LOCATION
'hdfs://namenode:8020/user/hive/warehouse/pokes'
TBLPROPERTIES (
'transient_lastDdlTime'='1606614975')
Time taken: 1.068 seconds, Fetched: 13 row(s)
浏览器查看hdfs -> Utilities:
hive 分区(静态分区,动态分区):
分区表的的字段不能是定义表的字段,不然会报重复columns
hive> create table t1(
> id int
> ,name string
> ,hobby array<string>
> ,add map<String,string>
> )
> partitioned by (name string)
> row format delimited
> fields terminated by ','
> collection items terminated by '-'
> map keys terminated by ':'
> ;
FAILED: SemanticException [Error 10035]: Column repeated in partitioning columns
收尾工作
安装vi、lrzsz
准备sql表数据时,发现这个docker image默认没有安装vi,就自己安一个吧。
apt-get update
apt-get install vim
# lrzsz是一个上传下载文件的工作,也安装一下
apt-get install lrzsz
关闭相关命令
# 关闭hive相关服务
docker-compose kill
# 关闭docker
systemctl stop docker
# 跑路
init 0
END
一套操作下来,好像也没省多少事。但是有docker,部署乱七八糟的环境还是挺省心的。
安装过程有问题的小伙伴,可以看下面的参考链接,也可以评论交流。
参考链接
清华镜像站安装docker:https://mirror.tuna.tsinghua.edu.cn/help/docker-ce/
Centos7下安装Docker:https://blog.csdn.net/u014069688/article/details/100532774
Docker Compose教程:https://www.runoob.com/docker/docker-compose.html
Docker Compose详解:https://www.jianshu.com/p/658911a8cff3
配置docker国内镜像源:https://www.cnblogs.com/reasonzzy/p/11127359.html
git配置连接github:https://www.cnblogs.com/smartwen666/p/7891108.html
docker-hive github:https://github.com/big-data-europe/docker-hive
docker 安装Hive的更多相关文章
- docker安装hive笔记
前两篇文章介绍了docker的基本命令如何安装hadoop 那么大家会比较了解docker的基本语法的安装过程.那么咱们今天来一起安装一下hive. 安装 1.下载gitHub,地址:https:// ...
- HADOOP docker(四):安装hive
1.hive简介2.安装hive2.1 环境准备2.1.1 下载安装包2.1.2 设置hive用户的环境变量2.1.3 hive服务端配置文件2.1.4 hive客户端配置文件2.1.4 分发hive ...
- docker安装hadoop集群
docker安装hadoop集群?图啥呢?不图啥,就是图好玩.本篇博客主要是来教大家如何搭建一个docker的hadoop集群.不要问 为什么我要做这么无聊的事情,答案你也许知道,因为没有女票.... ...
- Docker+Hadoop+Hive+Presto 使用Docker部署Hadoop环境和Presto
Background 一. 什么是Presto Presto通过使用分布式查询,可以快速高效的完成海量数据的查询.如果你需要处理TB或者PB级别的数据,那么你可能更希望借助于Hadoop和HDFS来完 ...
- 调度系统Airflow1.10.4调研与介绍和docker安装
Airflow1.10.4介绍与安装 现在是9102年,8月中旬.airflow当前版本是1.10.4. 随着公司调度任务增大,原有的,基于crontab和mysql的任务调度方案已经不太合适了,需要 ...
- 安装Hive(独立模式 使用mysql连接)
安装Hive(独立模式 使用mysql连接) 1.默认安装了java+hadoop 2.下载对应hadoop版本的安装包 3.解压安装包 tar zxvf apache-hive-1.2.1-bin. ...
- 附录C 编译安装Hive
如果需要直接安装Hive,可以跳过编译步骤,从Hive的官网下载编译好的安装包,下载地址为http://hive.apache.org/downloads.html . C.1 编译Hive C.1 ...
- 理解Docker(1):Docker 安装和基础用法
本系列文章将介绍Docker的有关知识: (1)Docker 安装及基本用法 (2)Docker 镜像 (3)Docker 容器的隔离性 - 使用 Linux namespace 隔离容器的运行环境 ...
- docker安装
系统要求:需要一个64位的centos7操作系统和版本3.10或更高版本的Linux内核 开始安装: uname -r //查看内核版本yum -y update //更新系统更新到最新 #安装d ...
随机推荐
- Java基础00-修饰符18
1. 包 1.1 包的概述和使用 通过记事本的方法 package com.itheima;public class HelloWorld { public static void main(Stri ...
- Function.identity()
Java 8允许在接口中加入具体方法.接口中的具体方法有两种,default方法和static方法,identity()就是Function接口的一个静态方法.Function.identity()返 ...
- SpringBoot 构造器注入、Setter方法注入和Field注入对比
0. 引入 今天在看项目代码的时候发现在依赖注入的时候使用了构造器注入,之前使用过 Field 注入和 Setter 方法注入,对构造器注入不是很了解.经过查阅资料看到,Spring 推荐使用构造器注 ...
- 解决linux下按退格键出现 ^? 的问题
处理办法:使用stty命令修改. stty命令语法 stty是linux下改变和打印终端设置的常用命令. stty(选项)(参数) -a:以容易阅读的方式打印当前的所有配置: -g:以stty可读方式 ...
- P4334 [COI2007] Policija
P4334 [COI2007] Policija 题意 一个无重边的无向图,每次询问删掉一条边或删掉一个点后两个点是否联通. 思路 连通性问题,我们可以考虑使用广义圆方树解决. 对于删掉一个点的情况: ...
- python -- 负数平方根-虚数的使用
负数的平方根是虚数. 不能使用sqrt,因为它只能处理浮点数,而虚数是完全不同的--这也是由另外一个叫做cmath(即 complex math, 复数)的模块来实现这些功能的原因. >> ...
- linux服务器环境部署(三、docker部署nginx)
一.下载nginx镜像 官网地址:https://hub.docker.com/_/nginx #下载镜像 默认为最新版本 docker pull nginx#下载指定版本 docker pull n ...
- 前后端数据交互利器--Protobuf
Protobuf 介绍 Protocol Buffers(又名 protobuf)是 Google 的语言中立.平台中立.可扩展的结构化数据序列化机制. https://github.com/prot ...
- oracle Group by 分组查询后,分页
------------恢复内容开始------------ 1.分页查询 select count(*) times,title from menulog group by title order ...
- S7-200通过以太网模块,使用kepware与ifix建立通讯连接要点
在前阵子项目改造中,需要利用先前的S7-200 PLC与ifix进行通讯,故而,在做好上位机后,在现场实际测试了下.通过CP243-1以太网模块,顺利与KEPWARE建立连接,其中当然也有些要点要注意 ...