前两篇文章介绍了docker的基本命令如何安装hadoop

那么大家会比较了解docker的基本语法的安装过程。那么咱们今天来一起安装一下hive。

安装

1、下载gitHub,地址:https://github.com/prasanthj/docker-hive-on-tez。如果背墙了,可以选择下载zip。进入目录之后就能看见如下内容:

@~/git/github/docker-hive-on-tez-master $ ls
Dockerfile datagen.py hive-log4j.properties store_sales.sql
LICENSE hive-0.14 hive-site.xml store_sales.txt
README.md hive-bootstrap.sh postgresql.conf

2、安装:

docker build --no-cache=true -t local-hive-on-tez .

这是一个漫长的过程,喝一杯咖啡,该干嘛干嘛,几个小时之后回来......

3、进入系统

docker --tls run -i -t -P local-hive-on-tez /etc/hive-bootstrap.sh -bash
Starting postgresql server...
/
-- :: GMT LOG: database system was interrupted; last known up at -- :: GMT
-- :: GMT LOG: database system was not properly shut down; automatic recovery in progress
-- :: GMT LOG: redo starts at /1782A58

4、查看hive

root@2c1282c522bf:/# hive -f /opt/files/store_sales.sql

Logging initialized using configuration in file:/usr/local/hive-dist/apache-hive-0.15.-SNAPSHOT-bin/conf/hive-log4j.properties
SLF4J: Class path contains multiple SLF4J bindings.
SLF4J: Found binding in [jar:file:/usr/local/hadoop-2.5./share/hadoop/common/lib/slf4j-log4j12-1.7..jar!/org/slf4j/impl/StaticLoggerBinder.class]

5、端口映射

如果你只想登录虚拟机玩玩,这个就足够了,可是还想看看这个hadoop运行的怎么样,需要在页面查看一下

@~/VirtualBox VMs/boot2docker-vm $ docker ps -a
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
2c1282c522bf local-hive-on-tez:latest "/etc/hive-bootstrap 39 hours ago Up 6 hours 0.0.0.0:49181->8032/tcp, 0.0.0.0:49182->50075/tcp, 0.0.0.0:49183->50010/tcp, 0.0.0.0:49184->50090/tcp, 0.0.0.0:49185->8031/tcp, 0.0.0.0:49186->8040/tcp, 0.0.0.0:49187->8088/tcp, 0.0.0.0:49188->22/tcp, 0.0.0.0:49189->50020/tcp, 0.0.0.0:49190->8030/tcp, 0.0.0.0:49191->49707/tcp, 0.0.0.0:49192->8033/tcp, 0.0.0.0:49193->8042/tcp, 0.0.0.0:->/tcp kickass_galileo

发现上面的一个端口是49194对应虚拟机的50070端口。

这还不够,需要知道自己的boot2docker的ip是什么?默认是192.168.59.103

那么需要在自己的浏览器输入:http://192.168.59.103:49194/ 就会看见hadoop的运行状态了。

备注:

为什么下载github?

因为需要获取他的Dockerfile,好让docker知道它依赖docker-tez,然后在虚拟机执行下载和安装hive,内容如下:

FROM prasanthj/docker-tez:tez-0.5.2  #这是说明依赖什么,下面是安装命令
MAINTAINER Prasanth Jayachandran # to configure postgres as hive metastore backend
RUN apt-get update
RUN apt-get -yq install vim postgresql-9.3 libpostgresql-jdbc-java # having ADD commands will invalidate the cache forcing hive build from trunk everytime
# copy config, sql, data files to /opt/files
RUN mkdir /opt/files
ADD hive-site.xml /opt/files/
ADD hive-log4j.properties /opt/files/
ADD store_sales.* /opt/files/
ADD datagen.py /opt/files/ # clone and compile hive
ENV HIVE_VERSION 0.15.-SNAPSHOT
RUN cd /usr/local && git clone https://github.com/apache/hive.git #在天朝这可能被墙,所以速度非常慢
RUN cd /usr/local/hive && /usr/local/maven/bin/mvn clean install -DskipTests -Phadoop-,dist
RUN mkdir /usr/local/hive-dist && tar -xf /usr/local/hive/packaging/target/apache-hive-${HIVE_VERSION}-bin.tar.gz -C /usr/local/hive-dist # set hive environment
ENV HIVE_HOME /usr/local/hive-dist/apache-hive-${HIVE_VERSION}-bin
ENV HIVE_CONF $HIVE_HOME/conf
ENV PATH $HIVE_HOME/bin:$PATH
ADD hive-site.xml $HIVE_CONF/hive-site.xml
ADD hive-log4j.properties $HIVE_CONF/hive-log4j.properties # zookeeper pulls jline 0.9. and hive pulls jline2. This workaround is from HIVE-
RUN rm $HADOOP_PREFIX/share/hadoop/yarn/lib/jline-0.9..jar # add postgresql jdbc jar to classpath
RUN ln -s /usr/share/java/postgresql-jdbc4.jar $HIVE_HOME/lib/postgresql-jdbc4.jar # set permissions for hive bootstrap file
ADD hive-bootstrap.sh /etc/hive-bootstrap.sh
RUN chown root:root /etc/hive-bootstrap.sh
RUN chmod /etc/hive-bootstrap.sh # to avoid psql asking password, set PGPASSWORD
ENV PGPASSWORD hive
# 下面是安装postgresql,这个在国外很流行
# To overcome the bug in AUFS that denies postgres permission to read /etc/ssl/private/ssl-cert-snakeoil.key file.
# https://github.com/Painted-Fox/docker-postgresql/issues/30
# https://github.com/docker/docker/issues/783
# To avoid this issue lets disable ssl in postgres.conf. If we really need ssl to encrypt postgres connections we have to fix permissions to /etc/ssl/private directory everytime until AUFS fixes the issue
ENV POSTGRESQL_MAIN /var/lib/postgresql/9.3/main/
ENV POSTGRESQL_CONFIG_FILE $POSTGRESQL_MAIN/postgresql.conf
ENV POSTGRESQL_BIN /usr/lib/postgresql/9.3/bin/postgres
ADD postgresql.conf $POSTGRESQL_MAIN
RUN chown postgres:postgres $POSTGRESQL_CONFIG_FILE USER postgres
# create metastore db, hive user and assign privileges
RUN /etc/init.d/postgresql start &&\
psql --command "CREATE DATABASE metastore;" &&\
psql --command "CREATE USER hive WITH PASSWORD 'hive';" && \
psql --command "ALTER USER hive WITH SUPERUSER;" && \
psql --command "GRANT ALL PRIVILEGES ON DATABASE metastore TO hive;" && \
cd $HIVE_HOME/scripts/metastore/upgrade/postgres/ &&\
psql -h localhost -U hive -d metastore -f hive-schema-0.15..postgres.sql # revert back to root user
USER root

参考:

https://github.com/prasanthj/docker-hive-on-tez

https://github.com/prasanthj/docker-hadoop

https://github.com/prasanthj/docker-tez

docker安装hive笔记的更多相关文章

  1. docker 安装Hive

    转自:https://www.cnblogs.com/upupfeng/p/13452385.html#%E9%83%A8%E7%BD%B2hive 使用docker快速搭建hive环境   记录一下 ...

  2. docker安装小笔记

    作者:邓聪聪 yum update Docker 要求 CentOS 系统的内核版本高于 3.10 ,查看本页面的前提条件来验证你的CentOS 版本是否支持 Docker docker卸载旧版本(如 ...

  3. docker 安装 jenkins 笔记

    前提: 已安装好 docker-ce,可运行 docker 命令 命令: sudo docker pull jenkins mkdir -p ~/dockers/jenkins cd ~/docker ...

  4. docker安装mysql笔记

    首先 查找镜像 docker search mysql 拉取镜像 : docker pull mysql 拉取成功后,查看本地镜像: docker images 可以看到本地有两个镜像(redis是我 ...

  5. 2. Docker - 安装

    一.Docker介绍 1. Docker是一个开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中,然后发布到任何流行的Linux机器上, 也可以实现虚拟化. 容器时完全使用沙 ...

  6. HADOOP docker(四):安装hive

    1.hive简介2.安装hive2.1 环境准备2.1.1 下载安装包2.1.2 设置hive用户的环境变量2.1.3 hive服务端配置文件2.1.4 hive客户端配置文件2.1.4 分发hive ...

  7. 【Linux】【自学笔记】Linux下面docker安装mysql

    写在前面: 捣腾继续,之前把一个SpringBoot的程序安装在docker上面,参考链接:https://www.cnblogs.com/aki-stones/p/2019-11-01-note.h ...

  8. MongoDB学习笔记二:使用Docker安装MongoDB

    目录 Docker安装MongoDB Docker给MongoDB设置用户密码 NoSQL Manager for MongoDB连接 为admin赋权限 上一个笔记介绍了Windows下安装Mong ...

  9. Docker笔记——Docker安装及制作镜像

    1 Docker安装本文中Docker运行环境为Ubuntu 14.04.1 LTS 3.13.0-32-generic x64参考:https://docs.docker.com/v1.11/eng ...

随机推荐

  1. python 全栈开发,Day26(hashlib文件一致性,configparser,logging,collections模块,deque,OrderedDict)

    一.hashlib文件一致性校验 为何要进行文件一致性校验? 为了确保你得到的文件是正确的版本,而没有被注入病毒和木马程序.例如我们经常在网上下载软件,而这些软件已经被注入了一些广告和病毒等,如果不进 ...

  2. asp.net core 支付宝支付( 电脑2.0)

    支付宝电脑支付实测在手机浏览器也可以唤醒手机支付宝进行支付,因此也可以作为支付宝手机web支付方式.支付宝电脑支付流程为使用支付宝官方sdk通过获取的支付宝参数构造DefaultAopClient实例 ...

  3. python全栈开发day15-递归函数、二分查找

    1.昨日内容回顾 主要内置函数: map(func,iter1):返回迭代器 filter(func,iter1):返回迭代器 sorted(iter,key=,reverse=):返回列表 reve ...

  4. asp.net core 2.0 cookie的使用

    本文假设读者已经了解cookie的概念和作用,并且在传统的.net framework平台上使用过. cookie的使用方法和之前的相比也有所变化.之前是通过cookie的add.set.clear. ...

  5. Redis简单了解

    Redis介绍 Redis(REmote DIctionary Server)是一个开源的使用ANSI C语言编写.遵守BSD协议.支持网络.可基于内存亦可持久化的日志型.Key-Value数据库, ...

  6. Redis中的key的通用操作

    1.看看所有的key 2.查看以mys开头的key 3.是否存在 4.删除 5.重命名. 6.设置过期时间与所剩的时间 如果没有设置,返回-1. 7.返回类型

  7. KAFKA的安装使用

    一:介绍 1.官网 kafka.apache.org 2.产生 Kafka由 linked-in 开源  kafka-即是解决上述这类问题的一个框架,它实现了生产者和消费者之间的无缝连接.  kafk ...

  8. HDU 2612 find a way 【双BFS】

    <题目链接> 题目大意:两个人分别从地图中的Y 和 M出发,要共同在 @ 处会面(@不止有一处),问这两个人所走距离和的最小值是多少. 解题分析: 就是对这两个点分别进行一次BFS,求出它 ...

  9. 图片裁切展示css

    .wen_photo{ overflow:hidden;}.wen_photo img{ margin:0; padding:0; width:100%; height: 100%; object-f ...

  10. 幕布V1.1.9最新版漏洞集合

    0X00 前言 幕布本人最早接触是在P神的知识星球里面看到P神推荐的,后来下了个用着还挺好用. 之前一直都放一些零零散散的笔记,最近整理的时候,一时兴起,本着漏洞源于生活的态度,遂对幕布的安全性做了些 ...