hive分布式搭建文档

谷歌浏览器下载网址：Google Chrome – Download the fast, secure browser from Google

华为云镜像站：https://mirrors.huaweicloud.com/home

1、上传解压配置环境变量

# 1、解压

tar -zxvf apache-hive-3.1.2-bin.tar.gz -C /usr/local/soft/

# 2、重名名

mv apache-hive-3.1.2-bin hive-3.1.2

# 3、配置环境变量

vim /etc/profile

# 4、在最后增加配置

export HIVE_HOME=/usr/local/soft/hive-3.1.2

export PATH=$PATH:$HIVE_HOME/bin

# 5、使环境变量剩下

source /etc/profile

2、修改配置文件

1、进入hive配置文件所在目录

cd /usr/local/soft/hive-3.1.2/conf

2、创建hive-site.xml配置文件

vim hive-site.xml

<?xml version="1.0" encoding="UTF-8" standalone="no"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<configuration>

  <property>

    <name>javax.jdo.option.ConnectionDriverName</name>

    <value>com.mysql.cj.jdbc.Driver</value>

  </property>

  <property>

    <name>javax.jdo.option.ConnectionURL</name>

    <value>jdbc:mysql://master:3306/hive?useSSL=false&amp;createDatabaseIfNotExist=true&amp;characterEncoding=utf8&amp;useUnicode=true</value>

  </property>

  <property>

    <name>javax.jdo.option.ConnectionUserName</name>

    <value>root</value>

  </property>

  <property>

    <name>javax.jdo.option.ConnectionPassword</name>

    <value>123456</value>

  </property>

  <property>

    <name>hive.metastore.uris</name>

    <value>thrift://master:9083</value>

  </property>

  <property>

	<name>hive.server2.enable.doAs</name>

	<value>false</value>

  </property>

<property>

<name>hive.querylog.location</name>

<value/>

</property>

（同上）

<property>

<name>hive.exec.local.scratchdir</name>

<value/>

</property>

（同上）

<property>

<name>hive.downloaded.resources.dir</name>

<value/>

</property>

</configuration>

3、创建log4j.properties配置文件

# 将日志级别改成WARN，避免执行sql出现很多日志

log4j.rootLogger=WARN,CA

log4j.appender.CA=org.apache.log4j.ConsoleAppender

log4j.appender.CA.layout=org.apache.log4j.PatternLayout

log4j.appender.CA.layout.ConversionPattern=%-4r [%t] %-5p %c %x - %m%n%

3、上传mysql驱动

# 将nysql驱动包上传到hive的lib目录下

mysql-connector-java-8.0.29.jar

1.3.6 将hadoop的jline-0.9.94.jar的jar替换成hive的版本。

cp /usr/local/soft/hive-3.1.2/lib/jline-2.12.jar /usr/local/soft/hadoop-3.1.1/share/hadoop/yarn/lib/

4、初始化hive元数据库

# 2、初始化hive的元数据(表结构)到mysql中

schematool -dbType mysql -initSchema

5、启动hive元数据服务

# 后台启动元数据服务

nohup hive --service metastore &

6、进入hive命令行

# 进入hive

hive

# 测试

# 1、创建表

CREATE TABLE IF NOT EXISTS bigdata30.student_test(

    id string ,

    `name` string ,

    age string  ,

    gender string  ,

    clazz string

)

ROW FORMAT DELIMITED FIELDS TERMINATED BY ',';

STORED AS INPUTFORMAT 'org.apache.hadoop.mapred.TextInputFormat'

    OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'

location '/data/student'; 

# 2、执行sql查询数据

select clazz,count(1) as num from student group by clazz;

数据仓库建模工具之一——Hive学习第一天的更多相关文章

大数据之路week07--day05 （一个基于Hadoop的数据仓库建模工具之一 HIve）
什么是Hive? 我来一个短而精悍的总结(面试常问) 1:hive是基于hadoop的数据仓库建模工具之一(后面还有TEZ,Spark). 2:hive可以使用类sql方言,对存储在hdfs上的数据进 ...
基于hadoop的数据仓库工具：Hive概述
Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为MapReduce任务进行运行.其优点是学习成本低,可以通过类 ...
Hive -- 基于Hadoop的数据仓库分析工具
Hive是一个基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库 ...
数仓建模—建模工具PdMan(CHINER)介绍
数据仓库系列文章(持续更新) 数仓架构发展史数仓建模方法论数仓建模分层理论数仓建模-宽表的设计数仓建模-指标体系数据仓库之拉链表数仓-数据集成数仓-数据集市数仓-商业智能系统数仓-埋 ...
hive学习
大数据的仓库Hive学习 10期-崔晓光 2016-06-20 大数据 hadoop 10原文链接我们接着之前学习的大数据来学习.之前说到了NoSql的HBase数据库以及Hadoop中 ...
Hive学习路线图(转)
Hadoophivehqlroadmap学习路线图 1 Comment Hive学习路线图 Hadoop家族系列文章,主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig ...
【转】Hive学习路线图
原文博客出自于:http://blog.fens.me/hadoop-hive-roadmap/ 感谢! Hive学习路线图 Hadoop家族系列文章,主要介绍Hadoop家族产品,常用的项目包括Ha ...
Hive学习路线图--张丹老师
前言 Hive是Hadoop家族中一款数据仓库产品,Hive最大的特点就是提供了类SQL的语法,封装了底层的MapReduce过程,让有SQL基础的业务人员,也可以直接利用Hadoop进行大数据的操作 ...
Hive学习（一）
https://www.cnblogs.com/qingyunzong/p/8707885.html http://www.360doc.com/content/16/1006/23/15257968 ...
IT架构师介绍-软件架构设计学习第一天（非原创）
文章大纲一.架构师定义二.架构师分类与具备能力三.研发人员发展的技术路线四.架构师知识体系五.参考文章一.架构师定义什么是架构师,这个聊架构话题时永恒的问题.每个公司对架构师的定位也有所 ...

随机推荐

ansible api调用及二次封装详解
ansible 2.7调用程序 import json from collections import namedtuple from ansible.parsing.dataloader impo ...
nc反弹中 &>、0>&1是什么意思
1.简介本文结合一些参考文章以及作者个人理解解释Linux的bash反弹命令中的 &>.0>&1 观点有误,欢迎指出! 目标讨论命令:bash -i >& ...
为什么下载程序的时候会提示win-amd64.exe
HTML——input之单选按钮
在 HTML 中,把 <input> 标签的 type 属性设置为 radio 可以表示单选按钮.具体语法格式如下: <input type="radio" /& ...
NumPy 二项分布生成与 Seaborn 可视化技巧
二项分布简介二项分布是一种离散概率分布,用于描述在固定次数的独立试验中,事件"成功"的次数的概率分布.它通常用于分析诸如抛硬币.做选择题等具有两个结果(成功或失败)的事件. 参 ...
Python中多线程的简单使用
from threading import Timer import time def run1(): print(1) print(2) print(3) def run2(): print(&qu ...
win10系统(专业版)实现双网卡链路聚合
win10系统(专业版)实现双网卡链路聚合参考: https://learn.microsoft.com/zh-cn/powershell/module/netswitchteam/new-nets ...
String和StringBuffer、StringBuilder的区别是什么？String为什么是不可变的
a.可变性:String类中使用字符数组保存字符串,private final char value[],所以string对象是不可变的.StringBuilder与StringBuffer ...
Flarum 安装和使用教程
随着开源社区的日益繁荣,人们对社区品质的要求也越来越高.传统的 BBS 论坛模式已经难以满足现代用户对美观.便捷.互动性的需求.搭建一个现代化的高品质社区,成为许多网站管理者的迫切需求和共同挑战. 今 ...
燕千云ITAM：解锁数字化时代下企业竞争新优势
数字化时代下,企业的IT资产管理(ITAM)尤为关键.企业通过在成长的每个阶段实施有效的IT资产管理策略,以确保资源的最优化利用和风险的有效控制,并在竞争激烈的市场环境中保持优势.然而实际实践中,企业 ...

数据仓库建模工具之一——Hive学习第一天

hive分布式搭建文档

1、上传解压配置环境变量

2、修改配置文件

1、进入hive配置文件所在目录

2、创建hive-site.xml配置文件

3、创建log4j.properties配置文件

3、上传mysql驱动

1.3.6 将hadoop的jline-0.9.94.jar的jar替换成hive的版本。

4、初始化hive元数据库

5、启动hive元数据服务

6、进入hive命令行

数据仓库建模工具之一——Hive学习第一天的更多相关文章

随机推荐

热门专题