Hive环境搭建及基本操作

伪分布式

一、安装及配置Hive

1.配置HADOOP_HOME和Hive conf 目录hive-env.sh

# Set HADOOP_HOME to point to a specific hadoop install directory

HADOOP_HOME=/opt/softwares/hadoop-2.8.0

# Hive Configuration Directory can be controlled by:

export HIVE_CONF_DIR=/opt/softwares/hive-1.2.2/conf

2.在HDFS文件系统中创建两个目录并为同组用户添加执行权限

In addition, you must use below HDFS commands to create /tmp and /user/hive/warehouse (aka hive.metastore.warehouse.dir) and set them chmod g+w before you can create a table in Hive

$ $HADOOP_HOME/bin/hadoop fs -mkdir       /tmp

$ $HADOOP_HOME/bin/hadoop fs -mkdir       /user/hive/warehouse

$ $HADOOP_HOME/bin/hadoop fs -chmod g+w   /tmp

$ $HADOOP_HOME/bin/hadoop fs -chmod g+w   /user/hive/warehouse

3.运行Hive shell(CLI)

！！！必须在HDFS启动之后启动Hive

$ $HIVE_HOME/bin/hive

4.HQL操作

show databases ;

use/create default;

show tables;

#显示表信息

desc student;

#显示表详细信息

desc extended student;

#显示表格式化后的详细信息

desc formatted student;

create table student(id int, name string)ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t'; 	# 行格式分隔的字段以“t”结尾

load data local inpath '/opt/datas/test' into table databaseName.student;					# 从本地文件导入数据到表中，数据库名可以加可以不加，跟手动 put 是一样的

select * from student;

select id form student;

show functions;

desc function xxx;					#注意没有s

desc function extended xxx;			#详细

#显示帮助

#/bin/hive -help

#启动时设置配置信息

bin/hive --hiveconf <property=value>

#!!!在Hive中操作文件dfs系统

dfs -cp xxx xxx;

#!!!在Hivez中操作本地文件系统

!ls /opt/datas

二、安装MySQL

1. sudo apt-get install mysql-server

2. sudo apt-get isntall mysql-client

3. sudo apt-get install libmysqlclient-dev

4. service mysql start

5. mysql -uroot -p

6. 在数据库中将root的Hostname改成%,允许所有人登录，所有IP

三、在Hive中配置MySQL作为元数据存储数据库，Metastore

1.拷贝MySQL的驱动Java包(mysql-connector下的jar包)到HIVE-HOME/lib下

2.添加配置文件hive-site.xml(hive-default.xml.template的复刻版)

3.添加并修改连接数据库需要的四个配置

<property>

  <name>javax.jdo.option.ConnectionURL</name>

  <value>jdbc:mysql://localhost:3306/hive?createDatabaseIfNotExist=true</value>

  <description>JDBC connect string for a JDBC metastore</description>

</property>

<property>

  <name>javax.jdo.option.ConnectionDriverName</name>

  <value>com.mysql.jdbc.Driver</value>

  <description>Driver class name for a JDBC metastore</description>

</property>

<property>

  <name>javax.jdo.option.ConnectionUserName</name>

  <value>root</value>

  <description>Username to use against metastore database</description>

</property>

<property>

  <name>javax.jdo.option.ConnectionPassword</name>

  <value>ubuntu</value>

  <description>password to use against metastore database</description>

</property>

<!--显示头信息和当前数据库名-->

<property>

  <name>hive.cli.print.header</name>

  <value>true</value>

  <description>Whether to print the names of the columns in query output.</description>

</property>

<property>

  <name>hive.cli.print.current.db</name>

  <value>true</value>

  <description>Whether to include the current database in the Hive prompt.</description>

</property>

四、各种信息的设置位置说明

1.数据仓库存储位置

	*由1.2.2可知，默认为/user/hive/warehouse

	*配置在hive.default中

		  <property>

		    <name>hive.metastore.warehouse.dir</name>

		    <value>/user/hive/warehouse</value>

		    <description>location of default database for the warehouse</description>

		  </property>

	*在仓库目录下每一个数据库一个文件夹(default除外)		DirName = databaseName.db

	*default下的表也作为一个文件夹在默认路径下存储起来		DirName = tableName

2.配置log目录(非必要)

	*默认路径/tmp/username/hive.log

	*修改conf/hive-log4j.properties文件

3.日志显示级别

	*修改conf/hive-log4j.properties文件

	*hive.root.logger = INFO/DEBUG,DRFA/console

4.在命令行显示当前数据库以及表头信息

	*三中有涉及

5.启动时设置配置信息

	*bin/hive --hiveconf <property=value>

6.查看当前所有配置信息

	*hive > set ;

	*hive > set key = value ;	#临时设置一个值

7.执行历史记录

	~/.hivehistory

五、hive的参数

cen@hostname-ubuntu:/opt/softwares/hive-1.2.2$ bin/hive -help

usage: hive

 -d,--define <key=value>          Variable subsitution to apply to hive 		-d 定义一个值

                                  commands. e.g. -d A=B or --define A=B

    --database <databasename>     Specify the database to use

 -e <quoted-query-string>         SQL from command line 	                    -e 单行查询语句

 -f <filename>                    SQL from files 			                    -f SQL文件

 -H,--help                        Print help information						-help 显示帮助

    --hiveconf <property=value>   Use value for given property 					-hiveconf 临时配置hive

    --hivevar <key=value>         Variable subsitution to apply to hive 		-hivevar

                                  commands. e.g. --hivevar A=B

 -i <filename>                    Initialization SQL file 						-i 初始化的SQL文件，udf相关

 -S,--silent                      Silent mode in interactive shell

 -v,--verbose                     Verbose mode (echo executed SQL to the

                                  console)

#查询结果保存到文件中

bin/hiva -e "select * from student;" > /opt/datas/hive-res.txt

Hive环境搭建及基本操作的更多相关文章

《OD大数据实战》Hive环境搭建
一.搭建hadoop环境 <OD大数据实战>hadoop伪分布式环境搭建二.Hive环境搭建 1. 准备安装文件下载地址: http://archive.cloudera.com/cd ...
《Programming Hive》读书笔记（一）Hadoop和hive环境搭建
<Programming Hive>读书笔记(一)Hadoop和Hive环境搭建先把主要的技术和工具学好,才干更高效地思考和工作. Chapter 1.Int ...
Hive环境搭建
hive 环境搭建需要hadoop的环境.hadoop环境的搭建不在这里赘述.参考:http://www.cnblogs.com/parkin/p/6952370.html 1.准备阶段 hive 官 ...
Spark环境搭建（四）-----------数据仓库Hive环境搭建
Hive产生背景 1)MapReduce的编程不便,需通过Java语言等编写程序 2) HDFS上的文缺失Schema(在数据库中的表名列名等),方便开发者通过SQL的方式处理结构化的数据,而不需要J ...
Hadoop生态圈-Hive快速入门篇之Hive环境搭建
Hadoop生态圈-Hive快速入门篇之Hive环境搭建作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.数据仓库(理论性知识大多摘自百度百科) 1>.什么是数据仓库数据 ...
Docker环境搭建以及基本操作
Docker环境搭建以及基本操作 Docker环境基本搭建: 基础环境:Centos 7.4 IP:192.168.30.117 [root@docker ~]# cat /etc/re ...
Hive环境搭建和SparkSql整合
一.搭建准备环境在搭建Hive和SparkSql进行整合之前,首先需要搭建完成HDFS和Spark相关环境这里使用Hive和Spark进行整合的目的主要是: 1.使用Hive对SparkSql中产 ...
Hive——环境搭建
Hive--环境搭建相关hadoop和mysql环境已经搭建好.我博客中也有相关搭建的博客. 一.下载Hive并解压到指定目录(本次使用版本hive-1.1.0-cdh5.7.0,下载地址:http ...
大数据学习系列之四 ----- Hadoop+Hive环境搭建图文详解(单机)
引言在大数据学习系列之一 ----- Hadoop环境搭建(单机) 成功的搭建了Hadoop的环境,在大数据学习系列之二 ----- HBase环境搭建(单机)成功搭建了HBase的环境以及相关使用 ...

随机推荐

Sharepoint 2013企业内容管理学习笔记(二) 全自动化内容管理
全自动化内容管理所谓全自动化内容管理啊,其实对于用户来说,就更简单便捷有爱了,用户只需要把文件上传到部门网站的放置库中,文件就会快速自动躺到企业记录中心的某个归档记录库了,怎么样,很方便,有没有,很 ...
Linux 下，安装Android Studio
Download the Android Package of Linux from Android Studio, android-studio-bundle-130.737825-linux.tg ...
http：origin,referer和host区别
发起一个ajax请求时,request header里面有三个属性会涉及请求源信息.前端可能用不到这些值,但是,后台业务系统会比较关心它们,场景可能有: 处理跨域请求时,必须判断来源请求方是否合法:后 ...
【^.^】hello world~~
一直以来都没有在公共博客上写作的习惯,加之Evernote的强大和方便好用,让我仅仅依赖它就足以满足日常学习笔记的记录和整理. 不过看着Evernote里面记录的大大小小的笔记已经有400+了,觉得应 ...
笨办法学Python（二十三）
习题 23: 读代码上一周你应该已经牢记了你的符号列表.现在你需要将这些运用起来,再花一周的时间,在网上阅读代码.这个任务初看会觉得很艰巨.我将直接把你丢到深水区呆几天,让你竭尽全力去读懂实实在在的 ...
腾讯云“动态加速”与“CDN”的区别——浅谈对“动态加速”的理解（可能有误）
CDN的劣势及“动态加速”产生背景通常CDN对静态内容支持较好,若使用其加速动态内容,可能会导致异常(如导致无法登录).当然,可以将动态内容的在CDN节点上的缓存时间设置为0秒来解决.但这毕竟是用户 ...
基数排序C#界面版
第一步:生成数据第二步:读取数据第三步:创建队列第四步:入队分配第五步:出队收集重复第四步与第五步,直到出队入队各四次,完成基数排序:如下:4次入队结束后如下:最后一次出队:基数排序完成.. ...
SQL的注入式攻击方式和避免方法
SQL 注入是一种攻击方式,在这种攻击方式中,恶意代码被插入到字符串中,然后将该字符串传递到 SQL Server 的实例以进行分析和执行.任何构成 SQL 语句的过程都应进行注入漏洞检查,因为 SQ ...
andriod给ListView中的TextView增加跑马灯效果
正常情况下跑马灯效果只需要在TextView中添加android:ellipsize="marquee" android:singleLine="true" a ...
AJAX(三)：GET与POST
1.使用场景get是最常见的请求类型,最常用于向服务器查询某些信息仅次于get的是post请求,通常用于向服务器发送应该被保存的数据 2.使用get请求经常会发生一个错误,就是查询字符串的个是有问题, ...

Hive环境搭建及基本操作

伪分布式

一、安装及配置Hive

1.配置HADOOP_HOME和Hive conf 目录hive-env.sh

2.在HDFS文件系统中创建两个目录并为同组用户添加执行权限

In addition, you must use below HDFS commands to create /tmp and /user/hive/warehouse (aka hive.metastore.warehouse.dir) and set them chmod g+w before you can create a table in Hive

3.运行Hive shell(CLI)

！！！必须在HDFS启动之后启动Hive

4.HQL操作

二、安装MySQL

三、在Hive中配置MySQL作为元数据存储数据库，Metastore

四、各种信息的设置位置说明

五、hive的参数

Hive环境搭建及基本操作的更多相关文章

随机推荐

热门专题