本文的安装版本为Hive 3.1.2，且安装为单节点。

1. 安装参考及注意事项

(1) 官网：http://hive.apache.org/

(2) 上篇博客：Hadoop 3.1.3伪分布式环境安装Hive 3.1.2的异常总结

2. 常见属性配置

(1) Hive数据仓库位置

1) default数据仓库原始位置在hdfs上，默认路径为/user/hive/warehouse

2) 在仓库目录下，没有对默认的数据库default创建文件夹。如果某张表属于default数据库，直接在数据仓库目录下创建一个文件夹

3) 修改default数据仓库原始位置（将hive-default.xml.template如下配置信息拷贝到hive-site.xml文件中）

<property>

    <name>hive.metastore.warehouse.dir</name>

    <value>/user/hive/warehouse</value>

    <description>location of default database for the

warehouse</description>

</property>

(2) 查询后常用信息显示配置

1) 在hive-site.xml文件中添加如下配置信息，就可以实现显示当前数据库，以及查询表的头信息配置

<!-- 显示表的列名 -->

<property>

    <name>hive.cli.print.header</name>

    <value>true</value>

</property>

<!-- 显示数据库名称 -->

<property>

    <name>hive.cli.print.current.db</name>

    <value>true</value>

</property>

　　(3) 参数配置方式

1) 查看当前配置: set;

2) 参数配置三种方式

a. 默认配置文件: hive-default.xml，用户自定义文件：hive-site.xml

注意：用户自定义配置会覆盖默认配置。另外，Hive也会读入Hadoop的配置，因为Hive是作为Hadoop的客户端启动的，Hive的配置会覆盖Hadoop的配置。配置文件的设定对本机启动的所有Hive进程都有效

b. 命令行参数方式

启动hive时，可以通过--hiveconf <property=value>方式进行配置，注意仅对本次hive启动有效。例如：

hive -hiveconf mapred.reduce.tasks=10;

查看参数设置：set mapred.reduce.tasks;

c. 参数声明方式

可以在HQL中使用SET关键字设定参数：hive> set mapred.reduce.tasks=100;

上述三种设定方式的优先级依次递增。即配置文件<命令行参数<参数声明。注意某些系统级的参数，例如log4j相关的设定，必须用前两种方式设定，因为那些参数的读取在会话建立以前已经完成了

3. 简单使用

(1) 启动hive: 配置环境变量后，直接运行hive即可

(2) 查看当前数据库: show databases;

(3) 打开默认数据库: user default;

(4) 创建一张表: create table test(id int, name string);

(5) 显示数据库中有几张表: show tables;

(6) 查看简要表结构: desc student;

(7) 查看详细表结构: desc formatted student;

(8) 向表中插入数据: insert into student values(1,'ws');

(9) 查询表中数据: select * from student;

(10) 退出: quit;或exit;

4. 本地文件导入Hive

(1) 本地数据文件student.txt，内容如下：

1001    ss1

1002    ss2

1003    ss3

1004    ss4

1005    ss5

1006    ss6

1007    ss7

1008    ss8

　　(2) 创建数据表，且文件分隔符为'\t':

create table if not exists student(id int, name string) row format delimited fields terminated by '\t';

(3) 加载本地

load data local inpath '/home/ws/module/hive/data/student.txt' into table student;

(4) 查询结果：

select * from student;

Hive(2)-Hive安装及简单使用的更多相关文章

基于MySQL元数据的Hive的安装和简单測试
引言: Hive是一种强大的数据仓库查询语言,类似SQL,本文将介绍怎样搭建Hive的开发測试环境. 1. 什么是Hive? hive是基于Hadoop的一个数据仓库工具,能够将结构化的数据文件映射为 ...
Hive介绍、安装（转）
1.Hive介绍 1.1 Hive介绍 Hive是一个基于Hadoop的开源数据仓库工具,用于存储和处理海量结构化数据.它是Facebook 2008年8月开源的一个数据仓库框架,提供了类似于SQL语 ...
Hive数据仓库工具安装
一.Hive介绍 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单SQL查询功能,SQL语句转换为MapReduce任务进行运行. 优点是可以通过类S ...
Hive学习笔记——安装和内部表CRUD
1.首先需要安装Hadoop和Hive 安装的时候参考 http://blog.csdn.net/jdplus/article/details/46493553 安装的版本是apache-hive-2 ...
Hive介绍及安装
Hive介绍及安装介绍: Hive是基于Hadoop的数据仓库解决方案.由于Hadoop本身在数据存储和计算方面有很好的可扩展性和高容错性,因此使用Hive构建的数据仓库也秉承了这些特性. 简单来说 ...
Hive环境的安装
hive是什么:hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能(HQL) hive有什么用 1.通过类SQL语句快速实现简单的Map ...
Hive环境的安装部署（完美安装）（集群内或集群外都适用）（含卸载自带mysql安装指定版本）
Hive环境的安装部署(完美安装)(集群内或集群外都适用)(含卸载自带mysql安装指定版本) Hive 安装依赖 Hadoop 的集群,它是运行在 Hadoop 的基础上. 所以在安装 Hive 之 ...
Apache Hive 简介及安装
简介 Hive 是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类 SQL 查询功能. 本质是将 SQL 转换为 MapReduce 程序. 主要用途:用来 ...
Hive介绍和安装部署
搭建环境部署节点操作系统为CentOS,防火墙和SElinux禁用,创建了一个shiyanlou用户并在系统根目录下创建/app目录,用于存放 Hadoop等组件运行包.因为该目录用于安装h ...
Hive集成HBase;安装pig
Hive集成HBase 配置将hive的lib/中的HBase.jar包用实际安装的Hbase的jar包替换掉 cd /opt/hive/lib/ ls hbase-0.94.2* rm -rf ...

随机推荐

【开源项目推荐】Apache Superset——最优秀的开源数据可视化与数据探索平台
大家好,我是独孤风. 数据可视化是数据领域一个非常重要的应用.而结合了数据可视化和数据探索功能的BI(商业智能)工具,更是被各大公司青睐.但是,由于数据可视化工具的开发成本过高,长期以来一直是商业化的 ...
python pycurl 安装使用
python pycurl 安装使用本文主要讲下pycurl 安装使用. 1.安装首先使用 pip 命令安装. pip install pycurl 输出如下: Collecting pycurl ...
浅谈JSP中forward和redirect
redirect 重定向,完全的跳转,浏览器将会得到跳转的地址,并重新发送请求链接 forward 转向,浏览器中不会显示后面的网址;如果你需要在下一个页面中能从中获取新的信息的话,你可以Reques ...
ElasticSearch之Exists API
检查指定名称的索引是否存在. 命令样例如下: curl -I "https://localhost:9200/testindex_002?pretty" --cacert $ES_ ...
Python——第四章：迭代器（Iterators）
迭代器iterator: 提到迭代器,最典型的就是for循环 for 变量 in 可迭代: pass 可迭代对象iterable: 是指可以使用 for 循环进行遍历的对象.除了字符串 (str).列 ...
10.elasticsearch集群red恢复损坏的索引
背景客户磁盘损坏,修复磁盘后,重启机器,发现elasticsearch启动成功,ES状态正常green,但是历史数据都没有加载进,查看ES存储数据目录,发现数据还在. 解决方案首先,需要确认ind ...
2022年发布jar到Maven公共仓库最全攻略
2022年jar包发布到Maven公共仓库最全攻略分几个步骤: 1.注册 issues.sonatype.org 账号 2.创建 issues 填写项目地址(github.gitee等) 3.验证域 ...
第八部分_Shell脚本之综合案例实训
综合案例 1. 实战案例1 ㈠具体需求写一个脚本,将跳板机上yunwei用户的公钥推送到局域网内可以ping通的所有机器上说明:主机和密码文件已经提供 10.1.1.1:123456 10.1. ...
华为云推出全自研数据库，GaussDB(openGauss)能否撑起一片天？
摘要:GaussDB(openGauss) 基于华为云底座,能够快速全球化部署,同时支持用户的本地化部署诉求,跟云上生态工具紧密结合让用户在迁移.开发.运维上省时省心. GaussDB(openGau ...
古有诸葛亮八卦阵阻敌，今有 iptables 护网安
摘要:保障网络环境的安全,我们得"武装"起来,守住各个入口.怎么"武装"呢? 网络世界就和现实世界一样,总是会有些不怀好意的"人"出现,扫扫 ...