hive介绍、安装配置、表操作基础知识适合小白学习
1.hive概述
Apache Hive数据仓库软件有助于使用SQL读取,编写和管理驻留
在分布式存储中的大型数据集。可以将结构投影到已存储的数据中。
提供了命令行工具和JDBC驱动以将用户连接到Hive。
2.hive优缺点
优点:
(1)操作接口采用了sql,简化开发,减少学习成本。
(2)避免手写mapreduce程序
(3)hive执行延迟较高,使用场景大多用在实时性要求不强的情景
(4)优点在于处理大数据
(5)支持自定义函数
缺点:
(1)hive的sql表达能力有限(HSQL)
(2)hive效率低 hive调优比较难
3.hive架构
提供了一系列的接口:hive shell、jdbc/odbc、webui
4.hive安装
(1)下载安装包 官网地址: hive.apache.org
(2)上传安装包到linux操作系统
alt+p(此处使用的secureCRT)
(3)解压
tar -zxvf .tar -C /opt/moudle/
(4)修改配置文件
conf下的 hive-env.sh.temple重命名为hive-env.sh
修改内容:
HADOOP_HOME=/opt/moudle/hadoop-2.8.4(修改成自己的hadoop安装目录)
export HIVE_CONF_DIR=/opt/moudle/hive/conf(修改成自己的hive的conf目录)
(5)启动hdfs和yarn集群
start-dfs.sh
start-yarn.sh
注意:hive是一种操作数据的软件,它本身不具备存储功能,它的存储依赖的是hdfs,因此启动hive必须启动hadoop。
(6)在hdfs上创建文件夹
hdfs dfs -mkdir /tmp
hdfs dfs -mkdir -p /user/hive/warehouse/
(7)启动hive(切换到hive的安装目录下再输入以下命令)
bin/hive
5.hive测试
1)查看数据库
show databases;
2)使用数据库
use default;
3)查看表
show tables;
4)创建表
create table student(id int,name string);
5)插入数据
insert into student values(1,"Lilei");
6)查询
select * from student;
7)删除表
drop table student;
8)退出终端
quit;
6.DDL数据定义
1)创建数据库
1.1)查看数据库
show databases;
1.2)创建数据库
create database db_hive;
1.3)创建数据库标准写法
create database if not exists db_hive;
1.4)创建数据库指定所在hdfs路径
create database hive_db1 location '/hive_db';
2)修改数据库
2.1)查看数据库结构
desc database hive_db;
2.2)添加描述信息
alter database hive_db set dbproperties('dataname'='animal');
2.3)查看拓展属性
desc database extended hive_db;
3)查询数据库
3.1)显示数据库
show databases;
3.2)筛选查询的数据库
show database like 'db*';
4)删除数据库
4.1)删除数据路
drop database hive_db;
4.2)删除数据的标准写法
drop database if exists hive_db;
5)创建表
5.1)创建表
create table student(id int,name string) row format delimited fields terminated by ’\t‘;
6)管理表
不擅长做数据共享,删除hive中管理表,数据删除。
6.1)加载数据
load data local inpath '/root/itstar.txt' into table student;
6.2)查询并保存到一张新的表
create table if not exists student1 as select * from student where name = 'Lilei';
6.3)查询表结构
desc formatted emp;
查询结果:
Table Type: MANAGED_TABLE
7)外部表
hive不认为这张表拥有这份数据,删除该表,数据不删除。擅长做数据共享。
7.1)创建外部表
>create external table if not exists emptable(empno int,ename string)
> row format
> delimited fields
> terminated by '\t';
7.2)导入数据
load data local inpath '/root/emp.txt' into table emptable;
7.3)查看表的结构
desc formatted emptable;
查询结果:
Table Type: EXTERNAL_TABLE
7.4)删除表
drop table emptable;
提示:再次创建相同的表 字段相同 将自动关联数据!
如果对你有帮助,欢迎转载!
hive介绍、安装配置、表操作基础知识适合小白学习的更多相关文章
- 《JAVASCRIPT高级程序设计》表单基础知识和文本框脚本
在HTML中,表单是由<form>元素来表示,在javascript中,表单对应的是HTMLFormElement类型,它具有一些独有的属性和方法: 一.表单基础知识 1.取得表单的方式 ...
- 【ABAP系列】SAP ABAP-模块 字符串操作基础知识
公众号:SAP Technical 本文作者:matinal 原文出处:http://www.cnblogs.com/SAPmatinal/ 原文链接:[ABAP系列]SAP ABAP-模块 字符串操 ...
- [SQL]SQL Server数据表的基础知识与增查删改
SQL Server数据表的基础知识与增查删改 由张晨辉(学生) 于19天 前发表 | 阅读94次 一.常用数据类型 .整型:bigint.int.smallint.tinyint .小数:decim ...
- Hive的安装配置
Hive的安装配置 Hive的安装配置 安装前准备 下载Hive版本1.2.1: 1.[root@iZ28gvqe4biZ ~]# wget http://mirror.bit.edu.cn/apac ...
- 【转】hive简介安装 配置常见问题和例子
原文来自: http://blog.csdn.net/zhumin726/article/details/8027802 1 HIVE概述 Hive是基于Hadoop的一个数据仓库工具,可以将结构化 ...
- Hive 组件安装配置
下载和解压安装文件 基础环境和安装准备 Hive组件的部署规划和软件包路径如下: (1)当前环境中已安装 Hadoop全分布系统 (2)本地安装 MySQL数据库(账号 root,密码 Passwor ...
- IDEA 安装配置及操作总结(新手必看)
Jetbrains官网下载IDEA15 我们在浏览器输入网址https://www.jetbrains.com/.选择相应的系统版本,下载最新版本的IDEA15,Windows系统双击安装文件,根据界 ...
- SharePoint Framework (SPFx)安装配置以及开发-基础篇
前言 SharePoint Framework(SPFx),是页面 和Webpart的模型,完全支持本地开发(即完全可以脱离SharPoint环境在本地进行开发),SPFx包含了一系列的client- ...
- [Hive_2] Hive 的安装&配置
0. 说明 在安装好 Hadoop 集群和 ZooKeeper 分布式的基础上装好 MySQL,再进行 Hive 安装配置 1. 安装 1.1 将 Hive 安装包通过 Xftp 发送到 /home/ ...
随机推荐
- Android应用程序启动过程(二)分析
本文依据Android6.0源码,从点击Launcher图标,直至解析到MainActivity#OnCreate()被调用. Launcher简析 Launcher也是个应用程序,不过是个特殊的应用 ...
- 你写的什么垃圾代码让Vsync命令不能及时处理呢?(1)
想想自己写的什么垃圾代码导致Vsync不能及时处理#(不高兴) 想不开? 实际开发中性能问题不好复现?这你就可能需要一些工具来帮你检测这种情况. 首先是Android系统自带的工具(4.1之后的版本) ...
- JQuery this和$(this)的区别
this其实是一个Html 元素. $this 只是个变量名,加$是为说明其是个jquery对象. 而$(this)是个转换,将this表示的dom对象转为jquery对象,这样就可以使用jquery ...
- cxfreeze打包python程序的方法说明(生成安装包,实现桌面快捷方式、删除快捷方式)
一.cxfreeze基础 1.cxfreeze功能 python代码文件转exe方法有三种,分别是cx_freeze,py2exe,PyInstaller,这三种方式各有千秋,本人只用过py2exe和 ...
- Linux 系统级别优化_【all】
Linux 系统优化 1.Linux系统关闭SELinux 2.Linux系统开机到登录之前启动流程 3.Linux系统设置运行级别 4.Linux系统重要的开机自启动的服务 5.Linux查看系统当 ...
- Git使用本地仓库之基本操作
1.Git是什么? 一个分布式版本控制系统,和SVN类似,但远比SVN强大的一个版本控制系统 ①Git可以方便的在本地进行版本管理,如同你本地有一个版本管理服务器一样我们可以选择在合适的时间将本地版本 ...
- ZT 查找字符串中连续最长的数字串
查找字符串中连续最长的数字串 有俩方法,1)比较好理解一些.2)晦涩 1) /* 功能:在字符串中找出连续最长的数字串,并把这个串的长度返回, 并把这个最长数字串付给其中一个函数参数outputstr ...
- ZT C语言实现字符串倒序
http://blog.chinaunix.net/uid-20788517-id-34777.html 分类: C/C++ 1 #include <stdio.h> 2 #includ ...
- Hibernate查询(HQL——Hibernate Query Language)
HQL查询 HQL提供了是十分强大的功能,它是针对持久化对象,用取得对象,而不进行update,delete和insert等操作.而且HQL是面向对象的,具备继承,多态和关联等特性. from子句: ...
- mysql分页(ajax)
分页有多种方式,mysql的limit是个不错的选择,通过ajax实现异步刷新,将当前页数和每页数量传入后台即可 1. 首先后台要拿到总记录数和所需显示数据列表,所以要分别写两个sql方法 我这里是通 ...