Hive的DDL操作
DDL:data definittion language 数据定义语言
主要是定义或改变表的结构、数据类型、表之间的链接和约束等初始化操作
DML:data manipulation language 数据操作语言
主要是对数据库的数据进行增删改查操作,如select、insert、delete、update等
一、对数据库的操作
1.创建数据库并指定在hdfs的存储路径
create database if not exists hive_db location '/hive_db';
注释:不指定路径所创建的数据库默认存储路径为:“/user/hive/warehouse“
create database if not exists hive_ab;
2.查看数据库信息
1)查看数据库结构
desc database hive_db;
2)添加数据库的描述信息
alter database hive_db set dbproperties('creater'='wyh');
3)查看数据库的拓展信息
desc database extended hive_db;
3.筛选查询数据库
show database like 'hive*';
4.删除数据库
drop database wyh;
drop database if exists hive_db;
二、DDL操作
hive中表的种类有很多,如管理表(Manager Table)、外部表(External Table)、分区表(Partition Table)、分桶表,下面我先介绍前三种表的定义、修改操作。
1.管理表:Hive创建表时默认创建的就是管理表,也叫内部表,它不擅长数据共享,删除表后数据也会被删除。
创建管理表
create table if not exists emp1(id int,name string) row format delimited fields terminated by '\t';
导入数据
load data local inpath '/root/data/emp.txt' into table emp1;
创建新管理表并从emp1表中导入name=wyh的该行数据
create table if not exists emp2 as select * from emp1 where name = 'wyh';
查询表的结构信息:
desc formatted emp2;
2.外部表:Hive不任务这张表拥有该数据,所以删除该表后数据不会删除,当再次创建结构与数据类型相同的表(无论是外部表还是管理表)时,数据会自动关联。但是若第二次创建的是管理表,再次删除后即使创建相同格式和数据类型的表数据将不再恢复!
创建外部表
create external table if not exists student(id int,name string) row format delimited fields terminated by '\t';
导入数据
load data local inpath '/root/data/student.txt' into table student;
查看表结构
desc formatted student; (可以从Table Type看到:EXTERNAL_TABLE)
删除表
drop table if exists student;
3.分区表:分区表对应HDFS的一个独立的文件目录,目录下是该分区表所有分区的目录,每个分区目录下存储该分区内存储的数据。
创建分区表
create table dept_partitions(id int,name string,loc string) partitioned by(day string) row format delimited fiedls terminated by '\t';
导入数据
load data local inpath '/root/data/dept.txt' into table dept_partition partition(day='1001');
(注意:不能直接导入数据,必须指定分区)
添加分区
alter table dept_partition add partition(day='1002');
(添加该分区后该分区内是没有数据的)
查询数据
select * from dept_partition where day='1001';
select * from dept_partition;
删除分区
alter table dept_partition drop partition(day='1002');
alter table dept_partition drop partition(day='1001'),partition(day='1002');
三、修改表
1.修改表名
alter table student rename to students;
2.添加列
alter table students add columns(age int,sex string);
3.更新列(列名和列的数据类型)
alter table student change column age birthday string;
4.替换replace
alter table students replace columns(descccc int);
alter table students replace columns(id int,name string,loc string);
注意:第二次替换后列的数据类型与第一次相同,数据会恢复!
Hive的DDL操作的更多相关文章
- Hive学习之路 (七)Hive的DDL操作
库操作 1.创建库 语法结构 CREATE (DATABASE|SCHEMA) [IF NOT EXISTS] database_name [COMMENT database_comment] //关 ...
- Apache Hive (七)Hive的DDL操作
转自:https://www.cnblogs.com/qingyunzong/p/8723271.html 库操作 1.创建库 语法结构 CREATE (DATABASE|SCHEMA) [IF NO ...
- Hive 学习之路(四)—— Hive 常用DDL操作
一.Database 1.1 查看数据列表 show databases; 1.2 使用数据库 USE database_name; 1.3 新建数据库 语法: CREATE (DATABASE|SC ...
- Hive 系列(四)—— Hive 常用 DDL 操作
一.Database 1.1 查看数据列表 show databases; 1.2 使用数据库 USE database_name; 1.3 新建数据库 语法: CREATE (DATABASE|SC ...
- 入门大数据---Hive常用DDL操作
一.Database 1.1 查看数据列表 show databases; 1.2 使用数据库 USE database_name; 1.3 新建数据库 语法: CREATE (DATABASE|SC ...
- Hive学习笔记(三)-- DML和DDL操作
01-Hive表的DDL操作--修改表 创建一个分区表并加载数据 查询数据 修改表 加载数据 查询一下 另外一个命令查询表的分区 如何删除一个分区呢 查询一个,分区被删除了 修改表名 查询改名的新表的 ...
- Hive数据类型和DDL操作
hive命令 在Linux下的命令行中直接输入如下命令,可以查看帮助信息: # hive -help 常用的如-e.-f参数. 使用-e参数,可以直接在命令行传递SQL语句进行hive表数据的查询: ...
- hive基本的操作语句(实例简单易懂,create table XX as select XX)
hive建表语句DML:https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DDL#LanguageManualDDL-Cr ...
- Hive QL的操作
一.数据定义DDL操作 创建表: --create table为创建一个指定名字的表 create(external) table table_name --external关键字可以让用户创建一个外 ...
随机推荐
- DirectX11 With Windows SDK--00 目录
前言 (更新于 2019/4/10) 从第一次接触DirectX 11到现在已经有将近两年的时间了.还记得前年暑假被要求学习DirectX 11,在用龙书的源码配置项目运行环境的时候都花了好几天的时间 ...
- [译]Async/Await - Best Practices in Asynchronous Programming
原文 避免async void async void异步方法只有一个目的:使得event handler异步可行,也就是说async void只能用于event handler. async void ...
- redis---------AOF文件异常导致的redis无法载入
AOF损坏时的对策1.若在写AOF文件时Server崩溃则可能导致AOF文件损坏而不能被Redis载入.可通过如下步骤修复: 创建一个AOF文件的备份: cp appendonly.aof appen ...
- webpack配置less
webpack4.0把webpack.config.js隐藏起来了,需要先暴露出来,在webpack修改配置
- DIV内文字两端对齐
div{ text-align: justify; text-justify:inter-ideograph; }
- java操作mongodb & springboot整合mongodb
简单的研究原生API操作MongoDB以及封装的工具类操作,最后也会研究整合spring之后作为dao层的完整的操作. 1.原生的API操作 pom.xml <!-- https://mvnre ...
- JavaScript事件循环机制
事件循环 事件循环不仅仅包含事件队列,而是具有至少两个队列,除了事件,还要保持浏览器执行的其他操作.这些操作被称为任务,并且分为两类:宏任务(或通常称为任务)和微任务. 单次循环迭代中,最多处理一个宏 ...
- JustSoso笔记
当时想了大半天,想着到底要怎么绕过MD5呢,结果还是没做出来,即使问了学长,自己还是漏了一个步骤,file=hint.php,特此笔记,又学到了个引用变量的知识 学习自 https://www.ctf ...
- gojs常用API-画布定义
持续更新中 基础画布定义API画布初始位置 initialContentAlignment: go.Spot.Center,画布位置,定义后就不能拖动画布了,画布位置交由gojs管理 contentA ...
- nginx 配置proxy_pass URL末尾加与不加/(斜线)的区别
nginx在配置proxy_pass的时候 URL结尾加斜线(/)与不加的区别和注意事项 假设访问路径的 /pss/bill.html 加/斜线的情况 location /pss/ { proxy_p ...