hive的数据定义之创建数据库和表

1、对数据库的操作

　　create database hive_db　　//创建数据库hive_db

　　create table hive_db.test（字段内容及其格式省略）　　//在数据库hive_db中创建test表

　　create database student_db location '/user/hive/student.db'　　//创建数据库student_db，但是在hdfs中显示student.db，在hive控制端中显示studentdb（在有location的情况下）

　　create database if not exists hive_db

　　show databases like 'hive*'　　//结果为hive_db

　　drop database hive_db　　//这种方式只能删除空数据库

　　drop database studentdb casecade　　//强制删除非空数据库

　　describe database hive_db　　//显示数据库的信息

　　create database teacherdb comment "数据库teacherdb的备注"

2、对表的操作

　　create table if not exists hive_db.t1(字段)　　//在数据库hive_db中创建表t1

　　show tables in hive_db like "t*"　　//在数据库hive_db中寻找以t开头的表。

　　create table student1 as select * from stu;　　//复制表及其数据

　　describe extended records;　　//查看表信息

　　describe formatted records　　//查看表详细信息

2.1、内部表与外部表的相互转换：

　　alter table student set tblproperties("EXTERNAL"="TRUE");　　//内部表转换为外部表

　　alter table student set tblproperties("EXTERNAL"="FALSE");　　//外部表转换为内部表

2.2、分区表（分区在hdfs上其实是目录，分区名不是表结构中的字段名而是在创建表和分区时另外加的）：

　　create table stu_partition(id int,name string)

　　partitioned by (month string)

　　row format delimited fields terminated by '\t';

　　此表名为stu_partition按照月份来分区。

　　上传数据到分区表：

　　load data local inpath '/home/hdc/Document/student1.txt' into table stu_partition partition(month="201906");

　　分区表查找：

　　select * from stu_partition;　　//查找分区表中的所有记录；

　　select * from stu_partition where month="201906"　　//查找分区表中分区名201906中的所有记录　　

　　查看分区：

　　show partitions stu_partition;

　　增加分区：

　　alter table stu_partition add partition (month="201908");

　　alter table stu_partition add partition (month="201909") partition (month="201910");

　　删除分区：

　　alter table stu_partition drop partition(month="201908");

　　alter table stu_partition drop partition(month="201909"),partition (month="201910");

　　ps:二级分区指的是2个分区字段，按照字段的顺序来设置分区顺序，例如：partition(month="201909",day="01")就是一个二级分区，其目录结构是day文件夹是month文件夹的子文件夹。

　利用Hadoop和hive命令创建分区的区别：

　　其实Hadoop命令创建分区就是在数据仓库中的表下创建一个文件夹，若将数据导入Hadoop命令创建的分区，再利用hive的select语句查询，将查询不到结果。这是因为Hadoop命令创建的分区在hive中没有关于此分区的元数据信息。

　　而利用hive命令创建的分区不仅会在hdfs上的hive数据仓库中创建相应的文件夹，而且还将此文件夹在hdfs上的信息（元数据）存储在hive中的matestore数据库中。

　解决方法：

　　（1）msck repair table stu_partition;

　　（2）alter table stu_partition add partition(month="201911");

　　　　//此方法为分区表在hdfs上创建文件夹和在hive中创建此文件夹的元数据，之前因为利用Hadoop命令手动创建了文件夹故现在只需创建元数据。

　　（3）正常上传数据即load data local inpath '/home/hdc/Document/student1.txt' into table stu_partition partition(month="201911");

2.3、分桶表

　　分区表是针对数据的存储路径，分桶表针对的是数据文件。其中分区字段是表外字段，而分桶字段是表内字段。

　　create table stu_bucket(

　　　　id int,

　　　　name string

　　)clustered by (id) into 4 buckets

　　row format delimited fields terminated by '\t';

　　上传数据到分桶表只能通过insert方法如下例所示：

　　insert into table stu_bucket

　　select *from stu_temp;

　　利用分桶表对数据进行抽样查询（桶数为z）：

　　select * from stu_bucket tablesample(bucket x out of y on id)

　　注意：x<=y，z%y==0 || y%z==0

　　抽样数n=z/y

　　从第x桶开始抽取n桶，第一个抽取的是第x桶，第二个桶是x+y

　　注意：数据块抽样，按照数据块的百分比抽样，若表的数据大小小于普通的块大小，那么将会返回所有行。

3、对表的操作

删除表：

　　drop table if exists stu_partition；

修改表：

　　表重命名：alter table stu_partition rename to student_partition;

　　修改表中列信息：alter table student_partition change columns id student_id int;

　　增加列：alter table student_partition add columns(

　　　　　　　　ClassId int commet "备注信息"，

　　　　　　　　ClassName string comment "备注信息"

　　　　　　);

　　删除或者替换列：alter table student_partition replace columns(

　　　　　　　　　　　　id string commet "备注信息"，

　　　　　　　　　　　　name string commet "备注信息"

　　　　　　　　　　);//此种替换是指将所用列全部删除再来新建以上两列。、

PS：alter语句改变的是表的元数据信息而不是真正的数据。

hive的数据定义之创建数据库和表的更多相关文章

Hive 官方手册翻译 -- Hive DDL(数据定义语言)
Hive DDL(数据定义语言) Confluence Administrator创建, Janaki Lahorani修改于 2018年9月19日原文链接 https://cwiki.apache ...
初学者使用MySQL_Workbench 6.0CE创建数据库和表，以及在表中插入数据。
标签: mysqlworkbench数据库 2013-10-09 20:17 19225人阅读评论(14) 收藏举报分类: mysql(1) 版权声明:本文为博主原创文章,未经博主允许不得转 ...
第16课-数据库开发及ado.net-数据库SQl,创建数据库和表,增删改语句,约束,top和Distinct,聚合函数介绍
第16课-数据库开发及ado.net 数据库SQl,创建数据库和表,增删改语句,约束,top和Distinct,聚合函数介绍 SQL语句入门(脚本.命令) SQL全名是结构化查询语言(Structur ...
创建数据库和表的SQL语句【转】
创建数据库和表的SQL语句转至http://www.cnblogs.com/philanthr/archive/2011/08/09/2132398.html 创建数据库的SQL语句: 1 crea ...
ylb：创建数据库、表，对表的增查改删语句
ylbtech-SQL Server:SQL Server-创建数据库.表,对表的增查改删语句 SQL Server 创建数据库.表,对表的增查改删语句. 1,ylb:创建数据库.表,对表的增查改删语 ...
sqliteExpert软件使用（创建数据库和表）
sqliteExpert是sqlite数据库的可视化操作软件,通过该软件可以进行可视化的创建数据库以及表,免去了复杂的建表语句.首先在下面地址下载该软件http://www.ddooo.com/sof ...
Adobe AIR中使用Flex连接Sqlite数据库(1)(创建数据库和表,以及同步和异步执行模式)
系列文章导航 Adobe AIR中使用Flex连接Sqlite数据库(1)(创建数据库和表) Adobe AIR中使用Flex连接Sqlite数据库(2)(添加,删除,修改以及语句参数) Adobe ...
centos环境下创建数据库和表的方法
centos环境下创建数据库和表的方法 //查询数据库的命令: mysql> SHOW DATABASES; +--------------------+ | Database ...
MySQL数据库实验：任务一创建数据库和表
目录任务一创建数据库和表 [实训目的与要求] [实训原理] [实训步骤] 一.熟悉MySQL环境二.利用MySQL命令行窗口创建数据库及表三.利用界面工具创建数据库及表任务一创建数据库和表 ...

随机推荐

[luogu]P1169 [ZJOI2007]棋盘制作[DP][单调栈]
[luogu]P1169 [ZJOI]棋盘制作 ——!x^n+y^n=z^n 题目描述国际象棋是世界上最古老的博弈游戏之一,和中国的围棋.象棋以及日本的将棋同享盛名.据说国际象棋起源于易经的思想,棋 ...
RTF筛选工具
您可借助此项筛选程序对具备.rtf扩展名的文档进行爬行遍历,以便通过搜索结果对目标文档加以访问调用.管理员应先在相关服务器上对程序文件进行注册,方可运行此项工具. 用户下载.安装并使用相关代码的行为即 ...
秒杀Servlce接口设计
秒杀Servlce接口设计 1.创建service包,创建SecKillServlce业务接口 SecKillServlce.Java package org.secKill.service;/** ...
bootstrap 前端框架学习笔记
下面是一个基于 bootstrap 前端架构的最最基本的模板: (这里添加慕课网的学习笔记.) 1.认识一下 bootstrap 带来的优雅效果: 代码: <!DOCTYPE html> ...
margin/padding百分比值的计算
1.百分比介绍一般元素的宽度用百分比值表示时,元素的总宽度包括外边距取决于父元素的width,这样可能得到"流式"页面,即元素的外边距会扩大或缩小以适应父元素的实际大小.如果对这 ...
css选择器的组合示例
案例一demo <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://ww ...
Codeforces 86D Powerful array （莫队）
D. Powerful array time limit per test 5 seconds memory limit per test 256 megabytes input standard i ...
生产环境下，oracle不同用户间的数据迁移。第二部分
任务名称:生产环境下schema ELON数据迁移至schema TIAN######################################## 测试二:测试参数remap_tablespa ...
【CDN+】一些常用的Linux命令，crontab+VI+Hive（持续更新）
前言本文主要是记录下工作中可能用到的一些linux指令,当作字典查用 Crontab 基本命令 # 安装 yum -y install vixie-cron crontabs#查看状态 servic ...
建站手册-template
ylbtech-建站手册: 1.返回顶部 2.返回顶部 3.返回顶部 4.返回顶部 5.返回顶部 6.返回顶部作者:ylbtech出处:http://ylbtech.cn ...

hive的数据定义之创建数据库和表

hive的数据定义之创建数据库和表的更多相关文章

随机推荐

热门专题