hive 表分区操作

hive的数据查询一般会扫描整个表，当表数据太大时，就会消耗些时间，有时候我们只需要对部分数据感兴趣，所以hive引入了分区的概念

hive的表分区区别于一般的分布式分区（hash分区，范围分区，一致性分区），hive的分区是比较简单的。他是根据hive的表结构，分区的字段设置将数据按目录存放起来，相当于简单的索引

hive表分区需要在表模式创建的时候指定模式才能使用，他的字段是虚拟的列，不存在表数据中。表分区在表模式创建之后使用之前使用alert table 来添加具体的分区，才能使用

添加分区

alert table tableName add

partition(ds='2016-12-16',coutry='beiJing')

location='/opt/hive/beiJing/part2016-12-16'

partition(ds='2016-12-17',coutry='beiJing')

location='/opt/hive/beiJing/part2016-12-17'

删除分区

alert table tableName drop partitionName,partitionName1,partitionName2

例：

alert table tableName drop partition（ds='2016-12-16',coutry='beiJing'）

1）删除分区会连元数据和数据一并删除

2）在为表指定具体分区时，在创建表时必须要为表添加对应的模式，否则会抛出异常

3）分区的名称不能与表属性的名称一样

4）还可以创建多个分区，相当于多级索引的功能

在使用hsql向表中添加数据，如果hsql中的分区，在hdfs中没有，则hive会根据hsql自动新建分区（可能有的hive版本不支持自动创建分区，这里使用的是2.1.0）

insert overwrite table zhangTest partition(sexual=2) select studentid, sex,address,email from student_3 where sex=0

删除表

alert table drop tableName

删除表将会数据和元数据一起删除，如果定义了trash,那么删除的数据将会到trash/current目录下。如果定义了外部表就只会删除元数据，不会删除数据

删除和创建视图

create view viewName [{col_name},....]

as select....

目前只有hive6.0之后的版本才有这个功能,视图是只读的，不能对其进行load/insert/alert操作。

视图中有可能引用了order by 或者limit 子句，如果一个查询语句引用了这样一个视图，那么会优先查询视图中的语句，然后返回结果按照视图中的结果返回

drop vieww viewName//删除指定的视图

创建或删除函数

creeate temporary funaction fun_name as classs_name//

drop temporary fun_name//

展示描述语句(显示语句可以使用正则表达式进行匹配“*”，“|”“[]”)

show tables identifier_with_wildcards

显示表或者分区扩展表

show table extended ..

显示函数

show function "a"

hive 表分区操作的更多相关文章

hive表分区操作
1.修复表分区命令 msck repair table table_name; 2.添加表分区操作 alter table table_name add partition(month_id='201 ...
如何快速把hdfs数据动态导入到hive表
1. hdfs 文件 {"retCode":1,"retMsg":"Success","data":[{" ...
HDFS文件和HIVE表的一些操作
1. hadoop fs -ls 可以查看HDFS文件后面不加目录参数的话,默认当前用户的目录./user/当前用户 $ hadoop fs -ls 16/05/19 10:40:10 WARN ...
用puthivestreaming把hdfs里的数据流到hive表
全景图: 1. 创建hive表 CREATE TABLE IF NOT EXISTS newsinfo.test( name STRING ) CLUSTERED BY (name)INTO 3 ...
spark使用Hive表操作
spark Hive表操作之前很长一段时间是通过hiveServer操作Hive表的,一旦hiveServer宕掉就无法进行操作. 比如说一个修改表分区的操作一.使用HiveServer的方式 v ...
spark+hcatalog操作hive表及其数据
package iie.hadoop.hcatalog.spark; import iie.udps.common.hcatalog.SerHCatInputFormat; import iie.ud ...
【原】创建Hive表，分号分隔符“；”引起的异常
[障碍再现] 在创建支持Map数据结构的Hive表时,抛出如下异常 hive> create table tab_map(name string,info map<string,strin ...
Hive表分区
必须在表定义时创建partition a.单分区建表语句:create table day_table (id int, content string) partitioned by (dt stri ...
sqlserver 2008表分区操作
表分区操作步骤 1.设计表进行分区的方案,水平分区.垂直分区 a.水平切割将减少表的行数,这样可以将历史数据归档,减少表大小,提高访问速度. b.垂直切割将分为主表和从表方式,将主要的列字段存放在主表 ...

随机推荐

Android BLE 蓝牙编程（二）
大家中秋快乐啊--哈哈,今天继续工程项目吧! 上篇我们已经实现了蓝牙设备的扫描,本篇我们来通过list展示扫描到的设备并实现点击连接. 先贴出上篇的完整的MainActivity的方法: packa ...
jquery 将disabled的元素置为enabled的三种方法
转--http://www.jb51.net/article/19342.htm 在jquery中可以通过jqueryObj.attr("disabled","disab ...
C# 在类中反射
using System; using System.Collections.Generic; using System.Linq; using System.Text; namespace Wind ...
【PHP】月末・月初の出力方法
文章出处 : Qiita - http://qiita.com/shoridevel/items/0a2f4a64e55d84919a1c 今月の月初 echo date("Y-m-01&q ...
Interface小例子
using System; using System.Collections.Generic; using System.Linq; using System.Text; namespace Cons ...
spring 事务传播特性和隔离级别
事务的几种传播特性1. PROPAGATION_REQUIRED: 如果存在一个事务,则支持当前事务.如果没有事务则开启2. PROPAGATION_SUPPORTS: 如果存在一个事务,支持当前事务 ...
pair correlation ggpair ggmatrix
https://zhuanlan.zhihu.com/p/23400450 首发于 R语言数据分析与可视化关注专栏登录写文章 R 语言矩阵散点图 EasyCharts· 15 天前散点 ...
asp.net Literal
常用于动态向页面添加内容 Panel panel = new Panel(); Literal literal = new Literal(); literal.Text = "<br ...
（转）为什么所有浏览器的userAgent都带Mozilla
转自:http://www.eamonning.com/blog/view/289 以下是全文最早的时候有一个浏览器叫NCSA Mosaic,把自己标称为NCSA_Mosaic/2.0 (Windo ...
HTML5视频播放
1.检测浏览器是否支持html5视频播放 <!doctype html> <html> <head> <meta charset="utf-8&qu ...

hive 表分区操作

hive 表分区操作的更多相关文章

随机推荐

热门专题