hive表批处理

对hive中的表进行批量处理，如下是一个简单的脚本

#给定一个hive数据库名，生成它的所有表的create SQL语句，并导出到文件

create_fun(){

hive -e "show create table $1.$2">>$

}

#显示一个表中所有的分区

show_partitions(){

hive -e "show partitions $1.$2 ;">>$

}

#将一个表中所有分区重命名

rename_partition(){

start_day=$

end_day=$

while [ ${start_day} -le ${end_day} ]

do

    day_int=`date  +"%Y%m%d" -d  "${start_day}"`

    day_str=`date  +"%Y-%m-%d" -d  "${start_day}"`

    hive -e "alter table $1.$2 PARTITION (dt='${day_int}') RENAME TO PARTITION (dt='${day_str}');"

    start_day=`date  +"%Y%m%d" -d  "${start_day} 1 days" `

done

}

#删除一个表中的分区

drop_partition(){

hive -e "alter table $1.$2 drop PARTITION (dt='$3')"

}

#更新一个hive表的列分隔符

modify_separator(){

hive -e "alter table $1.$2 set SERDEPROPERTIES('field.delim'='\001');"

}

#指定一个数据库，查询出所有table，并对符合条件的table进行处理

database(){

basename=$

mid_file=mid.txt

result_file=${basename}.txt

match=_ods

hive -e "use ${basename};show tables">${mid_file}

sed -i '/WARN/d' ${mid_file}

cat ${mid_file} |grep ${match} |while read line

do

    drop_partition ${basename} $line $

done

rm -rf ${mid_file}

}

#program start #

database $ $

hive表批处理的更多相关文章

hive表增量抽取到oracle数据库的通用程序(二)
hive表增量抽取到oracle数据库的通用程序(一) 前一篇介绍了java程序的如何编写.使用以及引用到的依赖包.这篇接着上一篇来介绍如何在oozie中使用该java程序. 在我的业务中,分为两段: ...
hive表增量抽取到oracle数据库的通用程序(一)
hive表增量抽取到oracle数据库的通用程序(二) sqoop在export的时候只能通过--export-dir参数来指定hdfs的路径.而目前的需求是需要将hive中某个表中的多个分区记录一 ...
【翻译】Flink Table Api & SQL — Hive —— 读写 Hive 表
本文翻译自官网:Reading & Writing Hive Tables https://ci.apache.org/projects/flink/flink-docs-release-1 ...
hive 表分区操作
hive的数据查询一般会扫描整个表,当表数据太大时,就会消耗些时间,有时候我们只需要对部分数据感兴趣,所以hive引入了分区的概念 hive的表分区区别于一般的分布式分区(hash分区,范围分区 ...
如何快速把hdfs数据动态导入到hive表
1. hdfs 文件 {"retCode":1,"retMsg":"Success","data":[{" ...
HDFS文件和HIVE表的一些操作
1. hadoop fs -ls 可以查看HDFS文件后面不加目录参数的话,默认当前用户的目录./user/当前用户 $ hadoop fs -ls 16/05/19 10:40:10 WARN ...
用puthivestreaming把hdfs里的数据流到hive表
全景图: 1. 创建hive表 CREATE TABLE IF NOT EXISTS newsinfo.test( name STRING ) CLUSTERED BY (name)INTO 3 ...
spark使用Hive表操作
spark Hive表操作之前很长一段时间是通过hiveServer操作Hive表的,一旦hiveServer宕掉就无法进行操作. 比如说一个修改表分区的操作一.使用HiveServer的方式 v ...
spark+hcatalog操作hive表及其数据
package iie.hadoop.hcatalog.spark; import iie.udps.common.hcatalog.SerHCatInputFormat; import iie.ud ...

随机推荐

Android平台第三方应用分享到微信开发
一.申请APPID 微信公共平台和微博分享一样,也需要申请一个ID,来作为调起微信.分享到微信的唯一标识. 申请微信APPID可以到微信平台http://open.weixin.qq.com/app/ ...
【cocos2dx 加载资源目录】
从互联网下载vsproject代码.编译一切都还好吗,当发现向导的最后一个执行create没有找到图片功能异常.看图片Resource的内容下表,他没有排除的图像的可能性. 那么之后呢?!仅仅能是pr ...
Using default security password
不展示Using default security password的解决办法: import org.springframework.context.annotation.Bean; import ...
asp.net中c#求百分比
double m= 50;double n= 100; Response.Write((m/ (m+ n)).ToString("0%"));Response.Write((m/ ...
机器学习: t-Stochastic Neighbor Embedding 降维算法 (一)
Introduction 在计算机视觉及机器学习领域,数据的可视化是非常重要的一个应用,一般我们处理的数据都是成百上千维的,但是我们知道,目前我们可以感知的数据维度最多只有三维,超出三维的数据是没有办 ...
python 合并两个排序的链表
题目描述输入两个单调递增的链表,输出两个链表合成后的链表,当然我们需要合成后的链表满足单调不减规则. 样例给出 1->3->8->11->15->null,2-& ...
Scripting web services
A process performed on a server includes configuring the server to enable script for a Web service t ...
使用xtrabackup实现MySQL主从复制
环境描写叙述主从环境项目 Master Slave OS版本号 SuSE 11sp1 x86_64 SuSE 11sp1 x86_64 MySQL版本号官方版本号5.5.37 官方版本号5.5. ...
WPF中使用AxisAngleRotation3D实现CAD的2D旋转功能
原文:WPF中使用AxisAngleRotation3D实现CAD的2D旋转功能对于CAD图形来说,3D旋转比较常用,具体实现方法在上篇文章<WPF中3D旋转的实现 >中做了 ...
撑持4G LTE网络 OPPO R1S或在美出售
据外媒报导,OPPO R1S踪影近来出如今美国FCC官网上, 将撑持除T-Mobile之外其他运营商的LTE 4G网络.假如音讯事实,外型简洁美丽OPPO R1S将登入北美商场. 音讯称尽管当前还不晓 ...

hive表批处理

hive表批处理的更多相关文章

随机推荐

热门专题