hive表批处理

对hive中的表进行批量处理，如下是一个简单的脚本

#给定一个hive数据库名，生成它的所有表的create SQL语句，并导出到文件

create_fun(){

hive -e "show create table $1.$2">>$

}

#显示一个表中所有的分区

show_partitions(){

hive -e "show partitions $1.$2 ;">>$

}

#将一个表中所有分区重命名

rename_partition(){

start_day=$

end_day=$

while [ ${start_day} -le ${end_day} ]

do

    day_int=`date  +"%Y%m%d" -d  "${start_day}"`

    day_str=`date  +"%Y-%m-%d" -d  "${start_day}"`

    hive -e "alter table $1.$2 PARTITION (dt='${day_int}') RENAME TO PARTITION (dt='${day_str}');"

    start_day=`date  +"%Y%m%d" -d  "${start_day} 1 days" `

done

}

#删除一个表中的分区

drop_partition(){

hive -e "alter table $1.$2 drop PARTITION (dt='$3')"

}

#更新一个hive表的列分隔符

modify_separator(){

hive -e "alter table $1.$2 set SERDEPROPERTIES('field.delim'='\001');"

}

#指定一个数据库，查询出所有table，并对符合条件的table进行处理

database(){

basename=$

mid_file=mid.txt

result_file=${basename}.txt

match=_ods

hive -e "use ${basename};show tables">${mid_file}

sed -i '/WARN/d' ${mid_file}

cat ${mid_file} |grep ${match} |while read line

do

    drop_partition ${basename} $line $

done

rm -rf ${mid_file}

}

#program start #

database $ $

hive表批处理的更多相关文章

hive表增量抽取到oracle数据库的通用程序(二)
hive表增量抽取到oracle数据库的通用程序(一) 前一篇介绍了java程序的如何编写.使用以及引用到的依赖包.这篇接着上一篇来介绍如何在oozie中使用该java程序. 在我的业务中,分为两段: ...
hive表增量抽取到oracle数据库的通用程序(一)
hive表增量抽取到oracle数据库的通用程序(二) sqoop在export的时候只能通过--export-dir参数来指定hdfs的路径.而目前的需求是需要将hive中某个表中的多个分区记录一 ...
【翻译】Flink Table Api & SQL — Hive —— 读写 Hive 表
本文翻译自官网:Reading & Writing Hive Tables https://ci.apache.org/projects/flink/flink-docs-release-1 ...
hive 表分区操作
hive的数据查询一般会扫描整个表,当表数据太大时,就会消耗些时间,有时候我们只需要对部分数据感兴趣,所以hive引入了分区的概念 hive的表分区区别于一般的分布式分区(hash分区,范围分区 ...
如何快速把hdfs数据动态导入到hive表
1. hdfs 文件 {"retCode":1,"retMsg":"Success","data":[{" ...
HDFS文件和HIVE表的一些操作
1. hadoop fs -ls 可以查看HDFS文件后面不加目录参数的话,默认当前用户的目录./user/当前用户 $ hadoop fs -ls 16/05/19 10:40:10 WARN ...
用puthivestreaming把hdfs里的数据流到hive表
全景图: 1. 创建hive表 CREATE TABLE IF NOT EXISTS newsinfo.test( name STRING ) CLUSTERED BY (name)INTO 3 ...
spark使用Hive表操作
spark Hive表操作之前很长一段时间是通过hiveServer操作Hive表的,一旦hiveServer宕掉就无法进行操作. 比如说一个修改表分区的操作一.使用HiveServer的方式 v ...
spark+hcatalog操作hive表及其数据
package iie.hadoop.hcatalog.spark; import iie.udps.common.hcatalog.SerHCatInputFormat; import iie.ud ...

随机推荐

5.1 入门整合案例(SpringBoot+Spring-data-elasticsearch) ---- good
本节讲解SpringBoot与Spring-data-elasticsearch整合的入门案例. 一.环境搭建新建maven项目,名字随意 pom.xml <parent> <gr ...
Struts2中文件的上传与下载
文件上传 1.jsp页面 <s:form action="fileAction" namespace="/file" method="POST& ...
PHP设置时区，记录日志文件的方法
关键字:PHP 时区时间日志 <html> <body> <?php date_default_timezone_set('Asia/Hong_Kong'); //s ...
解析Android的消息传递机制Handler
1. 什么是Handler: Handler 网络释义"机械手.经理"意思,在Android它用于管理多个线程UI操作: 2. 为什么会出现Handler: 在Android里面的 ...
WPF 导出资源文件
在wpf开发中我们可以把各种文件.图片打包到项目中也就是应用程序资源文件,然后在项目中可以通过特定的uri格式去调用.那有些时候为了方便我们可能想要在程序中将资源文件导出来使用,那么怎么做呢? 第 1 ...
python 教程第十二章、标准库
第十二章. 标准库 See Python Manuals ? The Python Standard Library ? 1) sys模块 import sys if len(sys.argv) ...
注册.NET Framework 到IIS服务器
一.注册.NET 4.0 32位的Windows:--------------------------------------------------------------------------- ...
jquery 选择标题标签
<!DOCTYPE html><html><head><meta http-equiv="Content-Type" content=&q ...
读BeautifulSoup官方文档之与bs有关的对象和属性(1)
自从10号又是5天没更, 是, 我再一次断更... 原因是朋友在搞python, 老问我问题, 我python也是很久没碰了, 于是为了解决他的问题, 我只能重新开始研究python, 为了快速找回感 ...
C# WebRequest WebResponse的使用
using System;using System.Collections.Generic;using System.ComponentModel;using System.Data;using Sy ...

hive表批处理

hive表批处理的更多相关文章

随机推荐

热门专题