并行执行hive脚本

 ### 模板脚本存放路径(无需修改)

 cd /tmp/fix_data/tmp_wjj_20180322_01

 ### 脚本名称

 script=tmp_wjj_20180322_01

 ### 开始日期(包括当月/天)

 etl_dt_start='2017-09-01'

 ### 结束日期(不包括当月/天)

 etl_dt_end='2016-12-01'

 ### 并发数(请勿设置高于10)

 thread_num=

 ### task数量(设置spark_sql的task数量，如果数据量过亿，可适量调高)

 partitions=

 ### 以下无需修改

 thread_no=

 spark="beeline -u jdbc:hive2://ip:port -n username -p password --verbose=true"

 hive="hive -v"

 excute=${spark}

 ### 删除执行脚本内容

 cat /dev/null > run_sql_${script}

 ### to do: 根据进程数进行判断

 while [[ ${etl_dt_start} > ${etl_dt_end} ]]

 do

     echo ${etl_dt_start}

     etl_dt_start_str=`echo ${etl_dt_start}|sed 's/-/_/g'`

     echo "select 'job_start' as flag,'${etl_dt_start}' as num,current_timestamp() as time;"    > ${script}_${etl_dt_start_str}

     echo "set spark.sql.shuffle.partitions=${partitions};"                                    >> ${script}_${etl_dt_start_str}

     echo "use db_name;"                                                                       >> ${script}_${etl_dt_start_str}

     echo "set mapred.job.queue.name=queue_name;"                                              >> ${script}_${etl_dt_start_str}

     echo "set hive.exec.dynamic.partition=true;"                                              >> ${script}_${etl_dt_start_str}

     echo "set hive.exec.dynamic.partition.mode=nonstrict;"                                    >> ${script}_${etl_dt_start_str}

     sed "s/2017-10-01/${etl_dt_start}/g" ${script}                                            >> ${script}_${etl_dt_start_str}

     echo "select 'job_finish' as flag,'${etl_dt_start}' as num,current_timestamp() as time;"  >> ${script}_${etl_dt_start_str}

     thread_no=$((${thread_no}+))

     echo "${excute} -f ${script}_${etl_dt_start_str} > ${script}_${etl_dt_start_str}_log 2>&1 &" >>run_sql_${script}

         if [[ $((${thread_no}%${thread_num})) ==  ]]

     then

         echo "wait" >>run_sql_${script}

     fi

     ### etl_dt_start=`date -d "+1 days ${etl_dt_start}" +%Y-%m-%d`

     etl_dt_start=`date -d "-1 months ${etl_dt_start}" +%Y-%m-%d`

 done

 ### 执行初始化

 sh run_sql_${script}

 ### 查看执行时间

 # grep -E "job_start|job_finish" ${script}_*_log|grep -v select

并行执行hive脚本的更多相关文章

Hadoop生态圈-Azkaban实现hive脚本执行
Hadoop生态圈-Azkaban实现hive脚本执行作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 本篇博客中在HDFS分布式系统取的数据,而这个数据的是有之前我通过MapRed ...
HUE中Oozie执行Hive脚本
Oozie执行hive,传入参数1. 新建一个workflow 2. 拖入一个hive2 3. hive脚本如下 CREATE TABLE IF NOT EXISTS spider_tmp.org_i ...
Hive脚本中切勿使用/**/注释
Hive脚本中切勿使用/**/注释 Hive脚本的注释目前好像只有 -- ,我之前在做初版数据的时候使用NotePad++ 习惯性的有时候注释会写成 /**/ ,然后就引发了问题脚本上传到hue, ...
Beeline里面执行hive脚本函数nvl2()与replace()报错
Beeline里面执行hive脚本函数nvl2()与replace()报错写脚本的时候是在impala里面执行的,都正常,但是转换为调度的时候是在beeline里面执行的就会有问题了. 详情如下: ...
12_Azkaban案例实践5_Command操作Hive脚本任务
HIVE脚本任务 hadoop fs -mkdir -p /aztest/hiveinput hadoop fs -put az.data /aztest/hiveinput/ l 创建job描述文件 ...
hive脚本出现Error: java.lang.RuntimeException: Error in configuring object和Caused by: java.lang.IndexOutOfBoundsException: Index: 9, Size: 9
是在reduce阶段报的错误,详细错误信息是朱传豪 19:04:48 Diagnostic Messages for this Task: Error: java.lang.RuntimeExcep ...
shell命令执行hive脚本（hive交互，hive的shell编程）
Hive执行方式 Hive的hql命令执行方式有三种: 1.CLI 方式直接执行 2.作为字符串通过shell调用hive –e执行(-S开启静默,去掉"OK","Tim ...
python 中写hive 脚本
1.直接执行.sql脚本 import numpy as np import pandas as pd import lightgbm as lgb from pandas import DataFr ...
Hive 脚本执行
hive执行脚本 hive -e “sql语句” 会将查询的结果打印在控制台上. hive -e “sql语句” >> xxx 会将查询的结果重定向到xxx文件中,会显示OK和抓取的数据 ...

随机推荐

MarkdownPad 2 安装和破解
MarkdownPad 2 安装和破解下载:http://markdownpad.com/ 下载下面这个: 破解:http://w3cboy.com/post/2014/10/MarkdownPad ...
android sdk更新源
什么是Android SDK: SDK:(software development kit)软件开发工具包.被软件开发工程师用于为特定的软件包.软件框架.硬件平台.操作系统等建立应用软件的开发工具的集 ...
ZROI2018提高day2t1
传送门分析考场上写了前20分和|a[i]|<=1的情况,但是因为没开long long爆零了.实际考场上差不多想到正解了,至少当时不会凸壳... 我们发现对于ax2+bx的大小关系我们可以将 ...
树莓派研究笔记（8）-- 编译lakka v2.1源码
Lakka越玩越觉得强大.如果要是能自己修改一下代码,实现自定义的一些操作就更好了.还可以修复字体文件,修复在部分机器上自动更换Mac地址导致ip变化的问题. 所以我们来尝试编译这个系统.这篇文章几乎 ...
炫酷实用的CSS3代码垂直手风琴菜单
今天在微博上看到别人分享的代码,自己拿来自己保存着. 代码效果如下: 下面是源码: index.html <!DOCTYPE html> <html > <head> ...
Android将程序崩溃信息保存本地文件
大家都知道,现在安装Android系统的手机版本和设备千差万别,在模拟器上运行良好的程序安装到某款手机上说不定就出现崩溃的现象,开发者个人不可能购买所有设备逐个调试,所以在程序发布出去之后,如果出现了 ...
导出Excel多个表多个sheet
protected void Page_Load(object sender, EventArgs e) { DataTable dt = new DataTable(); ...
jQuery 插件开发——GridData（表格）
导读:我个人认为做开发最幸福的事之一就是设计一套属于自己的控件,老早之前就想去做这样的事情,一直碍于事件的冲突和个人的想法,最终没有定论,最近难得抽出一些空隙,去完成这件事情.其实自定义控件并不是难事 ...
[raspberry pi3] raspberry 充当time machine
之前是用硬盘直接当timemachine的,看到有人用raspberry+硬盘充当timemachine的自己的也搞了下,还是蛮方便的,下面是具体的步骤 1.安装必要的服务 sudo apt-get ...
winFrom程序更新自动安装
我就以一个计算字符长度的程序为例子吧界面如下代码如下 [C#] 纯文本查看复制代码 ? 01 02 03 04 private void button1_Click(object sender, ...

并行执行hive脚本

并行执行hive脚本的更多相关文章

随机推荐

热门专题