---------------------------------MR汇聚工具步骤-----------------------------------
-- 1、需要连上141服务器 用户:root 密码:Richr00t
-- 2、【MR汇聚工具】
--3、位置 141目录下进入后切换fast用户 su fast
/home/fast/luohai/Projects

------------------------第一步首先需要创建外部表-----------------------------

【MR定位表建立工具】
--4、建立MR定位数据的外部表
/home/elastic-combine/yyl/mro_load_hive
--5、执行建立外部表
sh ./mro_load_hive_jingdui.sh 地市名(大写)、日期(如:20180921)

--6、进入MR定位表建立工具目录下创建所需要创建的地市外部表
如: sh ./mro_load_hive_jingdui.sh ZHUMADIAN 20180921

--7、需要删除外部表可以执行
sh ./mro_delete_jingdui.sh
如:sh ./mro_delete_jingdui.sh ZHUMADIAN 20180921

-----------------------创建完外部表需要配置文件----------------------
--9、需要配置的文件有conf、run
bin:大脑
conf:配置文件
jars:存放java包
log: 存放日志
origin:传参工具
run:存放shell脚本
sql:存放元数据表

--10、--------------------第二步配置conf目录下-----------------------------位置/home/fast/luohai/Projects/conf
所需要配置的文件有TOT.conf、TOT_ROAD.conf、TOT_SCENE.conf进入修改文件需要vim
栅格 道路 场景

如 vim TOT.conf vim是一个编译器只能编译文件也可以创建文件

1.TOT.conf (CITYNAME、DATE)需要修改的文件
###可以修改也可以不用修改(由素绢发来的邮件为准)
CITYNAME=ZHENGZHOU
###日期必须修改(由素绢发来的邮件为准)
DATE=20180921,20180925

2.TOT_ROAD.conf(CITYNAME、DATE)需要修改的文件
###可以修改也可以不用修改(由素绢发来的邮件为准)
CITYNAME=ZHENGZHOU
###日期必须修改(由素绢发来的邮件为准)
DATE=20180921,20180925

3.TOT_SCENE.conf
###可以修改也可以不用修改(由素绢发来的邮件为准)
CITYNAME=ZHENGZHOU
###日期必须修改(由素绢发来的邮件为准)
DATE=20180921,20180925

---------------------第三部配置run目录下------------------------------------位置/home/fast/luohai/Projects/run
配置文件run_by_city.sh下的

###必须要修改的地市名(由素绢发来的邮件为准)
也可以多个地市跑 以空格来分隔
CITYNAMES="地市名 地市名"

sh $APP_HOME/run/runMain.sh TOT $CITYNAME (栅格级)
sh $APP_HOME/run/runMain.sh TOT_SCENE $CITYNAME (场景级)
sh $APP_HOME/run/runMain.sh TOT_ROAD $CITYNAME (道路级)

须知:每跑一个地市需要全部打开这三个栅格级、场景级、道路级的文件
配置好开启run_by_city.sh
sh ./run_by_city.sh 开启后会出现以下现象

info] 2018-10-19 10:11:28 using project:TOT
[info] 2018-10-19 10:11:28 cities to run:LUOYANG
[info] 2018-10-19 10:11:28 running:LUOYANG
[info] 2018-10-19 10:11:28 fetch confgure cityname:LUOYANG,date:20180921,20180925,database:fastdo_lte_wk5
[info] 2018-10-19 10:11:28 log file is /home/fast/luohai/Projects/log/TOT.log
[info] 2018-10-19 10:11:28 render FINISH.
[info] 2018-10-19 10:11:28 start run spark:TOT

###开启后出现start run spark:TOT就是正在跑数据
一般跑完需要好几个小时我们要时刻监控着

###跑完一般会出现两种情况成功和报错
###第一种运行成功如下:Succeed
using project:TOT
[info] 2018-10-15 18:07:07 cities to run:ZHOUKOU
[info] 2018-10-15 18:07:07 running:ZHOUKOU
[info] 2018-10-15 18:07:07 fetch confgure cityname:ZHOUKOU,date:20180921,20180925,database:fastdo_lte_wk5
[info] 2018-10-15 18:07:07 log file is /home/fast/luohai/Projects/log/TOT.log
[info] 2018-10-15 18:07:07 render FINISH.
[info] 2018-10-15 18:07:07 start run spark:TOT
[info] 2018-10-15 21:30:40 Succeed end run spark:TOT #出现Succeed就是没有问题
[info] 2018-10-15 21:30:40 using project:TOT_SCENE
[info] 2018-10-15 21:30:40 cities to run:ZHOUKOU
[info] 2018-10-15 21:30:40 running:ZHOUKOU
[info] 2018-10-15 21:30:40 fetch confgure cityname:ZHOUKOU,date:20180921,20180925,database:fastdo_lte_wk5
[info] 2018-10-15 21:30:40 log file is /home/fast/luohai/Projects/log/TOT_SCENE.log
[info] 2018-10-15 21:30:40 render FINISH.
[info] 2018-10-15 21:30:40 start run spark:TOT_SCENE
[info] 2018-10-15 23:03:08 Succeed end run spark:TOT_SCENE #出现Succeed就是没有问题
[info] 2018-10-15 23:03:08 using project:TOT_ROAD
[info] 2018-10-15 23:03:08 cities to run:ZHOUKOU
[info] 2018-10-15 23:03:08 running:ZHOUKOU
[info] 2018-10-15 23:03:08 fetch confgure cityname:ZHOUKOU,date:20180921,20180925,database:fastdo_lte_wk5
[info] 2018-10-15 23:03:08 log file is /home/fast/luohai/Projects/log/TOT_ROAD.log
[info] 2018-10-15 23:03:08 render FINISH.
[info] 2018-10-15 23:03:08 start run spark:TOT_ROAD
[info] 2018-10-15 23:38:47 Succeed end run spark:TOT_ROAD #出现Succeed就是没有问题

###第二种情况 Failed

[info] 2018-10-15 18:07:07 cities to run:ZHOUKOU
[info] 2018-10-15 18:07:07 running:ZHOUKOU
[info] 2018-10-15 18:07:07 fetch confgure cityname:ZHOUKOU,date:20180921,20180925,database:fastdo_lte_wk5
[info] 2018-10-15 18:07:07 log file is /home/fast/luohai/Projects/log/TOT.log
[info] 2018-10-15 18:07:07 render FINISH.
[info] 2018-10-15 18:07:07 start run spark:TOT
[info] 2018-10-15 21:30:40 Failed end run spark:TOT #出现Failed就是有问题
[info] 2018-10-15 21:30:40 using project:TOT_SCENE
[info] 2018-10-15 21:30:40 cities to run:ZHOUKOU
[info] 2018-10-15 21:30:40 running:ZHOUKOU
[info] 2018-10-15 21:30:40 fetch confgure cityname:ZHOUKOU,date:20180921,20180925,database:fastdo_lte_wk5
[info] 2018-10-15 21:30:40 log file is /home/fast/luohai/Projects/log/TOT_SCENE.log
[info] 2018-10-15 21:30:40 render FINISH.
[info] 2018-10-15 21:30:40 start run spark:TOT_SCENE
[info] 2018-10-15 23:03:08 Failed end run spark:TOT_SCENE #出现Failed就是有问题
[info] 2018-10-15 23:03:08 using project:TOT_ROAD
[info] 2018-10-15 23:03:08 cities to run:ZHOUKOU
[info] 2018-10-15 23:03:08 running:ZHOUKOU
[info] 2018-10-15 23:03:08 fetch confgure cityname:ZHOUKOU,date:20180921,20180925,database:fastdo_lte_wk5
[info] 2018-10-15 23:03:08 log file is /home/fast/luohai/Projects/log/TOT_ROAD.log
[info] 2018-10-15 23:03:08 render FINISH.
[info] 2018-10-15 23:03:08 start run spark:TOT_ROAD
[info] 2018-10-15 23:38:47 Failed end run spark:TOT_ROAD #出现Failed就是有问题

出现Failed我们需要检查是不是外部表没有创建好,我们需要一一排查

--------------------------------------最后一步去hive里执行龙哥写好的脚本-----------------------------------------
1.进入hive执行命令
su hive 切换成hive用户
2.在执行hive就成功进入hive了
hive
3.进入wk5库
show databases;查看拥有的数据库
use fastdo_lte_wk5;进入wk5库

4.需要修改龙哥写好的脚本的地市名
#在去wk5库进行汇聚

MR汇聚工具步骤的更多相关文章

  1. ceph存储集群性能测试工具步骤(初稿)

    一.源码安装fio工具: #yum install libaio-devel make #wget http://brick.kernel.dk/snaps/fio-2.2.10.tar.gz #ta ...

  2. 【安装vsftpd】安装vsftpd工具步骤

    1 安装vsftpd组件 [root@bogon ~]# yum -y install vsftpd 安装完后,有/etc/vsftpd/vsftpd.conf 文件,是vsftp的配置文件. 2 添 ...

  3. mount加载虚拟机增强工具步骤

    1.创建一个挂载目录sudo mkdir /mnt/cdrom 2.在C:\Program Files\Oracle\VirtualBox\VBoxGuestAdditions.iso中添加该文件 3 ...

  4. 数据集成工具Teiid Designer的环境搭建

    由于实验室项目要求的关系,看了些数据汇聚工具 Teiid 的相关知识.这里总结下 Teiid 的可视化配置工具 Teiid Designer 的部署过程. 背景知识 数据集成是把不同来源.格式.特点性 ...

  5. cocos2d-lua 3.5 ios搭建步骤

    xcode搭建cocos2d-lua是最简单的,不用 配置一系列环境变量,只把xcode安装好就可以 步骤一:去官网下载quick-3.5,然后打开命令行工具 步骤二:cd进入/Users/song/ ...

  6. 周一01.4安装PyCharm步骤

    安装集成开发工具 步骤一 步骤二 步骤三 步骤四

  7. JS模块化开发(四)——构建工具gulp

    gulp.js——基于流的自动化构建工具 步骤: 1. 全局安装 gulp: $ npm install --global gulp 2. 作为项目的开发依赖(devDependencies)安装: ...

  8. WordPress主题开发:开启侧边栏小工具功能

    步骤一:在主题的functions.php中,添加一段代码,开启侧边栏功能,代码如下: <?php //参数 $args = array( 'name' => __( '主侧边栏'), ' ...

  9. 轻量级批量管理工具pssh

    pssh工具 pssh工具是个轻量级的批量管理工具,相比同类型的开源工具 Ansible,Saltstack,他比较轻量级,需要对管理的主机做秘钥认证 Ansible是可以做秘钥认证,也可以通过配置文 ...

随机推荐

  1. 学习MeteoInfo二次开发教程(十)

    1.复制文件cloud_1009271330.000,I-01.pal 2.改: GridData cloud = aDataInfo.GetGridData(""); 为: Gr ...

  2. Bootstrap treeview增加或者删除节点

    参考(AddNode: http://blog.csdn.net/qq_25628235/article/details/51719917,deleteNode:http://blog.csdn.ne ...

  3. key diff 在input上的踩坑

    1.在react-native 遇到一个坑,希望的效果如下,同一个按钮,不同的状态下显示不同的input. 2.然后,在做的时候遇到了这样一个问题.输入我的姓名,点击下一步 3.问题出来了,输入框已经 ...

  4. strace参数

    strace参数 -c 统计每一系统调用的所执行的时间,次数和出错的次数等. -d 输出strace关于标准错误的调试信息. -f 跟踪由fork调用所产生的子进程. -ff 如果提供-o filen ...

  5. LeetCode 142. Linked List Cycle II 判断环入口的位置 C++/Java

    Given a linked list, return the node where the cycle begins. If there is no cycle, return null. To r ...

  6. Mac 系统下创建可双击执行文件,cd到执行文件当前目录

    在mac下之前我一直用.sh文件,但是要去终端里才能执行,后来得知可以写.command文件,双击及可执行,很方便,特此记录 #!/bin/bash basepath=$(cd `dirname $0 ...

  7. Jmeter学习记录

    JSON正则表达式提取规则 https://www.cnblogs.com/hc1020/p/7723720.html Jmeter非GUI下执行日志 执行命令 ./jmeter  -n  -t  $ ...

  8. mysql for循环存储过程

    DROP PROCEDURE IF EXISTS test_insert; DELIMITER ;; CREATE PROCEDURE test_insert () BEGIN DECLARE i i ...

  9. Python序列化操作与反序列操作

    一.概念 序列化:转向一个字符串数据类型序列:字符串 二.需要做序列化操作的情况1.数据存储2.网络上数据传输 从数据类型到字符串的过程叫序列化从字符串到数据类型的过程叫反序列化 三.现有序列化模块1 ...

  10. Tinker热修复

    集成buggly热修复的时候报错 Error:A problem occurred configuring project ‘:app’. Failed to notify project evalu ...