MR汇聚工具步骤
---------------------------------MR汇聚工具步骤-----------------------------------
-- 1、需要连上141服务器 用户:root 密码:Richr00t
-- 2、【MR汇聚工具】
--3、位置 141目录下进入后切换fast用户 su fast
/home/fast/luohai/Projects
------------------------第一步首先需要创建外部表-----------------------------
【MR定位表建立工具】
--4、建立MR定位数据的外部表
/home/elastic-combine/yyl/mro_load_hive
--5、执行建立外部表
sh ./mro_load_hive_jingdui.sh 地市名(大写)、日期(如:20180921)
--6、进入MR定位表建立工具目录下创建所需要创建的地市外部表
如: sh ./mro_load_hive_jingdui.sh ZHUMADIAN 20180921
--7、需要删除外部表可以执行
sh ./mro_delete_jingdui.sh
如:sh ./mro_delete_jingdui.sh ZHUMADIAN 20180921
-----------------------创建完外部表需要配置文件----------------------
--9、需要配置的文件有conf、run
bin:大脑
conf:配置文件
jars:存放java包
log: 存放日志
origin:传参工具
run:存放shell脚本
sql:存放元数据表
--10、--------------------第二步配置conf目录下-----------------------------位置/home/fast/luohai/Projects/conf
所需要配置的文件有TOT.conf、TOT_ROAD.conf、TOT_SCENE.conf进入修改文件需要vim
栅格 道路 场景
如 vim TOT.conf vim是一个编译器只能编译文件也可以创建文件
1.TOT.conf (CITYNAME、DATE)需要修改的文件
###可以修改也可以不用修改(由素绢发来的邮件为准)
CITYNAME=ZHENGZHOU
###日期必须修改(由素绢发来的邮件为准)
DATE=20180921,20180925
2.TOT_ROAD.conf(CITYNAME、DATE)需要修改的文件
###可以修改也可以不用修改(由素绢发来的邮件为准)
CITYNAME=ZHENGZHOU
###日期必须修改(由素绢发来的邮件为准)
DATE=20180921,20180925
3.TOT_SCENE.conf
###可以修改也可以不用修改(由素绢发来的邮件为准)
CITYNAME=ZHENGZHOU
###日期必须修改(由素绢发来的邮件为准)
DATE=20180921,20180925
---------------------第三部配置run目录下------------------------------------位置/home/fast/luohai/Projects/run
配置文件run_by_city.sh下的
###必须要修改的地市名(由素绢发来的邮件为准)
也可以多个地市跑 以空格来分隔
CITYNAMES="地市名 地市名"
sh $APP_HOME/run/runMain.sh TOT $CITYNAME (栅格级)
sh $APP_HOME/run/runMain.sh TOT_SCENE $CITYNAME (场景级)
sh $APP_HOME/run/runMain.sh TOT_ROAD $CITYNAME (道路级)
须知:每跑一个地市需要全部打开这三个栅格级、场景级、道路级的文件
配置好开启run_by_city.sh
sh ./run_by_city.sh 开启后会出现以下现象
info] 2018-10-19 10:11:28 using project:TOT
[info] 2018-10-19 10:11:28 cities to run:LUOYANG
[info] 2018-10-19 10:11:28 running:LUOYANG
[info] 2018-10-19 10:11:28 fetch confgure cityname:LUOYANG,date:20180921,20180925,database:fastdo_lte_wk5
[info] 2018-10-19 10:11:28 log file is /home/fast/luohai/Projects/log/TOT.log
[info] 2018-10-19 10:11:28 render FINISH.
[info] 2018-10-19 10:11:28 start run spark:TOT
###开启后出现start run spark:TOT就是正在跑数据
一般跑完需要好几个小时我们要时刻监控着
###跑完一般会出现两种情况成功和报错
###第一种运行成功如下:Succeed
using project:TOT
[info] 2018-10-15 18:07:07 cities to run:ZHOUKOU
[info] 2018-10-15 18:07:07 running:ZHOUKOU
[info] 2018-10-15 18:07:07 fetch confgure cityname:ZHOUKOU,date:20180921,20180925,database:fastdo_lte_wk5
[info] 2018-10-15 18:07:07 log file is /home/fast/luohai/Projects/log/TOT.log
[info] 2018-10-15 18:07:07 render FINISH.
[info] 2018-10-15 18:07:07 start run spark:TOT
[info] 2018-10-15 21:30:40 Succeed end run spark:TOT #出现Succeed就是没有问题
[info] 2018-10-15 21:30:40 using project:TOT_SCENE
[info] 2018-10-15 21:30:40 cities to run:ZHOUKOU
[info] 2018-10-15 21:30:40 running:ZHOUKOU
[info] 2018-10-15 21:30:40 fetch confgure cityname:ZHOUKOU,date:20180921,20180925,database:fastdo_lte_wk5
[info] 2018-10-15 21:30:40 log file is /home/fast/luohai/Projects/log/TOT_SCENE.log
[info] 2018-10-15 21:30:40 render FINISH.
[info] 2018-10-15 21:30:40 start run spark:TOT_SCENE
[info] 2018-10-15 23:03:08 Succeed end run spark:TOT_SCENE #出现Succeed就是没有问题
[info] 2018-10-15 23:03:08 using project:TOT_ROAD
[info] 2018-10-15 23:03:08 cities to run:ZHOUKOU
[info] 2018-10-15 23:03:08 running:ZHOUKOU
[info] 2018-10-15 23:03:08 fetch confgure cityname:ZHOUKOU,date:20180921,20180925,database:fastdo_lte_wk5
[info] 2018-10-15 23:03:08 log file is /home/fast/luohai/Projects/log/TOT_ROAD.log
[info] 2018-10-15 23:03:08 render FINISH.
[info] 2018-10-15 23:03:08 start run spark:TOT_ROAD
[info] 2018-10-15 23:38:47 Succeed end run spark:TOT_ROAD #出现Succeed就是没有问题
###第二种情况 Failed
[info] 2018-10-15 18:07:07 cities to run:ZHOUKOU
[info] 2018-10-15 18:07:07 running:ZHOUKOU
[info] 2018-10-15 18:07:07 fetch confgure cityname:ZHOUKOU,date:20180921,20180925,database:fastdo_lte_wk5
[info] 2018-10-15 18:07:07 log file is /home/fast/luohai/Projects/log/TOT.log
[info] 2018-10-15 18:07:07 render FINISH.
[info] 2018-10-15 18:07:07 start run spark:TOT
[info] 2018-10-15 21:30:40 Failed end run spark:TOT #出现Failed就是有问题
[info] 2018-10-15 21:30:40 using project:TOT_SCENE
[info] 2018-10-15 21:30:40 cities to run:ZHOUKOU
[info] 2018-10-15 21:30:40 running:ZHOUKOU
[info] 2018-10-15 21:30:40 fetch confgure cityname:ZHOUKOU,date:20180921,20180925,database:fastdo_lte_wk5
[info] 2018-10-15 21:30:40 log file is /home/fast/luohai/Projects/log/TOT_SCENE.log
[info] 2018-10-15 21:30:40 render FINISH.
[info] 2018-10-15 21:30:40 start run spark:TOT_SCENE
[info] 2018-10-15 23:03:08 Failed end run spark:TOT_SCENE #出现Failed就是有问题
[info] 2018-10-15 23:03:08 using project:TOT_ROAD
[info] 2018-10-15 23:03:08 cities to run:ZHOUKOU
[info] 2018-10-15 23:03:08 running:ZHOUKOU
[info] 2018-10-15 23:03:08 fetch confgure cityname:ZHOUKOU,date:20180921,20180925,database:fastdo_lte_wk5
[info] 2018-10-15 23:03:08 log file is /home/fast/luohai/Projects/log/TOT_ROAD.log
[info] 2018-10-15 23:03:08 render FINISH.
[info] 2018-10-15 23:03:08 start run spark:TOT_ROAD
[info] 2018-10-15 23:38:47 Failed end run spark:TOT_ROAD #出现Failed就是有问题
出现Failed我们需要检查是不是外部表没有创建好,我们需要一一排查
--------------------------------------最后一步去hive里执行龙哥写好的脚本-----------------------------------------
1.进入hive执行命令
su hive 切换成hive用户
2.在执行hive就成功进入hive了
hive
3.进入wk5库
show databases;查看拥有的数据库
use fastdo_lte_wk5;进入wk5库
4.需要修改龙哥写好的脚本的地市名
#在去wk5库进行汇聚
MR汇聚工具步骤的更多相关文章
- ceph存储集群性能测试工具步骤(初稿)
一.源码安装fio工具: #yum install libaio-devel make #wget http://brick.kernel.dk/snaps/fio-2.2.10.tar.gz #ta ...
- 【安装vsftpd】安装vsftpd工具步骤
1 安装vsftpd组件 [root@bogon ~]# yum -y install vsftpd 安装完后,有/etc/vsftpd/vsftpd.conf 文件,是vsftp的配置文件. 2 添 ...
- mount加载虚拟机增强工具步骤
1.创建一个挂载目录sudo mkdir /mnt/cdrom 2.在C:\Program Files\Oracle\VirtualBox\VBoxGuestAdditions.iso中添加该文件 3 ...
- 数据集成工具Teiid Designer的环境搭建
由于实验室项目要求的关系,看了些数据汇聚工具 Teiid 的相关知识.这里总结下 Teiid 的可视化配置工具 Teiid Designer 的部署过程. 背景知识 数据集成是把不同来源.格式.特点性 ...
- cocos2d-lua 3.5 ios搭建步骤
xcode搭建cocos2d-lua是最简单的,不用 配置一系列环境变量,只把xcode安装好就可以 步骤一:去官网下载quick-3.5,然后打开命令行工具 步骤二:cd进入/Users/song/ ...
- 周一01.4安装PyCharm步骤
安装集成开发工具 步骤一 步骤二 步骤三 步骤四
- JS模块化开发(四)——构建工具gulp
gulp.js——基于流的自动化构建工具 步骤: 1. 全局安装 gulp: $ npm install --global gulp 2. 作为项目的开发依赖(devDependencies)安装: ...
- WordPress主题开发:开启侧边栏小工具功能
步骤一:在主题的functions.php中,添加一段代码,开启侧边栏功能,代码如下: <?php //参数 $args = array( 'name' => __( '主侧边栏'), ' ...
- 轻量级批量管理工具pssh
pssh工具 pssh工具是个轻量级的批量管理工具,相比同类型的开源工具 Ansible,Saltstack,他比较轻量级,需要对管理的主机做秘钥认证 Ansible是可以做秘钥认证,也可以通过配置文 ...
随机推荐
- 03-在tomcat部署网站多个网站
在Tomcat服务器发布两个项目 CRM OA server.xml配置文件 <Context docBase="C:\crm" path="/crm" ...
- python对mysql进行简单操作
python 连接MySQL数据库,进行简单操作 一.连接MySQL数据库,关闭连接 import pymysql db = pymysql.connect(host="xxx.xxx.x. ...
- this 的指向
使用 JavaScript 开发的时候,很多开发者多多少少会被 this 的指向搞蒙圈,但是实际上,关于 this 的指向,记住最核心的一句话:哪个对象调用函数,函数里面的this指向哪个对象. 下面 ...
- @Override is not allowed when implementing interface method
使用idea导入maven项目时 会出现如下报错 @Override从jdk1.5开始出现的,是用来标注方法重写:通常方法重写发生在继承父类,重写父类方法,或者实现接口,实现接口方法: @Overri ...
- 关于python的多行注释,启动新浏览器,循环语句乘法口诀
1,提问:如何将python写的多行代码改写成注释,进行写下一段代码?这样可以在多个脚本中写东西? 回答:百度了一下,还真有 选中所要注释的代码 CTRL + / 然后所选的代码前面都会出现#,编程 ...
- Spring Boot实现文件下载功能
我们只需要创建一个控制器(Controler)文件,即Controller目录下的File_Download.java,其完整目录如下: @Controller public class File_D ...
- mybatis运行原理学习
一.分步骤分析 1.根据配置文件创建SqlSessionFactory: 解析文件的每一个信息保存在Configuration中,返回包含Configuration的DefaultSqlSession ...
- django settings多环境配置
通常我们会把本地.线上的配置拆分,django不同环境的配置可如下: 1.在settings.py同级目录添加settings文件夹 2.把settings.py移到settings文件夹内,并重命名 ...
- 深度学习原理与框架- tf.nn.atrous_conv2d(空洞卷积) 问题:空洞卷积增加了卷积核的维度,为什么不直接使用7*7呢
空洞卷积, 从图中可以看出,对于一个3*3的卷积,可以通过使用增加卷积的空洞的个数,来获得较大的感受眼, 从第一幅图中可以看出3*3的卷积,可以通过补零的方式,变成7*7的感受眼,这里补零的个数为1, ...
- 【EFM32】EFM32芯片解锁、加锁操作
[解锁] 使用J-Flash,新建Project,选择对应的EFM32芯片型号. 选择Target >> Connect >> Unsecure chip ,便进行解锁了,解锁 ...