通过Sqoop来传输mysql/oracle/vertica数据至Hive

1.环境:

CDH

SQOOP2

2.操作步骤

1.准备表与主键

表名:test.test_log

主键:sys_log_id

建表语句

CREATE TABLE hbase_test_test_log_0307

(

ACCT_DATE string,

SYS_SEQ_ID string,

MER_CUST_ID string,

INSERTDT string

);

2.设置环境变量

JAVA_HOME=/usr/java/jdk1.8.0_111/

export JAVA_HOME

3.设置hdfs环境与权限

查看目录下文件

hdfs dfs -ls /tmp

删除已有的目录

hdfs dfs -rm -rf /tmp/hive_test_test_log_0307

授权

hadoop dfs -chmod -R 777 /tmp

4.执行导入脚本

sqoop import

--driver com.vertica.jdbc.Driver

--connect jdbc:vertica://192.168.1.1:8888/dbname?searchpath=test

--username user

--password passwd

--query "select * from test.test_log where acct_date between '20160101' and '20160101'and sys_seq_id >1 and \$CONDITIONS "

--hive-import

--create-hive-table

--hive-table hive_test_test_log_0307

--target-dir "/tmp/hive_test_test_log_0307" -m 1

5.查看导入结果与排错

5.确认数据正确

eg:kill异常任务方法

hadoop job -list

hadoop job -kill job_1478510263374_0069

通过Sqoop来传输mysql/oracle/vertica数据至Hive的更多相关文章

通过sqoop来传输mysql/oracle/vertica数据至HBASE
首先要注意将连接用的jar包,放到sqoop目录下,我的是/var/lib/sqoop 如果没有主键,则要加上-m 1 export正确的jdk目录当做key的列必须唯一存在,不然报错 --mysq ...
使用pyspark模仿sqoop从oracle导数据到hive的主要功能（自动建表，分区导入，增量，解决数据换行符问题）
最近公司开始做大数据项目,让我使用sqoop(1.6.4版本)导数据进行数据分析计算,然而当我们将所有的工作流都放到azkaban上时整个流程跑完需要花费13分钟,而其中导数据(增量)就占了4分钟左右 ...
sqoop1.4.4从oracle导数据到hive中
sqoop从oracle定时增量导入数据到hive 感谢: http://blog.sina.com.cn/s/blog_3fe961ae01019a4l.htmlhttp://f.dataguru. ...
sqoop 从oracle导数据到hive中，date型数据时分秒截断问题
oracle数据库中Date类型倒入到hive中出现时分秒截断问题解决方案 1.问题描述: 用sqoop将oracle数据表倒入到hive中,oracle中Date型数据会出现时分秒截断问题,只保留了 ...
使用sqoop1.4.4从oracle导入数据到hive中错误记录及解决方案
在使用命令导数据过程中,出现如下错误 sqoop import --hive-import --connect jdbc:oracle:thin:@192.168.29.16:1521/testdb ...
大数据自学2-Hue集成环境中使用Sqoop组件从Sql Server导数据到Hive/HDFS
安装完CDH后,发现里面的东东实在是太多了,对于一个初学大数据的来说就犹如刘姥姥进了大观园,很新奇,这些东东每个单拿出来都够喝一壶的. 接来来就是一步一步地学习了,先大致学习了每个模组大致做什么用的, ...
sql server 导出的datetime结果 CAST(0x00009E0E0095524F AS DateTime) 如何向mysql,oracle等数据库进行转换
1. 处理 sql server 导出的 datetime 类型的字段在进行sql server向mysql等其他数据进行迁移数据时,会发现使用sql server导出的datetime类型的结果是 ...
大数据之路week07--day06 （Sqoop 将关系数据库（oracle、mysql、postgresql等）数据与hadoop数据进行转换的工具）
为了方便后面的学习,在学习Hive的过程中先学习一个工具,那就是Sqoop,你会往后机会发现sqoop是我们在学习大数据框架的最简单的框架了. Sqoop是一个用来将Hadoop和关系型数据库中的数据 ...
通过Sqoop实现Mysql / Oracle 与HDFS / Hbase互导数据
通过Sqoop实现Mysql / Oracle 与HDFS / Hbase互导数据\ 下文将重点说明通过Sqoop实现Mysql与HDFS互导数据,Mysql与Hbase,Oracle与Hbase的互 ...
Sqoop_具体总结使用Sqoop将HDFS/Hive/HBase与MySQL/Oracle中的数据相互导入、导出
一.使用Sqoop将MySQL中的数据导入到HDFS/Hive/HBase watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvYWFyb25oYWRvb3A=/ ...

随机推荐

齐博x1再来个抛砖引玉内容页根据关键词调用相关内容新功能哦！
昨天升级了一个隐藏的功能,今天就简单的做个说明怎么用,反正也不能浪费不是那就用内容页面关键词读取相关内容为例吧. 前台是你模型中已经存在keywords字段关键词支持空格分割,号分割那么就开 ...
【MySQL】03_数据类型
MySQL 中的数据类型类型类型举例整数类型 TINYINT.SMALLINT.MEDIUMINT.INT(或INTEGER).BIGINT 浮点类型 FLOAT.DOUBLE 定点数类型 DE ...
二、Celery执行一步任务
二.Celery执行异步任务 2.1.基本使用创建项目celerypro 创建异步任务执行文件celery_task: import celery import time backend='redi ...
使用jmx exporter采集kafka指标
预置条件安装kafka.prometheus 使用JMX exporter暴露指标下载jmx exporter以及配置文件.Jmx exporter中包含了kafka各个组件的指标,如server ...
华为开发者大会HDC2022：HMS Core 持续创新，与开发者共创美好数智生活
11月4日,华为开发者大会HDC2022在东莞松山湖拉开帷幕.HMS Core在本次大会上带来了包括音频编辑服务的高拟真歌声合成技术.视频编辑服务的智能提取精彩瞬间功能.3D Engine超大规模数字 ...
Intel GPU Gen 9 架构
* 参考spec:the-compute-architecture-of-intel-processor-graphics-gen9-v1d0.pdf SOC 架构 Gen9 架构是早期用在igpu ...
05 uniapp/微信小程序项目day05
一.登录与支付 1.1 登录 1.1.1 条件判断当我们点击结算应当进行条件判断第一个如果没有勾选商品第二个是没选择地址第三个是未登录 1.1.2 页面布局应该有两个页面,一个点击登录, ...
C#pictureBox滚轮缩放与拖拽
[转载]C#pictureBox滚轮缩放与拖拽 [转载]C#中图像平移.缩放的实现技巧 [转载]c# 通过鼠标拖动.放大图片,GDI绘图通过鼠标拖动.放大
Linux下安装 SkyWalking 分布式追踪系统
Linux下安装 SkyWalking 分布式追踪系统 1.SkyWalking简介 1.1 SkyWalking介绍 SkyWalking项目是由华为大牛吴晟开源的个人项目,目前已经加入Apache ...
2022春每日一题：Day 28
题目:最大上升子序列和就是最长上升子序列的改版,贡献由1改为a[i]其他全部不变代码: #include <cstdio> #include <cstdlib> #incl ...

通过Sqoop来传输mysql/oracle/vertica数据至Hive

通过Sqoop来传输mysql/oracle/vertica数据至Hive的更多相关文章

随机推荐

热门专题