Talend 将Oracle中数据导入到hive中,根据系统时间设置hive分区字段
首先,概览下任务图:

流程是,先用tHDFSDelete将hdfs上的文件删除掉,然后将oracle中的机构表中的数据导入到HDFS中;建立hive连接-》hive建表-》tJava获取系统时间-》tHiveLoad将hdfs上的文件导入到hive表中。
下面介绍每一个组件的设置:
tHDFSDelete_1:

机构:

tHDFSOutput_1:

hive:

tHiveCreateTable:

tJava_1:

tHiveLoad_1:

在Context下面建一个内容变量:

这个内容变量riqi, 在tJava_1中赋值,然后在tHiveLoad_1中被使用,这样插入的分区就是程序运行是的系统日期。

[hive@h1 root]$ hive Logging initialized using configuration in file:/etc/hive/conf/hive-log4j.properties
SLF4J: Class path contains multiple SLF4J bindings.
SLF4J: Found binding in [jar:file:/usr/hdp/2.2.0.0-2041/hadoop/lib/slf4j-log4j12-1.7.5.jar!/org/slf4j/impl/StaticLoggerBinder.class]
SLF4J: Found binding in [jar:file:/usr/hdp/2.2.0.0-2041/hive/lib/hive-jdbc-0.14.0.2.2.0.0-2041-standalone.jar!/org/slf4j/impl/StaticLoggerBinder.class]
SLF4J: See http://www.slf4j.org/codes.html#multiple_bindings for an explanation.
SLF4J: Actual binding is of type [org.slf4j.impl.Log4jLoggerFactory]
hive> use zhangchao;
OK
Time taken: 1.023 seconds hive> show tables;
OK
jigou
Time taken: 0.255 seconds, Fetched: 1 row(s)
hive> select * from jigou limit 10;
OK
d64ceb0d-c85a-43ca-a705-c34f4258e938 002 成都高新区西园社区卫生服务中心 CDGXQXYSQW 1 09465203-3 程小川 oracle.sql.OPAQUE@7cfa3f14 510109 13323434
821028cc-30cc-461b-a197-28d62abc92dc 002 成都高新区中和社区卫生服务中心 CDGXQZHSQW 1 45081237-2 贾朝勇 028-85658497 成都市高新区中和大道3段56号 oracle.sql.OPAQUE@11437a26 13323434
0a49de29-5562-4951-abf3-829b0cff9692 004 成都高新区肖家河社区卫生服务中心 CDGXQXJHSQ 1 岳晖 028-85178759 成都高新区肖家河巷8号 oracle.sql.OPAQUE@65085da4 13323434
fd6d1f13-e435-4461-8cdc-d2fe48158c8c 001 高新区合作社区卫生服务中心 GXQHZSQWSF 1 45085201-6 罗洪林 028-87876286 成都高新区合作清江小区清源环街171号 oracle.sql.OPAQUE@83bedce 510109 13323434
94ac1712-199f-4461-9761-5d5ed3410a7f 003 高新区芳草社区卫生服务中心 GXQFCSQWSF 1 003 管理员 oracle.sql.OPAQUE@1679739b 13323434
d64ceb0d-c85a-43ca-a705-c34f4258e938 002 成都高新区西园社区卫生服务中心 CDGXQXYSQW 1 09465203-3 程小川 oracle.sql.OPAQUE@3116aa4b 510109 2015-06-29
821028cc-30cc-461b-a197-28d62abc92dc 002 成都高新区中和社区卫生服务中心 CDGXQZHSQW 1 45081237-2 贾朝勇 028-85658497 成都市高新区中和大道3段56号 oracle.sql.OPAQUE@47063b1a 2015-06-29
0a49de29-5562-4951-abf3-829b0cff9692 004 成都高新区肖家河社区卫生服务中心 CDGXQXJHSQ 1 岳晖 028-85178759 成都高新区肖家河巷8号 oracle.sql.OPAQUE@6a124c63 2015-06-29
fd6d1f13-e435-4461-8cdc-d2fe48158c8c 001 高新区合作社区卫生服务中心 GXQHZSQWSF 1 45085201-6 罗洪林 028-87876286 成都高新区合作清江小区清源环街171号 oracle.sql.OPAQUE@57552dfc 510109 2015-06-29
94ac1712-199f-4461-9761-5d5ed3410a7f 003 高新区芳草社区卫生服务中心 GXQFCSQWSF 1 003 管理员 oracle.sql.OPAQUE@193e282f 2015-06-29
Time taken: 0.807 seconds, Fetched: 10 row(s)
hive>
Talend 将Oracle中数据导入到hive中,根据系统时间设置hive分区字段的更多相关文章
- talend 将hbase中数据导入到mysql中
首先,解决talend连接hbase的问题: 公司使用的机器是HDP2.2的机器,上面配置好Hbase服务,在集群的/etc/hbase/conf/hbase-site.xml下,有如下配置: < ...
- 把Oracle的数据导入到SQL2012中 导出数据--SSIS
在ORACLE表和SQL Server表之间'转换'那步很重要,可以改变默认的字段数据类型,如image->text,decimal->int number ->int (注意设置 ...
- sqlserver 中数据导入到mysql中的方法以及注意事项
数据导入从sql server 到mysql (将数据以文本格式从sqlserver中导出,注意编码格式,再将文本文件导入mysql中): 1.若从slqserver中导出的表中不包含中文采用: bc ...
- SQL语句:把Excel文件中数据导入SQL数据库中的方法
1.从Excel文件中,导入数据到SQL数据库情况一.如果接受数据导入的表不存在 select * into jd$ from OPENROWSET('MICROSOFT.JET.OLEDB.4.0' ...
- 22.把hive表中数据导入到mysql中
先通过可视化工具链接mysql,在链接的时候用sqoop 用户登录 在数据库userdb下新建表 保存,输入表名upflow 现在我们需要把hive里面的数据通过sqoop导入到mysql里面 sqo ...
- 将Excel中数据导入数据库(二)
在上篇文章中介绍到将Excel中数据导入到数据库中,但上篇文章例子只出现了nvachar类型,且数据量很小.今天碰到将Excel中数据导入数据库中的Excel有6419行,其中每行均有48个字段,有i ...
- 关于 Oracle 的数据导入导出及 Sql Loader (sqlldr) 的用法
在 Oracle 数据库中,我们通常在不同数据库的表间记录进行复制或迁移时会用以下几种方法: 1. A 表的记录导出为一条条分号隔开的 insert 语句,然后执行插入到 B 表中2. 建立数据库间的 ...
- oracle数据库数据导入导出步骤(入门)
oracle数据库数据导入导出步骤(入门) 说明: 1.数据库数据导入导出方法有多种,可以通过exp/imp命令导入导出,也可以用第三方工具导出,如:PLSQL 2.如果熟悉命令,建议用exp/imp ...
- shell编程系列24--shell操作数据库实战之利用shell脚本将文本数据导入到mysql中
shell编程系列24--shell操作数据库实战之利用shell脚本将文本数据导入到mysql中 利用shell脚本将文本数据导入到mysql中 需求1:处理文本中的数据,将文本中的数据插入到mys ...
随机推荐
- Linux多线程同步之相互排斥量和条件变量
1. 什么是相互排斥量 相互排斥量从本质上说是一把锁,在訪问共享资源前对相互排斥量进行加锁,在訪问完毕后释放相互排斥量上的锁. 对相互排斥量进行加锁以后,不论什么其它试图再次对相互排斥量加锁的线程将会 ...
- Eclipse Java注释模板设置详解以及版权声明
网上的Eclipse注释模板,在这里稍稍整理一些比较常用的. 编辑注释模板的方法:Window->Preference->Java->Code Style->Code Temp ...
- 【转】TestNG 与 Junit的比较
转自 http://www.blogjava.net/fanscial/archive/2005/12/14/23780.html 1. JDK 5 Annotations (JDK ...
- Ubuntu18.04下编译安装Guitarix 0.37.3
准备工作 源文件下载 https://sourceforge.net/projects/guitarix/files/guitarix/ 安装依赖. 参考 https://sourceforge.ne ...
- MySQL Replication主从复制环境下修改主库IP
因为调整服务器子网, 数据库服务器的IP地址需要修改. 这个过程中, 需要确保的就是从库在断开主库后, 能从正确的位置再次启动. 具体的操作步骤如下 1) 需要获取的前提信息: 主库的新IP, 这在启 ...
- 转:Ogre的SceneManager分析
SceneManager分析 场景管理主要工作包括以下几点: 1.可移动.不可移动和可渲染物体的创建删除. 2.场景查询. 3.渲染队列. 4.动态阴影. 一. 场景对象创建 场景中的所有对象,包括可 ...
- Javascript 计算字符串所占字节数
最近项目有个需求要用js计算一串字符串写入到localStorage里所占的内存,众所周知的,js是使用Unicode编码的.而Unicode的实现有N种,其中用的最多的就是UTF-8和UTF-16. ...
- HDFS分布式文件系统(The Hadoop Distributed File System)
The Hadoop Distributed File System (HDFS) is designed to store very large data sets reliably, and to ...
- linux 系统获得当前文件夹下存在的所有文件 scandir函数和struct dirent **namelist结构体[转]
linux 系统获得当前文件夹下存在的所有文件 scandir函数和struct dirent **namelist结构体 1.引用头文件#include<dirent.h> struct ...
- linux中DHCP服务配置文件/etc/dhcpd.conf详细说明
DHCP服务的配置 dhcpd.conf 是DHCP服务的配置文件,DHCP服务所有参数都是通过修改dhcpd.conf 文件来实现,安装后dhcpd.conf 是没有做任何配置的,将/usr/sha ...