0. 环境说明及软件准备

ODI(Oracle Data Integrator)是Oracle公司提供的一种数据集成工具,能高效地实现批量数据的抽取、转换和加载。ODI可以实现当今大多数的主流关系型数据库(Oracle、DB2、SQL Server、MySQL、SyBase)的集成。

ODI提供了图形化客户端和agent(代理)运行程序。客户端软件主要用于对整个数据集成服务的设计,包括创建对数据源的连接架构、创建模型及反向表结构、创建接口、生成方案和计划等。Agent运行程序是通过命令行方式在ODI服务器上启动的服务,对agent下的执行计划周期性地执行。

任何数据驱动的集成,都可以使用ODI, ODI的常见应用场景:

    1. 数据仓库:比如ETL阶段。

    2. 数据迁移:比如将某一源系统的数据迁移到新系统中。

    3. 数据集成:比如两个系统间高效的点到点数据传递。

    4. 数据复制:比如将一个Instance的数据复制另外一个Instance中。

闲言少叙,进入正题。首先,ODI是Oracle的数据集成工具,需要安装Oracle数据库,可以从Oracle官网下载安装,先要在官网上注册一个账号,找到下载页,最好把下面的client(客户端)也一并安装了吧,我安装的是Oracle11g win64位的,官网下载页如下:

安装过程比较简单,只是中间需要设置管理口令,记住就行。ODI也同样在Oracle的官网上下载。

将下载的ODI安装文件解压,就会包含两个文件夹,注意不同版本的安装,运行方式是不同的,我装的32位的ODI,需要运行Disk1\install\win32下的安装程序setup.exe。如下:

运行安装程序,直接下一步,步骤2选【跳过软件更新】;

步骤3选择安装类型,勾选一下即可;

步骤6选【跳过资料档案库配置】;

步骤7指定代理

下一步,直至安装完成。也可自行下载安装PL/SQL Developer,可以方便连接和管理数据库,当然这不是必须的,可用其它工具代替。全部安装完成后如下:

1. 创建数据库用户

在Oracle数据库中为ODI的资料库创建用户,ODI的资料库分为主资料库和工作资料库。资料库所产生的数据就是存放在Oracle数据库中的。

主资料库保存所有IT资源的Topology,保存项目和数据模型的安全信息、版本信息,供ODI图形模块等使用。

工作资料库保存项目和数据模型,供ODI图形模块等使用。

工作资料库需要连接到一个主资料库,为了逻辑清晰,我创建两个Oracle用户,分别存放主资料库和工作资料库的数据。

打开pl/sql,以管理员身份登陆到Oracle数据库。

【文件】>>【新建】>>【SQL窗口】>>输入创建用户的SQL语句>>【执行】

工作资料库用户的创建方式和主资料库一样,SQL语句如下:

 CREATE USER J_ODI_ZLK    --主资料库用户名
IDENTIFIED BY zlk123 --密码
DEFAULT TABLESPACE USERS; --默认表空间
GRANT CONNECT,RESOURCE TO J_ODI_ZLK;--授权用户
CREATE USER J_ODI_GZK --工作资料库用户名
IDENTIFIED BY gzk123 --密码
DEFAULT TABLESPACE USERS; --默认表空间
GRANT CONNECT,RESOURCE TO J_ODI_GZK;--授权用户

2. 创建主资料库

在Oracle中创建完用户后,就可以在ODI中创建主资料库。首先在开始菜单中找到已安装的ODI 并启动。

【文件】>>【新建】,打开新建库对话框,选择【主资料档案库创建向导】>>【确定】。

进入数据库连接窗口,在这里需要填写刚在Oracle数据库中为主资料库创建的用户信息以及Oracle数据库的DBA用户信息。需注意的是JDBC URL项中localhost为Oracle数据库的IP地址,我用的本地机器,就直接写localhost;orcl为Oracle数据库的实例名。信息输入完成后,点击一下测试连接,成功则可进入下一步。

这一步需要创建ODI超级用户SUPERVISOR,在窗口中输入密码即可,该密码要记住,后面会用到。

完成后ODI即开始创建主资料库,稍等就会出现成功创建主资料库的对话框。

主资料库创建完成后,就可以在ODI中连接到刚创建的主资料库了。点击ODI左侧边栏上方的【连接到资料档案库】,弹出登陆对话框,点击【登录名】后面的加号。

进入配置主资料库的连接信息,如下图所示。

配置完成后点击【确定】即可进入主资料库。

3. 创建工作资料库

主资料库完成后,并不能进行实质的开发工作,还需要创建一个工作资料库,在工作资料库中才可以进行工作。接上一环节,进入主资料库后,点击左侧边栏上方的【拓扑】标签,点击【资料档案库】,在【工作资料档案库】上单击鼠标右键,选择【新建工作资料档案库】。

进入工作资料库的连接配置,配置完成点击【下一步】。

进入配置工作资料库的名称以及密码。输入后点击【完成】即可。工作资料库创建成功后,系统会弹出【是否为工作资料档案库创建登录】对话框,提示是否为该工作资料库创建登录名,可以选择【否】,一会在连接工作资料库时在创建也是一样。

工作资料库创建完成后,就可以在ODI中连接到刚创建的工作资料库了。在连接之前,先要断开已经连接的主资料库,【ODI】>>【断开连接”J_ZLK”】。

断开主资料库的连接后,再点击ODI左侧边栏上方的【连接到资料档案库】,弹出登陆对话框,点击【登录名】后面的加号。

进入创建工作资料库的连接配置窗口,如下图所示。

配置完成,点击【确定】即可登陆到工作资料库,就可以开始work了。

至此,前期的基本配置工作已经完成了,后面就可以正式开始创建具体的数据集成方案了。

4. 工作场景说明

    【ODI】| 数据ETL:从零开始使用Oracle ODI完成数据集成(二)

5. 创建物理体系结构

    【ODI】| 数据ETL:从零开始使用Oracle ODI完成数据集成(二)

6. 创建逻辑体系结构

    【ODI】| 数据ETL:从零开始使用Oracle ODI完成数据集成(二)

7. 创建模型

    【ODI】| 数据ETL:从零开始使用Oracle ODI完成数据集成(二)

8. 创建项目及接口

    【ODI】| 数据ETL:从零开始使用Oracle ODI完成数据集成(三)

9. 执行接口

    【ODI】| 数据ETL:从零开始使用Oracle ODI完成数据集成(三)

【ODI】| 数据ETL:从零开始使用Oracle ODI完成数据集成(一)的更多相关文章

  1. 【ODI】| 数据ETL:从零开始使用Oracle ODI完成数据集成(三)

    资料库的创建.体系结构的创建.模型反向工程都已经完成了,下面就是创建以及执行接口来完成工作了. 浏览前两节请点击: [ODI]| 数据ETL:从零开始使用Oracle ODI完成数据集成(一) [OD ...

  2. 【ODI】| 数据ETL:从零开始使用Oracle ODI完成数据集成(二)

    前一节已经完成了Oracle数据库和ODI的安装,并已经为ODI在Oracle数据库中创建了两个用户,分别用于存放主资料库数据和工作资料库数据,在ODI中完成主资料库和工作资料库的创建,也分别为其创建 ...

  3. 【转】Oracle当中扫描数据的方法

    本文将对oracle当中扫描数据的存取方法进行介绍. 1) 全表扫描(Full Table Scans, FTS) 为实现全表扫描,Oracle读取表中所有的行,并检查每一行是否满足语句的WHERE限 ...

  4. Oracle ODI系列之一(ODI知识模块)

    Oracle ODI系列之一(ODI知识模块)     ODI简介 ODI(Oracle Data Integrator)前身是Sunopsis Active Integration Platform ...

  5. 基于ETL技术的数字化校园共享数据中心设计

    摘要:数据的抽取.转换与加载(ETL)是数据整合的核心过程.在分析高校信息化建设现状基础上,以建立数字化校园.整合数据资源.实现数据共享为目标,提出以ETL为基础建立共享数据中心实现数据整合的方案.介 ...

  6. 大数据ETL详解

    ETL是BI项目最重要的一个环节,通常情况下ETL会花掉整个项目的1/3的时间,ETL设计的好坏直接关接到BI项目的成败.ETL也是一个长期的过程,只有不断的发现问题并解决问题,才能使ETL运行效率更 ...

  7. 从零开始学习oracle

    引用博客:https://blog.csdn.net/qq_36998053/article/details/82725765 )Oracle之<环境配置> (二)Oracle之<基 ...

  8. 分享MSSQL、MySql、Oracle的大数据批量导入方法及编程手法细节

    1:MSSQL SQL语法篇: BULK INSERT [ database_name . [ schema_name ] . | schema_name . ] [ table_name | vie ...

  9. 实现从Oracle增量同步数据到GreenPlum

    简介: GreenPlum是一个基于PostgreSQL数据库开发的MPP架构的数据库仓库,适用于OLAP系统,支持50PB(1PB=1000TB)级海量数据的存储和处理. 背景: 目前有一个业务是需 ...

随机推荐

  1. Selenium2Lib库之键盘常用关键字实战

    Press Key关键字 按F5 查看Press Key关键字的说明,如下图: Press Key关键字是用于通过键盘模拟由定位器确定的元素的用户按键.‘值’是单个字符,字符串或数值的ASCII码的“ ...

  2. Java IO流对象、多线程

    Input(读) Output(写)操作 File类 import java.io.File; 将操作系统中的文件.目录(文件夹).路径.封装成File对象 提供方法,操作系统中的内容.File与系统 ...

  3. nginx常用配置系列-反向代理

    接上篇,反向代理的原理与用途很多地方有讲,用文字说再多可能也表达不清楚,下面贴一张拓扑图,介绍下什么叫反向代理 以上图有两种情景 1. 访问者的客户端是 local ,要访问baidu的服务器,bai ...

  4. 【转】Javascript错误处理——try…catch

    无论我们编程多么精通,脚本错误怎是难免.可能是我们的错误造成,或异常输入,错误的服务器端响应以及无数个其他原因. 通常,当发送错误时脚本会立刻停止,打印至控制台. 但try...catch语法结构可以 ...

  5. 对于 Netty ByteBuf 的零拷贝(Zero Copy) 的理解

    此文章已同步发布在我的 segmentfault 专栏. 根据 Wiki 对 Zero-copy 的定义: "Zero-copy" describes computer opera ...

  6. AXIS2整合spring需要的jar,以及大部分缺少jar所报的异常

    axis2 webservice 服务端jar包: -->axis2-kernel-1.6.1.jar                              -->axis2-spri ...

  7. Pat1067:Sort with Swap(0,*)

    1067. Sort with Swap(0,*) (25) 时间限制 150 ms 内存限制 65536 kB 代码长度限制 16000 B 判题程序 Standard 作者 CHEN, Yue G ...

  8. Lsyncd - 实时文件同步工具(精译)

    原文: http://axkibe.github.io/lsyncd/ 描述 Lsyncd监视本地目录树事件监视器接口(inotify或fsevents).它聚集并组合事件几秒钟,然后生成一个(或多个 ...

  9. Elasticsearch: 权威指南 » 深入搜索 » 多字段搜索 » 多数字段 good

      跨字段实体搜索  » 多数字段编辑 全文搜索被称作是 召回率(Recall) 与 精确率(Precision) 的战场: 召回率 ——返回所有的相关文档:精确率 ——不返回无关文档.目的是在结果的 ...

  10. matplotlib简单的使用(二)

    1.折线图 import matplotlib as mlb from matplotlib import pylab as pl # 折线图 # 分别创建x,y坐标 x = [1,3,5,7,6,9 ...