1. Informatica简介

① Repository manager 主要用来维护资料库的目录,对象,建完对象可以创建demo的folder。

② Administration Console是完全基于web的,管理所有的节点,服务,在里面包括资料库的一些用户,权限等信息。

③ Designer主要用来设计mapping。Mapping是informatica的一个映射,也就是说是ETL的一个规范,包括对源,目标,过程的设计。

④ workflow主要用于将mapping实例化,也就是设计一个session,如果session很多的话需要将它们设计成一个串行或者并行的过程,它们组成的session就叫做workflow,即工作流。

⑤ workflow monitor用来监控、执行workflow。

⑥ 控件:Source Qualified Transformation:ETL经常会用到的组件,对数据源,包括文件,也包括数据表进行抽取。无论数据源是表还是平面文件源,都会用到该组件。

2. 新建带过滤条件的workflow

D:

① 选在source,import source ,odbc data source中选择oracle的odbc设置,如果没有,要在管理工具中自行设置,具体如图。

② 同理,在target中设置目标数据表的连接,然后设置mapping,设置成功之后,转入w中设置工作流,

W:

① 在edit task->mapping中,source和target分别要设置源和目标的连接驱动。

② 在edit task->properties->parameter filename里面写入参数所在文件夹的地址(该参数在服务器的目录下,是事先设定好的文件)。

③ 在左项目条件source 中,edit task->mapping->source filter里面写入过滤的参数条件。

④ 在左项目条件target中,edit task->mapping->pre SQL里面写入执行前的更新数据表语句。

注意事项:

目标表的的数据表如果带有系统目录前缀,在设置mapping的连接条件时将无法识别前缀,因此没有办法传输数据。

3. 在Designer中设置过滤参数问题

① 设置参数之后,参数的默认值是字符如图,M中运行结果错误,无法解析参数,数据没有被导入。

4. 往GP数据库中导入平面文件源。

① 要将所导入的文件放入服务器的目录下,先在informatica控制台设置目录。

② 设置workflow时,在source里设置如下目录,其中source filetype包含两种情况,Direct设置如下图

③ indirect方式是选择表名列表文件,按文件列表运行。

5. 设置同时将两个表导入一个数据表中的workflow

6. 两个并无关联的mapping一起运行

① 在target load plan里面设置mapping运行的先后顺序。

7. 带expression Transformation组件的workflow

① 导入源表

② 手工创建目标表,可以在target菜单中选择great创建,也可以复制目标库中类似的表进行修改。前提是目标库中存在这样的表。

③ 手工创建目标表,target菜单下,generate/execute SQL

④ Filtertransformation组件:过滤组件将传到目标表的数据进行筛选,过滤。过滤不能对原来的表字段进行修改。值改变传递值的行数。

⑤ Expression Transformation组件:不改变抽取数据的行数,是被动的函数组件。不能实现汇总级的函数的操作。执行的先后顺序,先执行input,后执行valuable,valuable相当于一个局部的变量,按照顺序执行,后执行output。

⑥ Reusable Transformation组件:

8. Workflow的调度方式

① 手工执行(现在都是在手工执行)

② Workflow scheduler(调度程序调度)

③ pmcmd startworkflow

④ command task

⑤ worklet

9. informatica语法规则

① 输入的字符用 单引号 扩起来,连接字符用 || ,基本跟oracle保持一致。

② DECODE(IN_GENDER, 'M', 'MALE', 'N', 'FEMALE', 'UNK')

DECODE(TRUE,

IN_AGE < 20, 'LESS THAN 20',

IN_AGE  >= 20  AND  IN_AGE <= 29,  '20 TO 29',

IN_AGE  >= 30  AND  IN_AGE <= 39,  '30 TO 39',

IN_AGE  >= 40  AND  IN_AGE <= 49,  '40 TO 49',

IN_AGE  >= 50  AND  IN_AGE <= 60,  '50 TO 60',

IN_AGE  >  60, 'GREATER THAN 60'

)

DECODE(字段名, '条件1', '返回值1', '条件2', '返回值2', '缺省值')

Informatica 简单使用的更多相关文章

  1. informatica 学习日记整理

    1. INFORMATICA CLIENT的使用 1.1 Repository Manager 的使用 1.1.1 创建Repository. 前提: a.在ODBC数据源管理器中新建一个数据源连接至 ...

  2. Informatica学习:1、安装介质的获取与安装

    本文目标: 为方便学习Informatica工具,在个人电脑上部署Informatica Powercenter. 所用系统:win7 64位. Informatica安装包括服务器端.客户端安装两个 ...

  3. 数据仓库基础(十)Informatica 组件1

    本文转载自:http://www.cnblogs.com/evencao/p/informatica.html Informatica主要的组件: Source Qualifier 从数据源读取数据 ...

  4. 数据仓库基础(八)Informatica 小例子

    本文转载自:http://www.cnblogs.com/evencao/p/3147843.html 之前看了一段数据库的基础,感觉自己对数据库的基础挺薄弱的.以后再学习其他东西的时候也需要经常能学 ...

  5. Informatica增量抽取时间的设置

    使用数据库或者系统变量的当前时间 Informatica中的$$SYSDATE是表示当前系统时间的系统变量. 通过这个变量,我们对每天抽取的数据可以使用以下表达式来实现增量抽取: 时间戳字段>= ...

  6. Informatica学习笔记

    Informatica学习笔记1:UPDATE AS INSERT 问:要求实现每天抽取数据,而且是如果有改变才抽取更新,没有就不更新,因为源表中有最后修改时间的字段,我让它 和SESSION上次运行 ...

  7. Informatica PowerCenter使用介绍-转载

    转载自:https://blog.csdn.net/wen_demon/article/details/44155639 1. INFORMATICA CLIENT的使用1.1 Repository ...

  8. Informatica旗下PowerCenter的元数据库解析

    因客户需求,最近重拾Informatica下的PowerCenter产品,主要研究数据血缘关系.从PowerCenter本身来看,它是一个功能非常强大,速率非常高效的一款付费的ETL工具,可以满足各种 ...

  9. 【造轮子】打造一个简单的万能Excel读写工具

    大家工作或者平时是不是经常遇到要读写一些简单格式的Excel? shit!~很蛋疼,因为之前吹牛,就搞了个这东西,还算是挺实用,和大家分享下. 厌烦了每次搞简单类型的Excel读写?不怕~来,喜欢流式 ...

随机推荐

  1. UnityError SocketException: 以一种访问权限不允许的方式做了一个访问套接字的尝试。

    SocketException: 以一种访问权限不允许的方式做了一个访问套接字的尝试. 以管理员身份运行Unity就可以了,权限不够的问题.

  2. Kure讲HTML_HTML界面结构

    1.HTML界面结构: 通常通过html开发的网页,它有一个自己固定的书写格式(类似于写信的时候也有固定的格式) <!-- DOCTYPE用来告诉浏览器用当前html文档是用html的哪个版本编 ...

  3. DEDE日期调用小插件

    在日期文本框里面,点击的时候,下面出来一个和万年历一样的日期选择表,在dede里面,有一个现成的js小插件,直接调用就OK了... <input type="text" on ...

  4. Spring Boot实战(2) Spring常用配置

    1. Bean的Scope scope描述Spring容器如何新建Bean的实例.通过注解@Scope实现,取值有: a. Singleton:一个Spring容器中只有一个Bean的实例.此为Spr ...

  5. Get和Post区别,EncType提交数据的格式详解——转自他人博客的

    1. get是从服务器上获取数据,post是向服务器传送数据. 2. get是把参数数据队列加到提交表单的ACTION属性所指的URL中,值和表单内各个字段一一对应,在URL中可以看到.post是通过 ...

  6. IIS下不能下载文件的docx文档,XLSX文档的设置方法(转)

    IIS下不能下载文件的docx文档,XLSX文档的设置方法 Office 2007的的界面风格默认格式中都是.DOCX,XLSX,PPTX等等后缀,连结中包含此类文件时,界面风格默认什么打不开的其实只 ...

  7. C#Winform中ToolTip的简单用法,

    ToolTip它能够为我们的软件提供非常漂亮的提示信息,提高软件的可用性,给用户比较好的体验. 使用,在窗体加载时加载以下代码: var toolTip1 = new ToolTip(); toolT ...

  8. Html+CSS二周目--->常用概念

    学习css几乎俩周,来总结一下 对于初学者来说,有一些基本的概念是我们应当清楚的.掌握这些概念,可以帮助你更加有效的开发,大大提高开发效率. 1.盒子模型 2.浮动(float) 3.定位(posit ...

  9. 什么是css sprites,如何使用?

    css sprites:精灵图(雪碧图):把一堆小图片整合在一张大图上,通过背景图片相关设置(背景图片.背景图是否重复.背景图定位),显示图片,减轻服务器对图片的请求数量 优点: 1.减少网页的HTT ...

  10. Python列表类型及常用操作

    Python列表类型 1.用途: 存放多个值,可以根据索引存取值 2.定义方式: 在[ ]内用逗号分割开多个任意类型的值 l=['yven','law','lyf'] #l=list(['yven', ...