1、informatica中domain与node的理解:

domain 类似于局域网,node就是局域网中的节点或者计算机。

node应与repository在数据库中存储在不同的scheme中,此处node指informatica操作的内容。

2、informatica中Repository Service 与 Intergration Service

IS:工作引擎;RS:管理引擎,管理repository;

IS与RS工作流程为:客户端发请求到IS,IS调用RS完成各种ETL操作,其中,RS工作过程中会访问repository进行元数据信息、T规则等访问,并将task,workflow的结果状态等存储到repository。

一般一个IS对应一个node,当一个一个IS要对应多个node时,涉及grid,将多个node放在一个grid下,一个grid对应一个IS。

3、server与client端driver配置

一般配置driver时,尽可能选择native dirver,native dirver的性能高于ODBC,但是ODBC的兼容性和适用性高。

server 端driver:用于ETL过程中实际存取读写数据;

client 端driver:用于导入source/target 表,即元数据。

4、informatica中数据处理方式为并行处理,即管道式处理。

5、分区

分区使处理方式由单线程变成多线程,一个连接变成多个连接。

分区后,当使用汇总、关联等组件时informatica可自动保证数据结果的正确性。

在汇总、关联之前,若数据已进行排序,且组件中已排序属性已勾选,则数据为流式通过;否则,需数据全量到达然后进行处理。

6、集群:

informatica既可支持单机,也可建立集群环境。而且,集群环境可以异构,即不限定OS,version等;

在集群环境中,任务可通过以下三种方式分发:

第一种:轮询;

第二种:动态控制,需在config文件中进行配置;

第三种:建立task与node的映射表(,然后在config文件中进行配置该映射表?)。

无论采取哪种方式,都可以保证task的执行顺序,因为task的执行顺序是由repository中workflow表(表名貌似是OPB_WORKFLOW)存储。

7、增值服务组件:HA,可自动接管坏点

启用方式为:运行workflow时以auto recovery方式运行;

要求:需在磁盘中建立共享存储,并配置主从节点。

8、规则文档映射

informatica中mapping可导出成excel文件,并包含各种transformation rule。

使用方式:在客户端repository组件中,选择要导出的mapping,右键菜单 export metadata。

9、批量开发

利用visio组件,可实现批量ETL过程开发,尤其适用于平推。(具体转化方式不详)

10、CDC 增量采集

主要适用于可做增量log的DB,如 oracle。先capture,然后apply。(具体抓取方式需查询相关文档)

11、下推优化:

指导方针:平衡DB sever 与informatica server的负载。

原理:将下推部分转化成sql,在DB中实现。可实现source下推和target下推。

使用方法:session中mapping 菜单下有pushdown 选项。

12、数据校验插件 data validation

可创建valid rule,代替手工校验。

13、前瞻监控 rulepoint

14、调优:

1、减少port field

2、减少过程中数据量,尽早filter

3、避免不必要排序,sort is expensive

4、expression 中符号比表达式性能高

expression 中有变量端口,可生成中间量,重复使用

expression中尽量少嵌套,可用高级函数代替

5、尽量避免类型转换

6、high precision is expensive

15、read write transformation 的统计信息除了在workflow monitor中,session log中也有

16、session中各参数

DTM memory:session占用的全部内存(内存块个数)

buffer block size:内存块大小(mapping中所有source的数据量的整数倍)

line sequential buffer length:当源是文件时,文件记录长度

max memory:最大内存块数

17、session 调优:

尽量关闭日志;

目标加载前利用pre sql 删除索引约束,加载完成后利用post sql 重建索引约束;

提交间隔可稍微设置大一些;

关闭统计信息收集;

设置各种参数;

数据装载方式尽量选择loader

18、temp文件与cache文件的区别:

具体参见各组件使用的文件夹配置名称,如sort组件使用temp文件夹,join组件使用cache文件夹。

informatica 厂商培训资料的更多相关文章

  1. Informatica - Powercenter 英文版资料(转载)

    Informatica - Powercenter 英文版资料 http://gerardnico.com/wiki/powercenter/powercenter

  2. [资源分享]神州数码 思科 UCS 虚拟化培训资料

    神州数码 思科 UCS 虚拟化培训资料   点击文件名下载 UCS统一计算平台=.pdf 云计算Demo实验教材_Nexus 5K2K实验.pdf 云计算数据中心架构与技术.pdf 云计算数据中心虚拟 ...

  3. JAVA培训资料

    JAVA培训资料 一.Java语言 1.面向对象的三个基本特征 2.方法重载和方法重写的概念和区别 3.接口和内部类.抽象类的特性 4.文件读写的基本类 **5.串行化的注意事项以及如何实现串行化 6 ...

  4. 2019-1-92.4G射频芯片培训资料

    2019-1-92.4G射频芯片培训资料 培训 RF 小书匠  欢迎走进zozo的学习之旅. 2.4G芯片选型 2.4G芯片开发 Q&A 2.4G芯片选型 芯片类型 soc 防盗标签2.4G无 ...

  5. ABB机器人基础培训资料整理与总结

    之前对机械臂了解较少,这方面知识比较匮乏.只使用过PowercCube六自由度机械臂. 感谢ABB公司何老师的耐心指导. 学习资料汇总:(最重要的ABB Robot 官网就不列出了,这里以中文资料为主 ...

  6. 【jquery】 API讲解 内部培训资料

    资料在百度云盘 一.jquery  API讲解 1.jquery  api如何使用 jquery  api http://www.hemin.cn/jq/ 2.常用api讲解 选择器: 通过$()获取 ...

  7. asp.net web api内部培训资料

    最近在公司进行了一次asp.net web api的分享吧,不算是培训. 可能大家有些人对Web API的推出目的还不是很了解,可以看看微软官方的定义,其实是为了提供一个好的REST Service方 ...

  8. [置顶] IOS培训资料

    1 前言 今天给公司部门培训IOS,经过两天整理弄了个PPT和一个小的Demo,希望对大家入门有所帮助. 2 详述 培训内容,主要从开发环境讲起,到Objective-C的简单入门,IOS的简介,以及 ...

  9. BLDC 无刷电机FOC驱动 STM32官方培训资料

    STM32 PMSM FOC SDK V3.2 培训讲座一http://v.youku.com/v_show/id_XNTM2NjgxMjU2.html?from=s1.8-1-1.2STM32 PM ...

随机推荐

  1. 开放产品开发(OPD):开篇

    OPD?这是什么玩意?google一下.忘记说了,最近google被封锁的厉害,那就百度一下吧.可惜,OPD找不出是什么.你今天你找不到是正常的,因为之前还没有OPD,而现在才开始有OPD这个东东.相 ...

  2. 转载:第五弹!全球首个微信小程序(应用号)开发教程!通宵吐血赶稿,每日更新!

    博卡君今天继续更新,忙了一天,终于有时间开工写教程.不罗嗦了,今天我们来看看如何实现一些前端的功能和效果. 第八章:微信小程序分组开发与左滑功能实现 先来看看今天的整体思路: 进入分组管理页面--&g ...

  3. GPUImage滤镜之锐化

    应用锐化工具可以快速聚焦模糊边缘,提高图像中某一部位的清晰度或者焦距程度,使图像特定区域的色彩更加鲜明. 在应用锐化工具时,若勾选器选项栏中的“对所有图层取样”复选框,则可对所有可见图层中的图像进行锐 ...

  4. (8)分布式下的爬虫Scrapy应该如何做-图片下载(源码放送)

      转载主注明出处:http://www.cnblogs.com/codefish/p/4968260.html 在爬虫中,我们遇到比较多需求就是文件下载以及图片下载,在其它的语言或者框架中,我们可能 ...

  5. C#中方法的调用

    C#中方法的调用 1.同一个类中方法的调用: 静态方法可以直接调用静态方法 静态方法不能直接调用非静态方法,静态方法先生成. 非静态方法可以直接调用静态方法 如果静态方法要调用非静态的方法,必须使用实 ...

  6. 用Perl编写Apache模块续 - SVNAuth

    目标:以整合各类项目管理系统中的用户体系及权限体系为目标,实现SVN的集成式动态鉴权 支持平台:usvn.禅道等 - 开发中,本文仅对前期的探索工作做点整理 开发环境: Windows.XAMPP 1 ...

  7. JavaMail入门第五篇 解析邮件

    上一篇JavaMail入门第四篇 接收邮件中,控制台打印出的内容,我们无法阅读,其实,让我们自己来解析一封复杂的邮件是很不容易的,邮件里面格式.规范复杂得很.不过,我们所用的浏览器内置了解析各种数据类 ...

  8. ASP.NET Web API获取Model元数据

    using System; using System.Web.Http; using Common; namespace ConsoleApp { internal class Program { p ...

  9. 从" ThinkPHP 开发规范 "看 PHP 的命名规范和开发建议

    稍稍水一篇博客,摘抄自Think PHP 的开发规范,很有引导性,我们可以将这些规范实践到原生 PHP 中. 命名规范 使用ThinkPHP开发的过程中应该尽量遵循下列命名规范: 类文件都是以.cla ...

  10. SharpGL学习笔记(十五) 纹理映射

    纹理映射非常实用,在游戏场景中已经无所不在了. 一个较少的多边形构成的模形,配合好的纹理贴图进行映射,可以得到逼真的效果.游戏中的天空,地面,墙面,和植物都是纹理贴图进行映射的. 例如最终幻想8的男女 ...