informatica 厂商培训资料
1、informatica中domain与node的理解:
domain 类似于局域网,node就是局域网中的节点或者计算机。
node应与repository在数据库中存储在不同的scheme中,此处node指informatica操作的内容。
2、informatica中Repository Service 与 Intergration Service
IS:工作引擎;RS:管理引擎,管理repository;
IS与RS工作流程为:客户端发请求到IS,IS调用RS完成各种ETL操作,其中,RS工作过程中会访问repository进行元数据信息、T规则等访问,并将task,workflow的结果状态等存储到repository。
一般一个IS对应一个node,当一个一个IS要对应多个node时,涉及grid,将多个node放在一个grid下,一个grid对应一个IS。
3、server与client端driver配置
一般配置driver时,尽可能选择native dirver,native dirver的性能高于ODBC,但是ODBC的兼容性和适用性高。
server 端driver:用于ETL过程中实际存取读写数据;
client 端driver:用于导入source/target 表,即元数据。
4、informatica中数据处理方式为并行处理,即管道式处理。
5、分区
分区使处理方式由单线程变成多线程,一个连接变成多个连接。
分区后,当使用汇总、关联等组件时informatica可自动保证数据结果的正确性。
在汇总、关联之前,若数据已进行排序,且组件中已排序属性已勾选,则数据为流式通过;否则,需数据全量到达然后进行处理。
6、集群:
informatica既可支持单机,也可建立集群环境。而且,集群环境可以异构,即不限定OS,version等;
在集群环境中,任务可通过以下三种方式分发:
第一种:轮询;
第二种:动态控制,需在config文件中进行配置;
第三种:建立task与node的映射表(,然后在config文件中进行配置该映射表?)。
无论采取哪种方式,都可以保证task的执行顺序,因为task的执行顺序是由repository中workflow表(表名貌似是OPB_WORKFLOW)存储。
7、增值服务组件:HA,可自动接管坏点
启用方式为:运行workflow时以auto recovery方式运行;
要求:需在磁盘中建立共享存储,并配置主从节点。
8、规则文档映射
informatica中mapping可导出成excel文件,并包含各种transformation rule。
使用方式:在客户端repository组件中,选择要导出的mapping,右键菜单 export metadata。
9、批量开发
利用visio组件,可实现批量ETL过程开发,尤其适用于平推。(具体转化方式不详)
10、CDC 增量采集
主要适用于可做增量log的DB,如 oracle。先capture,然后apply。(具体抓取方式需查询相关文档)
11、下推优化:
指导方针:平衡DB sever 与informatica server的负载。
原理:将下推部分转化成sql,在DB中实现。可实现source下推和target下推。
使用方法:session中mapping 菜单下有pushdown 选项。
12、数据校验插件 data validation
可创建valid rule,代替手工校验。
13、前瞻监控 rulepoint
14、调优:
1、减少port field
2、减少过程中数据量,尽早filter
3、避免不必要排序,sort is expensive
4、expression 中符号比表达式性能高
expression 中有变量端口,可生成中间量,重复使用
expression中尽量少嵌套,可用高级函数代替
5、尽量避免类型转换
6、high precision is expensive
15、read write transformation 的统计信息除了在workflow monitor中,session log中也有
16、session中各参数
DTM memory:session占用的全部内存(内存块个数)
buffer block size:内存块大小(mapping中所有source的数据量的整数倍)
line sequential buffer length:当源是文件时,文件记录长度
max memory:最大内存块数
17、session 调优:
尽量关闭日志;
目标加载前利用pre sql 删除索引约束,加载完成后利用post sql 重建索引约束;
提交间隔可稍微设置大一些;
关闭统计信息收集;
设置各种参数;
数据装载方式尽量选择loader
18、temp文件与cache文件的区别:
具体参见各组件使用的文件夹配置名称,如sort组件使用temp文件夹,join组件使用cache文件夹。
informatica 厂商培训资料的更多相关文章
- Informatica - Powercenter 英文版资料(转载)
Informatica - Powercenter 英文版资料 http://gerardnico.com/wiki/powercenter/powercenter
- [资源分享]神州数码 思科 UCS 虚拟化培训资料
神州数码 思科 UCS 虚拟化培训资料 点击文件名下载 UCS统一计算平台=.pdf 云计算Demo实验教材_Nexus 5K2K实验.pdf 云计算数据中心架构与技术.pdf 云计算数据中心虚拟 ...
- JAVA培训资料
JAVA培训资料 一.Java语言 1.面向对象的三个基本特征 2.方法重载和方法重写的概念和区别 3.接口和内部类.抽象类的特性 4.文件读写的基本类 **5.串行化的注意事项以及如何实现串行化 6 ...
- 2019-1-92.4G射频芯片培训资料
2019-1-92.4G射频芯片培训资料 培训 RF 小书匠 欢迎走进zozo的学习之旅. 2.4G芯片选型 2.4G芯片开发 Q&A 2.4G芯片选型 芯片类型 soc 防盗标签2.4G无 ...
- ABB机器人基础培训资料整理与总结
之前对机械臂了解较少,这方面知识比较匮乏.只使用过PowercCube六自由度机械臂. 感谢ABB公司何老师的耐心指导. 学习资料汇总:(最重要的ABB Robot 官网就不列出了,这里以中文资料为主 ...
- 【jquery】 API讲解 内部培训资料
资料在百度云盘 一.jquery API讲解 1.jquery api如何使用 jquery api http://www.hemin.cn/jq/ 2.常用api讲解 选择器: 通过$()获取 ...
- asp.net web api内部培训资料
最近在公司进行了一次asp.net web api的分享吧,不算是培训. 可能大家有些人对Web API的推出目的还不是很了解,可以看看微软官方的定义,其实是为了提供一个好的REST Service方 ...
- [置顶] IOS培训资料
1 前言 今天给公司部门培训IOS,经过两天整理弄了个PPT和一个小的Demo,希望对大家入门有所帮助. 2 详述 培训内容,主要从开发环境讲起,到Objective-C的简单入门,IOS的简介,以及 ...
- BLDC 无刷电机FOC驱动 STM32官方培训资料
STM32 PMSM FOC SDK V3.2 培训讲座一http://v.youku.com/v_show/id_XNTM2NjgxMjU2.html?from=s1.8-1-1.2STM32 PM ...
随机推荐
- Java魔法堂:深入正则表达式API
目录 一.前言 二.正则表达式的使用诉求 三.java.util.regex包 四.java.lang.String实例 五.最短路径实现诉求 六.Java支持的正则表达式功能语法 七.总结 八.参考 ...
- IIS Express魔法堂:解除localhost域名的锁定
一.前言 单点登录是通过域名从cookie中获取登录信息,然后再根据cookie的键值对获取用户信息.但由于通过IIS Express调试应用时默认使用localhost作为域名且无法直接修改,导 ...
- 用cryptico.js实现RSA加密(应对cryptico不支持PEM)
问题: 随手分享一下好了,这个问题困扰了很久. cryptico.js这个加密算法库很全,很适合在前端用到各种加密解密算法的需求.但是美中不足的是,它的RSA加密不支持PEM格式,所以如果你后端用ja ...
- 【转】Python中的GIL、多进程和多线程
转自:http://lesliezhu.github.io/public/2015-04-20-python-multi-process-thread.html 目录 1. GIL(Global In ...
- Sql Server来龙去脉系列之三 查询过程跟踪
我们在读写数据库文件时,当文件被读.写或者出现错误时,这些过程活动都会触发一些运行时事件.从一个用户角度来看,有些时候会关注这些事件,特别是我们调试.审核.服务维护.例如,当数据库错误出现.列数据被更 ...
- 区间合并 --- Codeforces 558D : Gess Your Way Out ! II
D. Guess Your Way Out! II Problem's Link: http://codeforces.com/problemset/problem/558/D Mean: 一棵满二叉 ...
- WebApi 登录身份验证
前言:Web 用户的身份验证,及页面操作权限验证是B/S系统的基础功能,一个功能复杂的业务应用系统,通过角色授权来控制用户访问,本文通过Form认证,Mvc的Controller基类及Action的权 ...
- 2016C#模拟谷歌Google登陆Gmail&Youtube小案例
之所以写这个,是因为本来想写一个Youtube刷评论的工具,把登录做出来了,后面就没继续做下去. 涉及到基本的HttpWatch的应用以及Fiddler的应用(Fd主要用来排查问题,通过对比 浏览器和 ...
- 【BZOJ 4326】【NOIP2015】运输计划
http://www.lydsy.com/JudgeOnline/problem.php?id=4326 题目描述 公元2044年,人类进入了宇宙纪元. 国有个星球,还有条双向航道,每条航道建立在两个 ...
- 基于 ANSIBLE 自动化运维实践
摘要:运维这个话题很痛苦,你做任何的产品都离不开运维.不管你用什么语言.什么平台.什么技术,真正能够决定你产品成熟度的很有可能就是你运维的能力.取自 云巴 CEO 张虎在 ECUG 大会上的分享. 云 ...