ETL中为什么使用参数变量

  • 实现ETL的复用
  • D,Q,P环境不同,使用变量方便发布
  • 有的条件需要外部传入
  • 增量ETL
  • 灵活性强

kettle中参数变量种类

  • Environment Variables
  • Kettle Variables
  • Internal Variables
  • Transformation中的变量
  • Job中的变量

Environment Variables

通过Set Environment Variables设置

固定值无法动态使用

Kettle Variables

  • 主要设置在kettle.properties文件中设置,路径为:${KETTLE_HOME}\kettle.properties
  • 主要存放PDI的通用参数,我们在新建数据库时,不希望一直在相关组件输入用户名、密码等信息,也会运用于数据库连接,有时候也会运用与同一个系列JOB的过滤条件
  • 配置方式:直接在kettle.properties中添加通过客户端修改

Internal Variables




${Internal.Entry.Current.Directory}
这个参数表示当前的实体保存的位置,比如在Job中使用,则表示Job保存的位置,Transformation中表示Transformation的位置。

一般用在Transformation Executor 及Job Executor组件中指定需要执行的Job或者Transformation的位置,推荐使用这种方式。上线时不会因为是绝对路径造成ETL执行出错。

Transformation中的参数变量

KTR:SET_DELTA_POINT.ktr
在transformation属性配置中可以设置变量

Table input中的绑定变量以及execute for each row

需要注意从上一个step过来的数据,当没有勾选execute for each row时只能为一条,勾选后每一条这个step以及之后的都会运行一遍

  • 使用变量的顺序与从上一个step流入的字段顺序一样数据类型一样
  • SQL 中用问号代表参数
    -

Table input中SQL使用变量



通过${VARIABLE} %%VARIABLE%%两种方式使用变量在SQL处,需要勾选Replace Variables in script

凡是带有方块图标的文本框中都可以通过${VARIABLE} %%VARIABLE%% 使用变量。

Transformation中的set variable

这个通常是单独设置一个transformation然后给与JOB中的其他transformation使用
变量的生效范围有4种,具体可以自己试试,基本上选root

  • vaild in the root job在根JOB中生效
  • Valid in the parent job在父节点生效
  • Valid in the Java Virtual Machine在整个JAVA虚拟机中生效(只有几个transform时基本上测试结果一样。没深入研究)
  • Valid in the grand-parent job在父节点的父节点生效

Transformation中的get variable

  • 可以获取Set variable设置的变量但两个Step不能在同一个Transformation使用
  • Get variable 可以获取Job和Transformation在属性中设置的变量



KJB的参数变量

KJB:sj_sheet_job.kjb
在JOB属性配置中设置变量

JOB中的set variable

同transformation中的set variable差不多
增加一个功能能从其他文本中直接获取变量,不需要从上一个step中取到,在一些场景中比较方便

Transformation之间的值传递

Transformation Step中的数据可以传递给Transformation Executor,在Transformation Executor 调用的组件中可以直接当变量使用:通过${VARIABLE}或者%%VARIABLE%% 使用;通过Get variable组件使用等

kettle中变量生效优先级
在变量名字一样的情况下 set variable>kjb变量>全局变量
如内容有错欢迎大家指正!!!
读后有疑问请加QQ群,来聊一聊开源kettle+pentaho report designer那些事!作者个人qq:420773639

kettle介绍-参数变量的更多相关文章

  1. Shell 环境变量 & 参数变量

    环境变量 $HOME 当前用户的家目录 $PATH 以冒号分隔的用来搜索命令的目录列表 $PS1 命令提示符,通常是$字符,但在bash中,可以使用一些更复杂的值.例如,字符串[\u@\h \w]$就 ...

  2. Swift语言中为外部参数设置默认值可变参数常量参数变量参数输入输出参数

    Swift语言中为外部参数设置默认值可变参数常量参数变量参数输入输出参数 7.4.4  为外部参数设置默认值 开发者也可以对外部参数设置默认值.这时,调用的时候,也可以省略参数传递本文选自Swift1 ...

  3. 【shell点滴】参数变量

    参数变量故名思议就是用来操作输入参数的变量,知道用户输入了哪些参数,才可以进行相应的处理. 参数变量 作用 $1,$2- 取第几个参数的意思 $* 取出所有的参数,解析参数的分割符环境变量 IFS 来 ...

  4. ASP.NET Core中使用GraphQL - 第五章 字段, 参数, 变量

    ASP.NET Core中使用GraphQL ASP.NET Core中使用GraphQL - 第一章 Hello World ASP.NET Core中使用GraphQL - 第二章 中间件 ASP ...

  5. 常见问题一之拼接表格 js传递参数变量 Json接收值

    1.前台拼接表格时,有时候需要使用拼接html字符串,需要多次循环拼接的,放在方法里边: //ary可以是数组中的一组数据.function(ary){var MyHtml="<tr& ...

  6. mysql不重启修改参数变量

    分享下mysql不重启的情况下修改参数变量的方法. 通常来说,更新mysql配置my.cnf需要重启mysql才能生效,但是有些时候mysql在线上,不一定允许你重启,这时候应该怎么办呢? 例子: m ...

  7. linux bash shell编程之参数变量和流程控制。

    参数变量:用来向脚本中传递参数 我们在执行脚本的时候可以在其后面加入一些参数,通常来说这些参数与脚本中变量为对应关系. start.sh argu1 argu2 引用方式: $1,,2,……${10} ...

  8. 笨办法学python3练习代码13-14:argv参数变量的学习

    ex13.py  argv参数的学习 #argv:参数变量(argument variable),这是一个标准的编程术语,在其他语言中也可可以看到.argument可译为: 参数 #如果参数是用户在执 ...

  9. kettle中参数和变量的区别

    图一: 图二: 何时使用'?'何事使用${}应当根据情况: 在图二中使用的是${}因为此时没有"作为参数的字段",所以只能用el表达式直接获取其值,在图一中有"作为参数的 ...

  10. kettle介绍

    Kettle也叫PDI,在2006年Kettle加入了开源的BI组织Pentaho,正式命名为PDI,英文全称为Pentaho Data Integeration.Kettle是"Kettl ...

随机推荐

  1. py并发编程

    并发编程(并发,并行,同步,异步) 通俗理解并发编程中的相关核心概念 核心概念:进程.线程 CPU的作用 计算机的核心是CPU,它承担了所有的计算任务.它就像一座工厂,时刻在运行. CPU的核数(多核 ...

  2. 金泰克S300固态硬盘 SM2256K开卡量产

    开卡原因:固态硬盘出现开机正常,用一会就找不到硬盘了,电脑冷启动后又可以识别硬盘,决定根据网上教程进行开卡量产修复试试. 硬盘型号:tigo S300 120GB,主控芯片SM2256K AB,闪存颗 ...

  3. Kali Linux 安装教程

    Kali Linux 安装教程 下载镜像文件 Kali官网下载 访问Kali官网(https://www.kali.org/ ),根据下图所示进行下载 清华大学开源软件镜像站下载 访问清华大学开源软件 ...

  4. shell脚本sed命令

    Sed 是一个脚本型的编译器,全称StreamEDitor,即流编辑器是非交互式的编辑器 sed 原理简析sed 以行为处理单位,每次从标准输入/文本获取一行信息,存储到其" 模式空间 &q ...

  5. Mac安装Scala2.12

    一.下载Scala brew install scala@2.12 二.设置环境变量 vim ~/.bash_profile export SCALA_HOME=/usr/local/opt/scal ...

  6. RabbitMQ(四)——工作队列模式

    RabbitMQ系列 RabbitMQ(一)--简介 RabbitMQ(二)--模式类型 RabbitMQ(三)--简单模式 RabbitMQ(四)--工作队列模式 RabbitMQ(五)--发布订阅 ...

  7. WPF中实现PropertyGrid的三种方式

    原文地址: https://www.cnblogs.com/zhuqil/archive/2010/09/02/Wpf-PropertyGrid-Demo.html 第一种方式:使用WindowsFo ...

  8. DeepSeek本地性能调优

    技术背景 大模型性能调优是一个很复杂的工程,涉及到很多细节,如果真要对模型动刀子,还需要对模型和数据集本身有非常好的理解.这里我们仅仅考虑模型加载过程中,可以优化的一些参数配置.关于DeepSeek在 ...

  9. QT5笔记: 32. QPainter 基本绘制

  10. mybatis - [12] 日志工厂

    题记部分 001 || 日志工厂 如果一个数据库操作出现了异常,需要通过日志定位问题. 002 || Log4j Log4j是Apache的一个开源项目,通过使用Log4j,可以控制日志信息输送的目的 ...