这是一篇几年前写下的文档,最近打算根据这篇文档重写一下kettle插件的教程。结果各种理由,一推再推。今天索性将这篇文档发布出来,分享给大家,例子等有空再补上。这是一篇基于kettle3.2基础上完成的kettle插件文档。然而现在最新版的kettle的界面已经完全变了样了,但是那些组件还是那么熟悉。对数据处理稍微熟悉点的应该对kettle都不陌生,kettle是一个快速格式化和数据抽取的工具。好吧,入正题:

  如果你对kettle插件感兴趣可以到官网查看更多的资料:http://www.pentaho.com/product/data-integration。

  最新源码:https://github.com/pentaho/pentaho-kettle/

  kettle3.2源码:http://sourceforge.net/projects/pentaho/files/Data%20Integration/3.2.0-stable/

  一、开发环境:

    工具:Eclipse、MyEclipse

    JDK1.5或以上

    依赖包:lib/kettle-core.jar

        lib/kettle-db.jar

        lib/kettle-engine.jar

        lib/kettle-ui-swt.jar

        libswt/win32/swt.jar

  二、转换开发步骤:

    1、复制org.pentaho.di.trans.steps.dummytrans包到指定包名。dummytrans包包含4个文件。DummyTrans.java, DummyTransData.java, DummyTransMeta.java, Messages.java。

    2、使用eclipse里的Refactor(重构)功能,把 DummyTrans* .java改名成 Mytrans *.java。然后实现相应的方法即可。

      (1)MytransDialog.java:产生对话框的对象。

      (2)Mytrans.java:负责数据处理和转换,主要的转换逻辑都在这里实现。

      (3)MytransMeta.java:负责元数据处理。包括加载xml转换文件,校验。

      (4)MytransData.java:包含数据处理所涉及到的具体数据。

    3、在org.pentaho.di.trans.steps.mytrans包下面创建messages目录,在里面添加相关的资源文件。例如,messages_en_US.properties,messages_zh_CN.properties等等。

    4、将程序打成jar包。

    5、准备一个png格式的图片。

    6、编写插件xml(plugin.xml)

<?xml version="1.0" encoding="UTF-8"?>
<plugin
id="MyTransExample" -->组件ID(必须唯一)
iconfile="icon.png" -->显示的图片
description="My Trans Example" -->转换描述
tooltip="This is a trans example!" -->提示信息
category="Input" --->插件展现位置
classname="com.test.mytrans.MyTransMeta"> --->入口类
<libraries>
<library name="kettle-plugin.jar"/> --->插件jar包
</libraries>
<localized_category> --->插件展现位置
<category locale="en_US">Input</category>
<category locale="zh_CN">输入</category>
</localized_category>
<localized_description> --->插件描述
<description locale="en_US">This is a trans plugin example!</description>
<description locale="zh_CN">这是一个插件转换的例子</description>
</localized_description>
<localized_tooltip> --->提示信息
<tooltip locale="en_US">This is a trans plugin example!</tooltip>
<tooltip locale="zh_CN">插件转换例子</tooltip>
</localized_tooltip>
</plugin>

  将编译好的jar包、png图片和xml文件置于kettle安装目录下的./plugins/steps/myForder(自定义一个文件夹)下,重启kettle即可。

  三、作业开发步骤:

    1、分别复制org.pentaho.di.job.entries.abort、org.pentaho.di.job.entries.abort.messages和org.pentaho.di.ui.job.entries.abort包到指定包名

    2、使用eclipse里的Refactor(重构)功能,把JobEntry* .java改名成 MyJobEntry *.java。然后实现相应的方法即可。

    3、修改国际化配置文件,。例如,messages_en_US.properties,messages_zh_CN.properties等等。

    4、将程序达成相应jar包。

    5、准备一个png格式的图片。

    6、编写插件xml(plugin.xml)

      与转换plugin.xml类似。可参考kettle安装目录。./plugins/jobentries/DummyJob目录下的plugin.xml文件

    7、将编译好的jar包、png图片和xml文件置于kettle安装目录下的./plugins/jobentries/myForder(自定义一个文件夹)下,重启kettle即可。

  四、插件开发调试

    1、Link Source调试:

(1)在Kettle3.2工程下面,进入plugins->steps目录,发现里面有个DummyPlugin目录,其就是kettle官方提供的外部转换插件,DPL.png、dummy.jar、plugin.xml,就是一个完整插件所需要的东西。

(2)在与DummyPlugin同级目录里面,建立文件夹TemplateStep, 将TemplateStepPlugin工程下面的icon.png、plugin.xml文件拷贝至此,jar包就不用了

(3)最重要的一步来了,大家右击工程Kettle 3.2,选择属性Properties, 然后在左手边选择Java Build Path, 然后在上面的选项卡里面选择Source,此时右边就有几个按钮,

点击Link Source按钮,设置好你的插件源码目录以及目录名字,见下图:

运行。 关联好之后,咱们找到kettle的入口运行类Spoon.java,大家可以通过快捷键ctrl+shift+R找出此类选择调试运行即可,进入kettle工作台,打开测试文件test.ktr.

    2、kettle远程调试

(1)远程调试的关键是首先你的在kettle启动配置里面设置远程调试参数,然后在eclipse里面设置远程调试监控的端口号,这样就ok了。

(2)进入pdi-ce-3.2.0-stable.zip解压出来的目录,编辑启动配置文件Spoon.bat,linux下当然是spoon.sh

在文件里面加入这么一句话:

set OPT=-Xdebug -Xnoagent -Djava.compiler=NONE -Xrunjdwp:transport=dt_socket,server=y,suspend=n,address=

位置参见下图:


点击Spoon.bat,进入kettle工作台

(3)打开eclipse,进入菜单Run——>Debug Configurations,选择左边的Remote Java Application,右键新建一个远程调试应用程序,设置如下图,

端口就是上面参数里面的端口8285,一切ok,选择选择下面的debug按钮。

(4)在kettle工作台,运行刚才的测试转换文件 test.ktr,eclipse开始监听调试了,大家断点设置就可。

注:部分内容来自互联网,由于时间久远没有记录原文出处。如果您知道可以联系我加上。谢谢!

kettle转换和作业插件开发及调试的更多相关文章

  1. Kettle转换或作业乱码

    结果这样做还是乱码,其实这和

  2. kettle删除资源库中的转换或者作业

    在资源库中新建转换,作业都很简单,那么加入现在不需要其中某个转换或者作业该怎么办呢? 下图是已经存在的转换跟作业 现在需要删除aa这个转换 操作步骤如下: 1.工具----资源库----探索资源库 出 ...

  3. kettle转换提高性能拆分转换步骤_20161201

    今天是12月1号,前期用kettle做了月报自动报表的转换和作业,今天运行时候发现一个报表的程序跑起来失败,心里很纳闷,上过月刚跑的没问题,怎么会无缘无故的失败. 通过看kettle运行日志,发现一个 ...

  4. kettle转换添加hbase-output无法获取hbase表

    问题:kettle转换添加hbase-output无法获取hbase表 win本机安装kettle,本机虚拟机三台,root用户安装有jdk.zookeeper.hadoop.hbase kettle ...

  5. java中调用kettle转换文件

    java中调用kettle转换文件 通过命令行也能够调用,然后java中调用命令行代码也能够.这样没有和java代码逻辑无缝集成.本文说明kettle5.1中假设通过其它API和java代码无缝集成: ...

  6. kettle转换之多线程

    kettle转换之多线程   ETL项目中性能方面的考虑一般是最重要的.特别是所讨论的任务频繁运行,或一些列的任务必须在固定的时间内运行.本文重点介绍利用kettle转换的多线程特性.以优化其性能. ...

  7. kettle在linux下面用于shell脚本执行:转换或者作业

    1 将windows下面创建好的转换,放到Linux某一个文件夹下面.如:把0816_em.ktr文件放到/home/cfj/kettle/testdemo下面. 注意里面的数据库用户名和密码可能需要 ...

  8. kettle菜鸟学习笔记2----第一个kettle转换的建立及执行

    相关概念: Kettle数据清洗是采用元数据(Meta-data)驱动,以数据流的方式进行的,数据从数据源(数据库/文件等)在一系列相连的step之间依次向后流动,各个step完成对流经该step的数 ...

  9. Kettle 4.2源码分析第三讲--Kettle 转换机制transformation介绍

    转换机制 每个转换步骤都是ETL数据流里面的一个任务.转换步骤包括输入.处理和输出.输入步骤从外部数据源获取数据,例如文件或者数据库:处理步骤处理数据流,字段计算,流处理等,例如整合或者过滤.输出步骤 ...

随机推荐

  1. async & await 的前世今生

    async 和 await 出现在C# 5.0之后,给并行编程带来了不少的方便,特别是当在MVC中的Action也变成async之后,有点开始什么都是async的味道了.但是这也给我们编程埋下了一些隐 ...

  2. 格式化 float 类型,保留小数点后1位

    """  练习 :   小明的成绩从去年的72分提升到了今年的85分,请计算小明成绩提升的百分点,   并用字符串格式化显示出'xx.x%',只保留小数点后1位: &qu ...

  3. MyBatis 延迟加载,一级缓存,二级缓存设置

    什么是延迟加载 resultMap中的association和collection标签具有延迟加载的功能. 延迟加载的意思是说,在关联查询时,利用延迟加载,先加载主信息.使用关联信息时再去加载关联信息 ...

  4. iOS推送证书转pem文件

    iOS推送证书转 .pem文件. 推送证书转pem文件openssl x509 -in apns_miaobozhibo.cer -inform der -out apns_miaobozhibo.p ...

  5. 测试或运维工作过程中最常用的几个linux命令?

     大家在测试工作过程中,可能会遇到需要你去服务器修改一些配置文件,譬如说某个字段的值是1 则关联老版本,是0则关联新版本,这时候你可能就需要会下vi的命令操作:或者查看session设置的时长,可能需 ...

  6. destoon : 后台无法登录问题解决

    经常有朋友在destoon搬家的时候 , 数据还原之后 , 会出现后台无法登录的情况 . 具体表现为后台帐号密码输入后点击确定 , 页面刷新 .并没有跳转到相应后台页面 . 但是如果帐号密码输入错误 ...

  7. MVC5知识点记录

    IIS/ASP.NET管道 原理永远是重中之重,所以在开篇的地方,先了解一下地址栏输入网址回车之后的故事. 不同IIS版本处理请求也不一样 IIS5 IIS 5.x 运行在进程InetInfo.exe ...

  8. C# 数据批量插入到数据库SqlBulkCopy(源数据类型:List<T> Or DataTable)

      /*_____________________ List<T>类型数据 To Sql_______________________________*/ /// <summary& ...

  9. CentOS / Redhat : Configure CentOS as a Software Router with two interfaces

    CentOS / Redhat : Configure CentOS as a Software Router with two interfaces   Linux can be easily co ...

  10. Linux学习笔记<六>

    进程与程序 1.子程序与父程序 PID是进程的ID,PPID是其父进程的ID 登录bash之后,就是获取了一个名为bash的PID,在这个环境上所执行的其他命令,就是其子程序 common@commo ...