kettle中调用java类

有时须要在kettle调用java类,如:验证、查询或自己定义加密等。有时甚至连主要的数据訪问都不那么简单,如获取一个存储文件或使用一个数据库连接,某些数据源可能封装在应用程序中,手工使用自己定义的javaclient訪问是唯一的方法。

本文介绍怎样在kettle中调用java类。演示样例代码在这里下载

注:假设你使用kettle4.0及以上版本号。也你也能够使用user defined java class 步骤实现。

 

Modified Java ScriptValue 步骤

关键要在kettle中使用ModifiedJava Script Value 步骤。从名称上看是只运行javascript来实现该步骤,事实上也能够运行java代码。为了理解。我们须要知道该步骤使用Rhino javaScript 引擎来实现。使其能够在jvm中实现javascript,也使其成为可能,让脚本去訪问java类。为了说明其怎样实现。让我们来看一个简单的转换演示样例,使用java去计算某个字段的md5码。例如以下图所看到的:

javascript步骤实现md5计算,包括例如以下代码:

// simulate java imports

varMessageDigest =java.security.MessageDigest;

varString =java.lang.String;

varStringBuffer =java.lang.StringBuffer;

varInteger =java.lang.Integer;

// get the md5 digest algorithm

varalgorithm =MessageDigest.getInstance("MD5");

// get the input as bytes

varbytes = newString(test_value).getBytes("UTF-8");

// calculate the digest

algorithm.reset();

algorithm.update(bytes);

varmd5Digest =algorithm.digest();

// turn the digest into a hex-stringrepresentation

varhexString = newStringBuffer();

for(vari =0; i < md5Digest.length; i++){

varhex= Integer.toHexString(0xFF & md5Digest[i]);

if(hex.length()== 1){

hexString.append('0');

}

hexString.append(hex);

}

// write output value

varmd5_hash =hexString.toString().toUpperCase();

让我们详解以上代码。

第一部分是就如java 导入包环节,其实和java中import实现相同目的。声明变量指向java类。是为了避免我们后面引用每一个java类使用完整java长类名带来不便。当使用自定义的类是,要注意不小心覆盖了javascript类。javascript也有其自己的Date类实例,稍不在意,使用这样的方式非常easy覆盖。

接着是调用简单的java API生成md5值,须要指出的是,输入字段作为javascript对象。“test_value”字段是javascript String对象。有多种方法将其转换成java String对象,这里使用简单的构造函数实现。java String的getBytes()方法返回字节数组。

md5摘要值计算好后。接着通过一小段循环代码生成表现该值的字符串,最后作为一个新字段写到输出行。

使用外部jar包中的类

运行太多的脚步可能影响性能,所以总是把复杂的业务让编译好的java代码来做。一般是一些整洁的实现我们业务的java类库,有时我们可能自己去创建。kettle现有的功能当然不能满足我们的全部需求,调用几个外部类库能够避免写一个完整kettle插件。kettle启动时载入libext文件夹及子文件夹下全部jar文件。假设你须要訪问自己定义jar包的类,须要放在libext文件里。我们演示样例是关于MD5,从kettle3.2已经有了对应的jar包(apache commons codec项目)。

codec项目有非常好的方法计算输入字符串的MD5十六进制字符串,正好是我们须要的;我们只使用DigestUtil类的方法就可以。

//get a nice md5 hash

varmd5_hash = org.apache.commons.codec.digest.DigestUtils.md5Hex(test_value);

在我笔记本上执行新转换大概10500行/秒,第一版本号的只大概2900行/秒.

两者的处理速度区别非常大,所以用封装好的功能似乎真的飞快。当然有可能apache项目採用全然不同的MD5算法实现。

不管如何,后者的实现既简单又快。

结论

Modified Java Script Value 步骤同意訪问不论什么jvm中java类。假设你ETL项目有特定的需求,你已经使用java实现过的需求。这时你能够考虑使用这样的方法试试。

当使用脚步代码总是须要监视性能问题。假设你使用了大量的外部库。就须要有正确的版本号依赖管理,否则在測试环境或部署环境中会产生问题。

kettle中调用java类的更多相关文章

  1. Oracle数据库中调用Java类开发存储过程、函数的方法

    Oracle数据库中调用Java类开发存储过程.函数的方法 时间:2014年12月24日  浏览:5538次 oracle数据库的开发非常灵活,不仅支持最基本的SQL,而且还提供了独有的PL/SQL, ...

  2. python_代码中调用java类

    1. 安装jpype (python调用java class文件用) 1.1. 自动安装:pip install jpype1 1.2. 手动方式安装jpype1 安装wheel:pip instal ...

  3. thymeleaf模板引擎调用java类中的方法(附源码)

    前言 <Docker+SpringBoot+Mybatis+thymeleaf的Java博客系统开源啦> 由于开源了项目的缘故,很多使用了My Blog项目的朋友遇到问题也都会联系我去解决 ...

  4. Jsp中如何通过Jsp调用Java类中的方法

    Jsp中如何通过Jsp调用Java类中的方法 1.新建一个项目,在src文件夹下添加一个包:如:cn.tianaoweb.com; 2.再在包中添加一个类:如 package com; public ...

  5. Thymeleaf常用语法:模板文件中表达式调用Java类的静态方法

    在模板文件的表达式中,可以使用“${T(全限定类名).方法名(参数)}”这种格式来调用Java类的静态方法. 开发环境:IntelliJ IDEA 2019.2.2Spring Boot版本:2.1. ...

  6. oracle调用JAVA类的方法

    导入jar包 在oracle中导入需要的jar包,我们把编辑好的java类打成jar包,直接在oarcle里面写简单的调用就可以了,  1.操作系统需要拥有支持loadjava命令的jdk.  2.加 ...

  7. kettle系列-[KettleUtil]kettle插件,类似kettle的自定义java类控件

    该kettle插件功能类似kettle现有的定义java类插件,自定java类插件主要是支持在kettle中直接编写java代码实现自定特殊功能,而本控件主要是将自定义代码转移到jar包,就是说自定义 ...

  8. Java Native Interfce三在JNI中使用Java类的普通方法与变量

    本文是<The Java Native Interface Programmer's Guide and Specification>读书笔记 前面我们学习了如何在JNI中通过参数来使用J ...

  9. C#调用java类、jar包方法(转)

    一.将已经编译后的java中Class文件进行打包:打包命令JAR 如:将某目录下的所有class文件夹全部进行打包处理: 使用的命令:jar cvf test.jar -C com/ . 其中tes ...

随机推荐

  1. python语言

    python语言 因为我比较熟悉python语言,所以月刊中python语言的项目居多,个人能力有限,其他语言涉及甚少,欢迎各路人士加入,丰富月刊的内容. 当然,如果您有更好的建议或者意见,欢迎发邮件 ...

  2. Oracle EBS-SQL (WIP-1):检查非标任务没挂需求.sql

    SELECT WE.WIP_ENTITY_NAME, MSI.SEGMENT1, MSI.DESCRIPTION, WDJ.CLASS_CODE, WDJ.START_QUANTITY, WDJ.SC ...

  3. 快速开启Safari的私密浏览(快捷键创建)

    正常使用Safari浏览器,都会保存你的浏览记录.搜索记录,包括你的浏览习惯,经常去哪些网站等等.这样的好处是可以帮助你更快速的进入自己需要的网站,节约很多时间. 但有些情况下,你还是会偏向于选择私密 ...

  4. Developer‘s提升开发效率的工具和插件或编程语言

    1.Git 之前也有过不少版本控制的工具.有好的,也有糟糕的.不过它们都或多或少地误入歧途了. 这时候Git出现了.一旦你用上了这个神奇的工具,很难相像你还会碰到比它更好的了. 还没用过Git?试一下 ...

  5. java操作mysql的增删改查

    prepareStatement(sql)是statement的子类,比statement好用. 如果数据库中定义的是int值,那么sql语句中要把int单独提出来.如".....value ...

  6. [Linux] 修改主机名(hostname)

    在Linux命令行下输入hostname,查看当前主机名,如果想修改它,直接在hostname后面加上新主机名即可(注:以下操作都需要root用户执行),如: # hostname newhostna ...

  7. javascript第三课underfind和类型获取

    1.underfind一般发生于变量定义之后未赋值,因此变量的值就为underfind 2.var obj=new object(); 此时使用obj点,可以获取到obj对象的一些方法,使用alert ...

  8. POJ2229 Sumsets 【递归】

    Sumsets Time Limit: 2000MS   Memory Limit: 200000K Total Submissions: 13210   Accepted: 5300 Descrip ...

  9. Database Initialization Parameters for Oracle E-Business Suite Release 12 (文档 ID 396009.1)

    In This Document Section 1: Common Database Initialization Parameters For All Releases Section 2: Re ...

  10. static和extern关键字 对函数的作用

    本文目录 • 一.extern与函数 • 二.static与函数 • 三.static.extern与函数的总结说明:这个C语言专题,是学习iOS开发的前奏.也为了让有面向对象语言开发经验的程序员,能 ...