kettle工具是一款优秀的数据同步、数据处理的BI工具,收到了很多人的青睐。kettle软件通过可视化的图标可以让我们很轻易的能完成数据同步、处理的开发工作。但是使用kettle可视化界面在跑JOB久之后,会报JAVA SWT的错误,故为了程序的稳定性,我们需要对其进行二次开发。

1.kettle可视化界面设计

由于业务不同,使用kettle工具做出的设计也不同,故在此只写一下如何设置连接参数为全局变量参数。

a)设置全局变量,如下图操作

编辑>设置环境变量

b)在弹出的环境变量框中,输入变量名称及变量值

c)创建一个新的连接,将连接参数设置为变量即可,如下图

注:若transform报“Streaming result set com.mysql.jdbc.RowDataDynamic@a42491 is still active.”错误,则将数据库连接里面的前面的对勾去了即可

2.kettle二次开发

由于kettle可视化界面不稳定,所以我们决定使用代码来启动JOB。

a)将使用kettle工具时生成的.kettle文件放在工程的WEB-INF下面,如下图

b)修改repositories.xml下面我们的kettle的xml文件存放的地址

c)在servlet中将当前工程执行路径传入同步类中,使其可以用该路径初始化kettle环境,代码如下:

	/**
* 设置Kettle的初始化配置信息路径
* @throws KettleException
*/
private void initKettleEnvironment() {
// 获得执行类的当前路径
String kettleHome = this.getServletContext().getRealPath(File.separator + "WEB-INF");
System.out.println("kettleHome--->"+kettleHome);
this.mKettelHome = kettleHome;
}
private void startKettleTask()throws Exception{
Timer kettleTask= new Timer();
kettleTask.schedule(new KettleTask(this.mKettelHome), 0, "2000");
}

d)kettleTask类中开启kettleJOB,代码如下:

public class KettleTask extends TimerTask {
private String mKettleHome; public KettleTask() {
super();
} public KettleTask(String kettleHome) throws KettleException {
super();
this.mKettleHome = kettleHome; } @Override
public synchronized void run() {
Repository repository = null;
Job job = null;
try { // Kettle初始化需要修改相应的配置路径
String user_dir = System.getProperty("user.dir");
System.setProperty("user.dir", mKettleHome);
System.setProperty("KETTLE_HOME", mKettleHome); //设置连接环境变量
System.setProperty("DATABASE_IP_ADDRESS", "127.0.0.1");
System.setProperty("DATABASE_DATABASE", "mysql");
System.setProperty("DATABASE_IP_PORT","3306");
System.setProperty("DATABASE_USERNAME", "root");
System.setProperty("DATABASE_PASSWORD", "root"); // 运行环境初始化(设置主目录、注册必须的插件等)
KettleEnvironment.init(); // Kettle初始化完毕,还原执行类的当前路径
System.setProperty("user.dir", user_dir); RepositoriesMeta repositoriesMeta = new RepositoriesMeta();
// 从文件读取登陆过的资源库信息
repositoriesMeta.readData();
// 选择登陆过的资源库
RepositoryMeta repositoryMeta = repositoriesMeta
.findRepository("kettleDemo");
// 获得资源库实例
repository = PluginRegistry.getInstance().loadClass(
RepositoryPluginType.class, repositoryMeta.getId(),
Repository.class);
repository.init(repositoryMeta);
// 连接资源库
repository.connect("demo", "demo");
System.out.println("Repository SyncData connect success.");
JobMeta jobMeta = null; jobMeta = new JobMeta(
WsUtility
.getPropertyString("RootDirectory",
"file:////D://kettleDemo//")
+ "kettleDataJob.kjb",
repository); // 执行指定转换
if (jobMeta != null) {
job = new Job(repository, jobMeta);
job.start();
job.waitUntilFinished();
if (job.getErrors() > 0) {
System.out.println("decompress fail!");
}
}
repository.disconnect();
} catch (Exception e) {
// TODO: handle exception
e.printStackTrace();
}
}
}

至此我们就完成了代码启动kettle的JOB了。

kettle工具二次开发-代码启动JOB的更多相关文章

  1. Kettle api 二次开发之 日志的保存

    使用kettle做数据抽取的时候可以使用图形化的工具配置日志保存参数,选择数据库连接,输入日志表名称, 点击sql 执行对应的sql创建日志表即可. 点击保存之后,日志配置会保存在trans或者job ...

  2. prometheus的agent 二次开发代码参考

    import com.codahale.metrics.MetricRegistry;import io.prometheus.client.CollectorRegistry;import io.p ...

  3. Jmeter二次开发代码(3)

    package org.apache.jmeter.functions; import java.io.FileInputStream;import java.io.FileNotFoundExcep ...

  4. Jmeter二次开发代码(2)

    /* * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreem ...

  5. Jmeter二次开发代码(1)

    package org.apache.jmeter.functions; import java.util.Collection;import java.util.LinkedList;import ...

  6. SolidWorks二次开发的研究

    三维机械设计软件SolidWorks是一套基于Windows的CAD/CAE/CAM/PDM桌面集成系统,是由美国SolidWorks公司在总结和继承大型机械CAD软件的基础上,在Windows环境下 ...

  7. Revit二次开发环境配置(Revit 2020 +Visual Studio 2019)

    Revit二次开发环境搭建(Revit 2019+Visual Studio 2017)准备内容 Revit 2019开发环境的搭建,需要安装的内容如下: Revit 2019(主要的开发环境) Vi ...

  8. 基于spring-boot的社区社交微信小程序,适合做脚手架、二次开发

    基于spring-boot的社区社交微信小程序,适合做脚手架.二次开发 代码地址如下:http://www.demodashi.com/demo/13867.html 1 概述 笔者做的一个后端基于s ...

  9. Linux内核启动代码分析二之开发板相关驱动程序加载分析

    Linux内核启动代码分析二之开发板相关驱动程序加载分析 1 从linux开始启动的函数start_kernel开始分析,该函数位于linux-2.6.22/init/main.c  start_ke ...

随机推荐

  1. qt model/view 架构基础介绍之QListWidget

    # -*- coding: utf-8 -*- # python:2.x __author__ = 'Administrator' from PyQt4.QtGui import  * from Py ...

  2. Android设备内存和SD卡操作工具类

    package cc.c; import java.io.File; import java.util.List; import android.os.StatFs; import java.io.F ...

  3. 初次使用SVN心得

    进入实验室, 一个项目往往需要多天多人次共同维护,所以版本控制也显得尤为关键.下面是我第一次使用SVN工具的心得体会. 首先是安装,服务器搭配方面应该是之前完成的,这里就不多讲了. 下载地址:http ...

  4. Android窗口管理服务WindowManagerService计算窗口Z轴位置的过程分析

    文章转载至CSDN社区罗升阳的安卓之旅,原文地址:http://blog.csdn.net/luoshengyang/article/details/8570428 通过前面几篇文章的学习,我们知道了 ...

  5. 2016-XCTF Final-Richman

    抽时间将XCTF Final中Richman这个题总结了下.题目及ida idb所在的链接在:http://files.cnblogs.com/files/wangaohui/richman-blog ...

  6. SQLServer 跨服务器查询的两个办法

    网上搜了跨服务器查询的办法,大概就是Linked Server(预存连接方式并保证连接能力)和OpenDataSource(写在语句中,可移植性强).根据使用函数的不同,性能差别显而易见...虽然很简 ...

  7. Javascript - IE8下parseInt()方法的取值异常

      公司的测试小妹妹跑来对我说,下拉框第9项始终无法正确提交的时候,我还以为见鬼了.   parseInt()会把'0'开头的数字以8进制来解析,当有大于7的数字时候就按10进制来解析.   // p ...

  8. C#中string.Empty和""、null的区别

    string.Empty是string类的一个静态常量,而""则表示一个空字符串. string是一种特殊的引用类型,它的null值则表示没有分配内存. 使用ILSpy反编译Str ...

  9. IIS7如何显示详细错误信息

    使用Vista或Win7操作系统的用户在不断增加,用Win7旗舰版开发测试程序程序人员也与日俱增,Win7下测试程序时,如果程序出 错,IIS7会提示HTTP Error 500 - Internal ...

  10. Centos6架设GIT服务,windows客户端使用TortoiseGit加载KEYGEN连接GIT服务器

    前几天得空,想起前一阵学了GIT还没好好实践,就在虚拟机中安装测试了一下,并简单记录了CENTOS6中GIT安装,ssh-keygen生成,客户端使用TortoiseGit加载KEYGEN连接GIT服 ...