1、kettle介绍

kettle是一个ETL(Extract,
Transform and Load抽取、转换、加载)工具,ETL工具在数据仓库项目使用很频繁,kettle也能够应用在下面一些场景:

    • 在不同应用或数据库之间整合数据

    • 把数据库中的数据导出到文本文件

    • 大批量数据装加载数据库

    • 数据清洗

    • 集成应用相关项目是个使用

kettle使用很easy,通过图形界面设计实现做什么业务,无需写代码去实现。因此,kettle是以面向元数据来设计。

kettle支持非常多种输入和输出格式。包含文本文件。数据表。以及商业和免费的数据库引擎。另外,kettle强大的转换功能让您非常方便操纵数据。

以下展示一个简单的“Hello World”演示样例,本教程将告诉你怎样轻松用kettle工作。让你有基础可以学习更复杂的转换功能。

  • 安装kettle

  • kettle设计工具spoon介绍

  • hello world演示样例

  • 又一次设计helloworld演示样例

2、入门演示样例学习

2.1、安装kettle

首先通过官网下载kettle;

需求环境:

kettle须要jre1.5及以上版本号。能够通过oracle官网免费下载;

kettle安装

kettle无需安装。直接解压zip文件到指定的目录。在类unix操作系统上。须要运行下面脚本:

cd Kettle

chmod +x *.sh

执行

kettle中的一个图形用户界面叫spoon,spoon能够设计转换和作业,也能够执行转换和作业,以下的内容将继续介绍他们。

2.2、kettle设计工具spoon介绍

Spoon是一个图形设计工具,用来设计和測试数据交换处理流程,也能够通过命令行(终端)运行处理流程。

资源库和文件

在spoon中设计作业和转换。kettle提供两种方式存储:资源库和文件;

假设你选择资源库,spoon第一次启动时须要创建资源库。选择文件方法,作业保存文件是的扩展名是KJB。转换文件的扩展名为KTR,为了简化学习,以下教程採用后者。

启动spoon

在windows中运行spoon.bat,在类unix系统中运行spoon.sh;启动时首先出现一个对话框窗体提示选择资源库及输入连接信息,点击取消button。

然后能够看到欢迎窗体,点击“工具”菜单下的“选项”。弹出窗体中能够进行一些全局设置,如语言、日志等信息,设置后需重新启动才干生效。

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvbmV3ZWFzdHN1bg==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast">

以下内容參见《kettle
Hello World教程》

2.3、hello
world 演示样例

2.4、又一次设计hello
world 演示样例





kettle新手教程的更多相关文章

  1. Web项目的发布新手教程

    ASP.NET服务器发布新手教程 ——本文仅赠予第一次做Web项目,需要发布的新手们,转载的请注明出处. 首先我们说一下我们的需要的一个环境.我使用的是Visual Studio 2010,版本.NE ...

  2. APP设计尺寸规范大全,APP界面设计新手教程【官方版】(转)

    正值25学堂一周年之际,同时站长和APP设计同仁们在群里(APP界面设计 UI设计交流群,APP界面设计⑥群 APPUI设计③群58946771 APP设计资源⑤群 386032923欢迎大家加入交流 ...

  3. ROS探索总结(三)——ROS新手教程【转】

    转自:http://blog.csdn.net/hcx25909/article/details/8811313 版权声明:本文为博主原创文章,未经博主允许不得转载.   目录(?)[-] 一ROS的 ...

  4. 新手教程之使用Xib自定义UITableViewCell

    新手教程之使用Xib自定义UITableViewCell 前言 首先:什么是UITableView?看图 其次:什么是cell? 然后:为什么要自定cell,UITableView不是自带的有cell ...

  5. MATLAB新手教程

    MATLAB新手教程   .MATLAB的基本知识 1-1.基本运算与函数    在MATLAB下进行基本数学运算,仅仅需将运算式直接打入提示号(>>)之後,并按入Enter键就可以.比如 ...

  6. 【OpenCV十六新手教程】OpenCV角检测Harris角点检测

    本系列文章由@浅墨_毛星云 出品.转载请注明出处. 文章链接:http://blog.csdn.net/poem_qianmo/article/details/29356187 作者:毛星云(浅墨) ...

  7. hibernate官方新手教程 (转载)

    hibernate官方新手教程第一部分 - 第一个Hibernate程序 首先我们将创建一个简单的控制台(console-based)Hibernate程序.我们使用内置数据库(in-memory d ...

  8. Groovy新手教程

    Groovy新手教程 kmyhy@126.com  2009-5-13 一.groovy是什么 简单地说,Groovy 是下一代的java语言,跟java一样,它也执行在 JVM 中. 作为跑在JVM ...

  9. 苹果Swift编程语言新手教程【中国版】

    Swift代码语言教程:在刚刚过去的WWDC2014大会上,苹果公司新公布了一种编程语言Swift.据悉.Swift语言继承了C语言以及Objective-C的特性,且克服了C语言的兼容性问题.对于广 ...

随机推荐

  1. Django【进阶】缓存

    Django缓存 由于Django是动态网站,所有每次请求均会去数据进行相应的操作,当程序访问量大时,耗时必然会更加明显,最简单解决方式是使用:缓存,缓存将一个某个views的返回值保存至内存或者me ...

  2. python 学习笔记 多进程

    要让python程序实现多进程,我们先了解操作系统的相关知识 Unix/Linux操作系统提供了一个fork()系统调用,他非常特殊,普通的函数调用,调用一次,返回一次,但是fork调用一次, 返回两 ...

  3. EF选择Mysql数据源

    EF添加ADO.NET实体模型处直接选择Mysql数据源 最近想到EF是连接多数据库的orm框架,于是就想测试下.查了一堆网上资料后,测试连接mysql成功.步骤如下: 1.在你项目Model层中nu ...

  4. BZOJ1003: [ZJOI2006] 物流运输 trans

    物流运输--看了神犇的题解,就是dp+最短路,设f[i]为1~i天的最少花费,那么 dp[i]=min(cost[1,i],min{dp[j]+cost[j+1,i]+K,1≤j<i}) 就是从 ...

  5. DRF视图集的路由设置

    在使用DRF视图集时,往往需要配一大堆路由,例如: # views.py class DepartmentViewSet(ListModelMixin,CreateModelMixin,Retriev ...

  6. JavaScript的for循环语句

    语法格式 for(初始化值;循环的条件;每一次循环的递增值){ // 循环的条件结果为true,则执行循环体中的代码 } 示例(打印出1-10之间的整数): for(var a=1;a<=10; ...

  7. vim操作大全

    # 转自 https://blog.csdn.net/weixin_37657720/article/details/80645991 曾经使用了两年多的Vim,手册也翻过一遍.虽然现在不怎么用vim ...

  8. MySQL 的七种 join

    建表 在这里呢我们先来建立两张有外键关联的张表. CREATE DATABASE db0206; USE db0206; CREATE TABLE `db0206`.`tbl_dept`( `id` ...

  9. pandas基础学习

    1.导入两个数据分析重要的模块import numpy as npimport pandas as pd2.创建一个时间索引,所谓的索引(index)就是每一行数据的id,可以标识每一行的唯一值dat ...

  10. 举例说明如何使用【聚合数据】的API接口

    0 注册[聚合数据]的账号 登陆www.juhe.cn,如图,如果没有账号,注册一个(手机号或者邮箱注册),如果有直接登陆即可. 1 搜索所需的API接口 找到聚合数据主页,在搜索框输入你想搜索的AP ...