ketlle基本介绍

kettle是纯java开发,开源的etl工具。可以在Linux、windows、unix中运行。有图形界面,也有命令脚本还可以二次开发。
kettle其实是以前的叫法,现在官方称为:PDI(Pentaho Data Integeration)
Pentaho产品是一个用于访问、集成、操作、可视化和分析数据的综合平台。
无论数据存储在平面文件、关系数据库、Hadoop集群、NoSQL数据库、分析数据库、社交媒体流、操作商店还是云中,Pentaho产品都可以帮助您发现、分析和可视化数据,以找到所需的答案——即使您没有编码经验。
具有编程经验的高级用户可以使用API定制报告、查询、转换来扩展功能。

安装前准备

  1. kettle下载
  2. jdk

kettle的安装

JDK安装

kettle是基于java开发的,所以需要java环境

这里选择的是64位1.8版本jdk。

jdk的安装(两种方法):

  1. 直接解压jdk的zip文件,然后配置环境变量。
    在很多时候这样没问题,但是有些工具(kettle以外)在调用这种方式的jdk或jre会出现java没起来的情况
  2. 通过.exe安装(建议这么做)然后配置环境变量。
    这样安装完以后,在应用程序能对java进行一些设置。

jdk环境变量配置



至此jdk安装完毕

kettle的安装


在这里我们选择7.1版本的kettle
原因是我装过8.0以上的版本,但是在使用资源库的时候老是失败(默认的是admin/admin)
我重新弄一个7.1版本的时候测试是没问题的
下载后的文件如下
pdi-ce-7.1.0.0-12.zip
将文件解压
进入目录
\...\pdi-ce-7.1.0.0-12\data-integration

可能需要的步骤

  1. 如果在etl过程中用到了数据库的相关资源
    则需要把相关的数据库的链接驱动添加到\...\pdi-ce-7.1.0.0-12\data-integration\lib
    比如mysql的链接驱动

    然后重新启动spoon.bat即可

到目前为止,kettle最基本的环境搭建,就结束了。
此处只是最基本的环境搭建,关于linux下的搭建和工具的使用后续后持续记录。

注:此为本人工作学习记录,转载请注明出处!!!

ketlle windows下的安装(最基本)的更多相关文章

  1. memcache的windows下的安装和简单使用

    原文:memcache的windows下的安装和简单使用 memcache是为了解决网站访问量大,数据库压力倍增的解决方案之一,由于其简单实用,很多站点现在都在使用memcache,但是memcach ...

  2. Windows下pry安装和配置

    Windows下pry安装和配置 pry是一个增强型的交互式命令行工具,比irb强大. 有自动完成功能,自动缩进,有颜色.有更强大的调试功能. pry 安装很简单. 在终端输入: gem instal ...

  3. Windows下虚拟机安装Mac OS X ----- VM12安装Mac OS X 10.11

    Windows下虚拟机安装Mac OS X -– VM12安装Mac OS X 10.11 随着Iphone在国内大行其道,越来越多的开发者涌入iOS开发大军 中,但都苦于没有苹果机,本文即将介绍WI ...

  4. Windows下memcache安装使用

    Windows下Memcache安装 随着时间的推移,网上现在能找到的在 Windows下安装 Memcache 的文档大多已经过时.雪峰这里再简要介绍一下当下最新版的安装和配置方法. Memcach ...

  5. Windows 下如何安装配置Snort视频教程

    Windows 下如何安装配置Snort视频教程: 第一步: http://www.tudou.com/programs/view/UUbIQCng360/ 第二部: http://www.tudou ...

  6. 在windows下完美安装GitHub

    笔者最近在Windows下安装GitHub,过程中遇到不少问题.现在把安装的详细步骤分享给大家,免得大家走弯路. 笔者安装了GitHub for Windows程序,一切都运行顺利.但事情没有结束,首 ...

  7. windows下Eclipse安装Perl插件教程

    windows下Eclipse安装Perl插件教程 想用eclipse编写perl.网上看了很多资料.但EPIC插件的下载连接都失效了.无奈,只好自己动手写个教程记录一下. 准备工作: 安装好Ecli ...

  8. Ruby入门--Linux/Windows下的安装、代码开发及Rails实战

    Ruby入门--Linux/Windows下的安装.代码开发及Rails实战 http://www.linuxidc.com/Linux/2014-04/100242.htm Ubuntu 13.04 ...

  9. mediawiki在windows下的安装

    mediawiki在windows下的安装 对于刚接触wiki的朋友们来说,配置一个服务器环境,安装并运行mediawiki是一件很麻烦的事情,在这里,我尽量用通俗易懂的语言,介绍mw(mediawi ...

随机推荐

  1. Python面向对象基础知识

    面向对象是一种编程方式,此编程方式的实现是基于对类和对象的使用 类是一个模板,模板中包装了多个“函数”供使用(可以讲多函数中公用的变量封装到对象中) 对象,根据模板创建的实例(即:对象),实例用于调用 ...

  2. No space left on device Linux系统磁盘空间已满

    1. 删除系统日志等   删除生成 core,mbox等文件   #find / -name core|xargs rm –rf   删除日志   2.重起机器

  3. Java中的volatile变量有什么作用?

    vlolatile是一个特殊的的修饰符,只能修饰成员变量,在Java并发程序缺少同步类的情况下,多线程对成员变量的操作对其他线程是透明的.volatilel变量可以保证下一个读取操作会在前一个写操作之 ...

  4. Static,重载,List的知识点

    声明为static的成员可以在它的类的对象创建之前被访问,静态方法不能访问实例变量. 声明为static的变量称为静态变量或类变量,static可以用来修饰属性.方法和代码块. 多重继承的初始化顺序是 ...

  5. ajax csrf

    data 里加 csrfmiddlewaretoken:$("[name='csrfmiddlewaretoken']").val(), 还要再 form表单里加{% csrf_t ...

  6. Python基础(条件判断,循环,占位符等)

    Python 自动化 系统开发用的语言和自动化脚本可以不同 学习peython可用于: 网路爬虫,数据分,web开发,人工智能,自动化运维,自动化测试,嵌入式,黑客 第三方库比较全 脚本语言:功能单一 ...

  7. asp.net core 实战项目(一)——ef core的使用

    数据库设计 数据结构图如下:   此次实例比较简单,暂时只设计到上述3张表 SMUser:用于存储用户信息. Role:用于存储角色信息. SMUser_Role:用建立用户和角色关系的一直关联表. ...

  8. tensorFlow入门实践(三)初识AlexNet实现结构

    参考黄文坚<TensorFlow实战>一书,完成AlexNet的整体实现并展望其训练和预测过程. import tensorflow as tf batch_size = 32 num_b ...

  9. 小程序wx.chooseImage的坑

    选择图片后可能重新执行onshow()和onhide(),可以在页面中添加锁变量,选择图片前获取,选择完释放,onshow中利用锁来中断执行

  10. Linux "ls -l"文件列表权限详解 【转】

    1.使用 ls -l 命令 执行结果如下(/var/log) : drwxr-x--- 2 root              adm    4096 2013-08-07 11:03 apache2 ...