一、kettle是什么。

Kettle是一款国外开源的ETL( Extract-Transform-Load 的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程)工具,纯java编写,可以在Window、Linux、Unix上运行,数据抽取高效稳定。Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出.
 
 二、kettle安装
注意:设置好环境变量,将kettle 文件夹内的 spoon.bat发送快捷方式到桌面就可以启动了.
 
三、kettle运行逻辑

kettle包括作业、转换来进行数据处理的操作,执行步骤逻辑是这样:

1、执行作业,作业调用转换

2、调用的转换里面有多个执行步骤
3、执行步骤里面可以和mysql等主流数据库连接 可以依托SQL语句实现数据处理

图1:一个作业流程 对应第1个步骤

图2 一个转换内部步骤 对应步骤2 和步骤3(步骤3就是写SQL)具体字段以处理过的表test数据为范本

因此 如果想实现数据处理的最终结果,需要做的步骤和上面1、2、3顺序完全相反
1、写SQL语句(更新数据库的和数据报表的)
2、新建一个转换 连接对应数据库 表输入 表输出 设置好步骤 保存文件
3、新建一个作业,START--->插入一个转换控件---->右击转换控件--->将第2步的转换导入调用
保存文件 执行作业即可实现数据的导入

 三、从服务器导数到本地去进行MySQL练习和出一些报表 
3.1、前提:表输入和表输出 来自的数据表的字段和数据类型完全一致(当然导数也不一定只用kettle)
在执行转换的步骤里我已经创建了两个mysql数据库连接,一个阿里云服务器连接一个本地localhost 连接
图3导数转换

3.2导数到本地 服务器和本地数据表字段和数据类型一致

#导数之前:最下面添加的两个字段productname 和order_date 在服务器数据表里是没有的 因此先创建下面这么多字段和服务器表保持一致
CREATE TABLE IF NOT EXISTS test_a03(
city VARCHAR(255),
username INT(11),
productID INT(11),
price DECIMAL(19,4),
sales INT(11),
pay_money DECIMAL(19,4),
order_time DATETIME,
salesperson VARCHAR(255),
KEY city(city),
KEY username(username)
)ENGINE INNODB DEFAULT CHARSET=utf8
#成功导入了200条数据 sql下载在博客底部百度云连接

图4 导数成功

3.3 修改表名 添加字段 更新字段内容

#更换表名(和mysql目录文章保持同一个表 以这个数据表进行mysql学习
#2修改表名 alter table 表名 rename 新表名
ALTER TABLE test_a03 RENAME test_a03order;
#3在字段 order_time后面增加一个字段
ALTER TABLE `test_a03order` ADD order_date DATE AFTER order_time
#插入的两个新字段内容为空 我们更新一下
#更新 order_date
UPDATE test_a03order SET order_date=DATE(order_time) WHERE order_date IS NULL;
#更新productname
UPDATE test_a03order SET productname="心灵鸡汤(押瓶1000元)10000ml*24瓶/箱" WHERE productname IS NULL
#现在执行 select * from test_a03order 数据如下面图

  

  嗯。。productname 一样名称,根据username值范围再更新一下,日期包含7、8、9三个月的

price*sales=pay_money, productID 和productname也能对应  price是变动的这个也比较符合实际 就是押金写的有点大..

3.4 数据更新完成

sql文件放在百度云盘了 下载在本地数据库执行

链接: https://pan.baidu.com/s/1slzUw6T

kettle及数据库导数_20160920的更多相关文章

  1. kettle系列-3.kettle读取数据库资源库很慢的优化

    环境:windows7,jvm内存设置14G,kettle5.1后来升级到5.4,oracle作为资源库. 问题背景:我们通过web页面管理kettle的job运行,这只是一个管理界面,即使web项目 ...

  2. Solr4.6从数据库导数据的步骤

    http://blog.csdn.net/bruce128/article/details/17796705 Solr4.6有从数据库导数据的功能.导入步骤如下: 1.将下载下来的solr4.6的di ...

  3. sqlloader 往数据库导数据提示数据文件的字段超出最大长度

    当我们用sqlloader往数据库导数据提示被拒绝,数据文件的字段超出最大长度.但是我们不管怎么改提示字段的长度的时候仍然提示超出最大长度. 这个是因为ctl文件中默认为char256,超过256需要 ...

  4. Kettle实现数据库迁移

    Kettle实现数据库迁移 需求: 做数据仓库时,需要将业务系统CRM抽取到数据仓库的缓冲层,业务系统使用的是SqlServer数据库,数据仓库的缓冲层使用的是mysql数据库,为实现数据库的迁移,即 ...

  5. kettle实现数据库迁移----多表复制向导

    kettle实现数据库迁移----多表复制向导 需求: 做数据仓库时,需要将业务系统CRM抽取到数据仓库的缓冲层,业务系统使用的是SqlServer数据库,数据仓库的缓冲层使用的是mysql数据库,为 ...

  6. kettle的数据库配置的表分析

    以下场景,用mysql来举例说明.本文是在初步了解了kettle的数据库配置之后,做的总结和分析.将kettle中的配置用数据库管理的时候,在创建了一个新的数据库,还没有做任何kettle中的job和 ...

  7. 用kettle实现数据库迁移之oracle到mysql

    项目完成后,需要把历史oracle 的数据库转移mysql 用kettle 转换数据. 步骤: 1.打开spoon.bat,文件-->新建-->转换,点击“主对象树”,DB连接右键“新建” ...

  8. Kettle建立数据库链接报错-'MS SQL Server' driver (jar file) is installed. kettle的bug,对于12.2而言

    1.链接sql server数据库报错 错误连接数据库 [My_vm_win_sql] : org.pentaho.di.core.exception.KettleDatabaseException: ...

  9. ETL工具之Kettle的简单使用一(不同数据库之间的数据抽取-转换-加载)

    ETL工具之Kettle将一个数据库中的数据提取到另外一个数据库中: 1.打开ETL文件夹,双击Spoon.bat启动Kettle 2.资源库选择,诺无则选择取消 3.选择关闭 4.新建一个转换 5. ...

随机推荐

  1. hdu1081 最大子矩阵

    最大子矩阵自然直在最大连续子序列的升级版  只是其原理都是用到了动态规划思想     仅仅是矩阵用到了枚举 +合并       把非常多列看成是一列的和 #include<stdio.h> ...

  2. Cocoapods完整使用篇

    温馨提示:在篇文章中所使用的Xcode版本为Xcode7.   一.什么是CocoaPods? 简单来说,就是专门为iOS工程提供对第三方库的依赖的管理工具,通过CocoaPods,我们可以单独管理每 ...

  3. 请设计一个函数,用来判断在一个矩阵中是否存在一条包含某字符串所有字符的路径。路径可以从矩阵中的任意一个格子开始,每一步可以在矩阵中向左,向右,向上,向下移动一个格子。如果一条路径经过了矩阵中的某一个格子,则该路径不能再进入该格子。 例如 a b c e s f c s a d e e 矩阵中包含一条字符串"bccced"的路径,但是矩阵中不包含"abcb"路径,因为字符串的第一个字符b占据了矩阵中

    // test20.cpp : 定义控制台应用程序的入口点. // #include "stdafx.h" #include<iostream> #include< ...

  4. sharepoint 2013 资源管理器copy大文件到本地失败解决方法

    Error 0x800700DF: The file size exceeds the limit allowed and cannot be saved 中文错误信息是:文件大小超出同意范围.不能被 ...

  5. 2015最流行的Android组件、工具、框架大全(转)

    转自:2015最流行的Android组件.工具.框架大全 Android 是目前最流行的移动操作系统之一. 随着新版本的不断发布, Android的功能也日益强大, 涌现了很多流行的应用程序, 也催生 ...

  6. YII框架学习(一)

    1.安装: windows:将php命令所在的文件夹路径加入到环境变量中,通过cmd命令:进入yii框架中的framework目录,执行: php yiic webapp ../cms linux:类 ...

  7. python opener代理

    链接:http://www.jb51.net/article/46495.htm https://www.cnblogs.com/cunyusup/p/7341829.html

  8. Drcom账户管理Server端解说

    https://www.github.com/xiyouMc 首先今天要讲的是针对Drcom查询账户URL的解析和抓取数据.    Drcom是大学生宿舍上网普遍使用的联网client,然而对于自己账 ...

  9. python 基础 7.8 json--下

      一. 文件和json 之间的转换 1. json.dump()   #/usr/bin/python #coding=utf-8 #@Time   :2017/11/13 0:12 #@Authe ...

  10. 【BZOJ4435】[Cerc2015]Juice Junctions Tarjan+hash

    [BZOJ4435][Cerc2015]Juice Junctions Description 你被雇佣升级一个旧果汁加工厂的橙汁运输系统.系统有管道和节点构成.每条管道都是双向的,且每条管道的流量都 ...