数据对接—kettle使用之二
这一篇开始进入kettle的一些常用插件的使用介绍,通过实例介绍不同插件的功能。这一篇说(Data Grid和文本文件输出)的使用。
文本文件输出介绍(可以略过,一般用不着):
1、Run this as a command instead:把结果输出到命令行或者脚本
2、文件名里包含步骤数:如果你在多个拷贝中运行步骤,拷贝的数量将包含到文件名中。
3、Include partition nr in filename:文件名中包含数据分区数量
4、文件名包含日期
5、文件名包含时间
6、追加
7、分隔符
8、封闭符:封闭字段的一对字符,可选
9、强制在字段周围加上封闭符
10、头部:如果享有一个头部行,选中
11、尾部:如果享有一个尾部行,选中
12、格式:DOS文件的分隔符可以是回车或换行符
13、编码:指定编码,如果空白就是用系统缺省的编码
14、Compression(压缩):指定压缩的类型(zip,gzip)
15、Right pad fields:在字段最后添加空格或者删除字符,直到长度达到指定
16、Fast data dump(no formatting):当处理大量数据到一个文本文件时,提高性能.(不包含任何格式化信息)
17、分拆每一行:如果n比0大,用n行拆分文本文件,分割成多个部分。
18、Add Ending line of file:指定输出文本的额结束行。
具体操作:
首先,启动软件,新建转换作业,如下图:
其次,就可以在空白区域拖拽插件进行数据对接了,我们先做个测试表数据输出到文本文件中,用到的插件有Data Grid和文本文件输出,如下图:
打开Data Grid并编辑测试数据,如下图:
打开文本文件输出并自动获取字段和编辑输出路径,如下图:
上面看到的只是一些最基本的操作,想要个性化的配置需要对每个插件里的配置项进行配置,弄好之后我们就可以点击运行按钮了(记得一定要先保存哦),看输出结果,如下图:
运行后我们可以看到还有输出日志,还有每一步执行的结果显示输出,方便我们查看,最后的运行结果会在指定好的路径创建出一个文本文件,打开文件如下图所示:
这一篇就到这里,下篇我们继续演示其它插件的使用...
数据对接—kettle使用之二的更多相关文章
- 数据对接—kettle使用之四
上一篇介绍了表输出插件,并通过实例介绍插件的简单使用,如果有这样的需求大家可以参考一下并深入研究插件的其它细节设置.这一篇我们介绍和表输出对应的插件(表输入)的使用. 表输入: 1. 从步骤插入数据: ...
- 通过AngularJS实现前端与后台的数据对接(二)——服务(service,$http)篇
什么是服务? 服务提供了一种能在应用的整个生命周期内保持数据的方法,它能够在控制器之间进行通信,并且能保证数据的一致性. 服务是一个单例对象,在每个应用中只会被实例化一次(被$injector实例化) ...
- 数据交换工具Kettle
网上搜集了一些关于开源数据交换工具Kattle的文章,特收藏例如以下: 文章一:ETL和Kettle简单介绍 ETL即数据抽取(Extract).转换(Transform).装载(Load)的过程.它 ...
- Apache nifi 第二篇(小白初试) nifi数据对接流程初次尝试
一.准备工作 1.官网下载nifi 2.上传到linux随便哪里把,因为nifi是用java写的,所以首先要保证你的linux装了jdk 其次保证系统在装了zookeeper,因为nifi是一个分布 ...
- 通过AngularJS实现前端与后台的数据对接(一)——预备工作篇
最近,笔者在做一个项目:使用AngularJS,从而实现前端与后台的数据对接.笔者这是第一次做前端与后台的数据对接的工作,因此遇到了许多问题.笔者在这些问题中,总结了一些如何实现前端与后台的数据对接的 ...
- 数据层交换和高性能并发处理(开源ETL大数据治理工具--KETTLE使用及二次开发 )
ETL是什么?为什么要使用ETL?KETTLE是什么?为什么要学KETTLE? ETL是数据的抽取清洗转换加载的过程,是数据进入数据仓库进行大数据分析的载入过程,目前流行的数据进入仓库的 ...
- Kettle系列文章二(安装配置Kettle+SqlServer+简单的输入输出作业)
一.下载 Kettle下载地址:https://community.hitachivantara.com/docs/DOC-1009855 下拉到DownLoad,点击红框中的链接进行下载.. 二.解 ...
- 数据存储与IO(二)
一.NSBundle资源包. 只要把文件拖到Xcode左边项目导航面板中,选择复制文件到项目中,该文件就包含进bundle中了.用[NSBundle mainBundle]获取应用程序包,常用的方法: ...
- android数据存储之Sqlite(二)
SQLite学习笔记 前言:上一章我们介绍了sqlite的一些基本知识以及在dos命令下对sqlite进行的增删改查的操作,这一章我们将在android项目中实际来操作sqlite. 1. SQLit ...
随机推荐
- mongodb的java客户端的设计思想
链接见http://api.mongodb.org/java/current/?_ga=1.111551751.200271495.1409034486 整体结构分为
- DataGrid GridView 单页javascript 表头排序
JS代码如下: <script> var curObj; var shell = 1; function sortTable(L) { var start=new Date() var i ...
- CentOS 6.4搭建zabbix
系统环境:CentOS 6.4 64bit Zabbix版本:zabbix 2.2.3 前提条件:已安装好LNMP环境 一.服务端: 1. 下载zabbix安装包zabbix-2.2.3.tar.g ...
- 武汉科技大学ACM :1001: 零起点学算法34——继续求多项式
Problem Description 输入1个正整数n, 计算1+(1+2)+(1+2+3)+...+(1+2+3+...+n) Input 输入正整数n(多组数据) Output 输出1+(1+2 ...
- Android导入项目时出现红色感叹号
导入一个新的项目后,丢失android.jar文件 解决方法:在项目名称上单击右键,选择Properties,再选择Android,再在其中选择一个project build target,点击确定之 ...
- phpcms v9联动菜单实现筛选
<!--初始化init--> {php $theurl = "index.php?m=content&c=index&a=lists&catid=$cat ...
- 提高PHP性能的方法技巧
1.用单引号代替双引号来包含字符串,这样做会更快一些.因为PHP会在双引号包围的字符串中搜寻变量,单引号则不会,注意:只有echo能这么做,它是一种可以把多个字符串当作参数的“函数”(译注:PHP手册 ...
- php计算剩余时间的自定义函数
把两个日期格式的字符串转化成unix时间戳,然后相减获得时间戳差,最后判断剩余时间,生成类似(2小时30分钟20秒前发布)这样的时间格式,代码如下: function gettime($time_s, ...
- rsync同步配置
因为公司数据库比较重要,现在只有一台服务器,IP为:118.145.*.*暂称为server,公司一台虚拟机,IP为.192.168.0.100 ,暂称为rsync 1.安装服务器端:yum -y i ...
- OpenStack协同并发 eventlet
今天听easystack一哥们讲nova协同并发,结合自己之前的认识.回顾一下openstack eventlet. OpenStack作为热门的开源云平台,本身代码当然得支持高并发. 首先讲讲pyt ...