一、输入步骤概述

  输入步骤主要分为以下几类:

    • 生成记录/自定义常量
    • 获取系统信息
    • 表输入
    • 文本文件输入
    • XML 文件输入
    • Json输入
    • 其他输入步骤

二、生成记录和自定义常量

  

  1.生成记录

    

    由于生成记录每行都是一样的数据,所以便诞生了自定义常量数据来手工模拟数据

  2.自定义常量数据

  

  常用于构造一些测试数据

三、获取系统信息

  获得各类系统信息,常见的包括:
    • 转换开始时间。
    • 关键时间点信息
    • 最多十个命令行参数
    • 主机名/ip/进程号/虚拟机内存等
    • 上一个作业的完成情况参数

    

      // 固定是整个转换开始的时间

  

  更多系统信息细节,参考相关文档

四、表输入

  表输入是比较常见的输入方式,通过执行SELECT语句,从数据库拉取输入数据

  可以使用${}形式使用变量,如果使用?变量,要求前面步骤传过来的参数需要顺序一致

  示例表输入配置如下:

  

  

  配置变量输入:

  

  数据类型对应关系:

    

五、文本文件输入

  

  文本文件输入:
    处理有列分隔符(限定符、逃逸字符)的文本文件。
    功能选项丰富、有错误处理机制。
  CSV 文件输入:
    简化了文本文件输入
    通过 NIO、并行、延迟转换提高性能
   固定宽度:
    列固定宽度的文件,不用解析字符串,性能好。

  1.文本文件输入

    先看文件这一项:

    

  双击文件节点进入编辑,直接点击浏览进行选择不是很推荐,

  推荐使用变量(凡是旁边一个$形状的,都可以根据提示使用变量,内置变量参考这里),单击变量,旁边会显示变量的值,可以进行参考

  可以在第一行选择文件或者目录,选择目录则可以在规则表达式进一步通过正则进行控制

  然后点击增加,增加文件到选中的文件框中,之后点击显示文件名进行文件选择结果查看

  也可以点击下方从步骤选择文件

  继续设置输入的内容页:

  

    // 这里目前不知何解,设置制表符\t字段会识别失败。换成分号;等就正常了

  解决方案如下:

    使用sublime先安装hexVIew插件,使用插件,点击toggle查看制表符的十六进制,然后分隔符处通过$[],例如制表符查看是09;

  则分隔符为:$[09]

  字段页通过获取字段查看分割结果:预览记录查看记录结果

  

  错误处理页可以进行相关设置:

  

  过滤页可以进行字段过滤:

    例如选择第二列(从0开始位置),含有bb的

  

  2.固定宽度

    要求每一行都是固定宽度,然后通过宽度截取

###  XML输入暂不赘述

###  JSON输入暂不赘述

六、其它输入 

  Excel 输入
  Access 输入
  配置文件输入
  SAP 输入
  Oracle CDC 增量输入
  消息队列输入
  PDF文件输入
  搜索引擎结果输入

kettle学习笔记(四)——kettle输入步骤的更多相关文章

  1. python学习笔记(四)---用户输入与while循环

    用户输入 函数input demo1: message = input("all you input is chars:") print(message) demo2: 由inpu ...

  2. Kettle学习笔记(四)— 总结

    目录 Kettle学习笔记(一)- 环境部署及运行 Kettle学习笔记(二)- 基本操作 kettle学习笔记(三)- 定时任务的脚本执行 Kettle学习笔记(四)- 总结 Kettle中设置编码 ...

  3. Kettle学习笔记(二)— 基本操作

    目录 Kettle学习笔记(一)- 环境部署及运行 Kettle学习笔记(二)- 基本操作 kettle学习笔记(三)- 定时任务的脚本执行 Kettle学习笔记(四)- 总结 打开Kettle 打开 ...

  4. Kettle学习笔记(一)— 环境部署及运行

    目录 Kettle学习笔记(一)-环境部署及运行 Kettle学习笔记(二)- 基本操作 kettle学习笔记(三)- 定时任务的脚本执行 Kettle学习笔记(四)- 总结 Kettle简介 Ket ...

  5. IOS学习笔记(四)之UITextField和UITextView控件学习

    IOS学习笔记(四)之UITextField和UITextView控件学习(博客地址:http://blog.csdn.net/developer_jiangqq) Author:hmjiangqq ...

  6. java之jvm学习笔记四(安全管理器)

    java之jvm学习笔记四(安全管理器) 前面已经简述了java的安全模型的两个组成部分(类装载器,class文件校验器),接下来学习的是java安全模型的另外一个重要组成部分安全管理器. 安全管理器 ...

  7. Learning ROS for Robotics Programming Second Edition学习笔记(四) indigo devices

    中文译著已经出版,详情请参考:http://blog.csdn.net/ZhangRelay/article/category/6506865 Learning ROS for Robotics Pr ...

  8. 零拷贝详解 Java NIO学习笔记四(零拷贝详解)

    转 https://blog.csdn.net/u013096088/article/details/79122671 Java NIO学习笔记四(零拷贝详解) 2018年01月21日 20:20:5 ...

  9. kvm虚拟化学习笔记(四)之kvm虚拟机日常管理与配置

    KVM虚拟化学习笔记系列文章列表----------------------------------------kvm虚拟化学习笔记(一)之kvm虚拟化环境安装http://koumm.blog.51 ...

  10. MySql学习笔记四

    MySql学习笔记四 5.3.数据类型 数值型 整型 小数 定点数 浮点数 字符型 较短的文本:char, varchar 较长的文本:text, blob(较长的二进制数据) 日期型 原则:所选择类 ...

随机推荐

  1. 移动端开发时默认样式reset

    /* http://meyerweb.com/eric/tools/css/reset/ v2.0 | 20110126 License: none (public domain) */ html, ...

  2. hadoop在zookeeper上的高可用HA

    (参考文章:https://www.linuxprobe.com/hadoop-high-available.html) 一.技术背景 影响HDFS集群不可用主要包括以下两种情况:一是NameNode ...

  3. selector设置按钮或者一些点击控件在点击时的效果

    <?xml version="1.0" encoding="utf-8"?> <selector xmlns:android="ht ...

  4. servlet和jsp页面过滤器Filter的作用及配置

    刚刚有个朋友问我,Servlet的过滤器有什么作用? 现在发个帖子说明一下,            过滤器是一个对象,可以传输请求或修改响应.它可以在请求到达Servlet/JSP之前对其进行预处理, ...

  5. json_encode无返回结果

    今天写php curl模拟客户端访问测试一个抽奖post数据,拿回来的数据是json,使用json_decode函数就是没结果,百度谷歌好久.终于发现是BOM的文件头造成的, 微软为utf-8文件添加 ...

  6. 想涨工资吗?那就学习Scala,Golang或Python吧

    [编者按]据薪水调查机构 PayScale 提供的数据显示,掌握 Scala,Golang 和 Python 语言以及诸如 Apache Spark 之类的大数据技术,能带来最大的薪水提升.本文作者为 ...

  7. Ubuntu 18.04 修改为静态IP

    1.进入/etc/netplan目录 cd /etc/netplan 2.查看文件 ls 3.编辑 01-network-manager-all.yaml vim 01-network-manager ...

  8. SqlServer 一个查询语句导致tempdb增大55G(转载)

    SqlServer 一个查询语句导致tempdb增大55G 今天操作着服务器,突然右下角提示“C盘空间不足”! 吓一跳!~ 看看C盘,还有7M!!!这么大的C盘空间怎么会没了呢?搞不好等下服务器会动不 ...

  9. python基础学习16----模块

    模块(Module)的引入 import 模块名 调用模块中的函数的方式为 模块名.函数名 这种方式引入会相当于将模块中代码执行一遍,所以如果引入的模块中有输出语句,那么只写import 模块名,运行 ...

  10. SQL SERVR 逻辑函数

    IIF: 根据布尔表达式计算为 true 还是 false,返回其中一个值. IIF 是一种用于编写 CASE 表达式的快速方法. 它将传递的布尔表达式计算为第一个参数,然后根据计算结果返回其他两个参 ...