DPDI(Dispatch PDI)kettle调度管理平台之实操演练第001讲--手工调度本地PDI任务生成日期维度数据
DPDI实操演练第一讲
1.DPDI简介
DPDI Online 您的智能ETL任务调度专家
DPDI Online 是一款基于Kettle的强大在线任务调度平台,凭借其高效与灵活性,专为调度和监控Kettle客户端生成的ETL任务而设计
DPDI Online 具有一下特性
多服务器多版本支持:无缝整合不同服务器和Kettle版本,确保任务执行兼容性和一致性
联合开发:由三倍镜成员团队共同研发,确保平台的创新性和专业性
灵活部署:支持属地化部署,满足您的特定业务需求
定制化开发:提供个性化定制服务,以适应不断变化的市场需求
2.DPDI背景
Pentaho Data Integration简介
PDI也称为Kettle,Kettle是利用Spoon设计器设计转换(Transformation)和作业(Job),转换主要是针对数据的各种处理,⼀个转换⾥可以包含多个步骤(Step),作业是处理流程,⼀个作业⾥包括多个作业项(Job Entry),⼀个作业项代表了⼀项⼯作,转换也是⼀个作业项
Pentaho Data Integration调度监控
Pentaho Data Integration(kettle)作为用户规模最多的开源ETL工具,强大简洁的功能深受广大ETL从业者的欢迎。但kettle本身的调度监控功能却非常弱。Pentaho官方都建议采用crontab(Unix,linux平台)和计划任务(Windows平台)来完成调度功能。所以大家在实施kettle作业调度功能的时候,通常采用以下几种方式:使用spoon程序来启动Job,使用crontab或计划任务,自主开发java程序来调用kettle的类库
DPDI online在线调度管理
DPDI online是基于Pentaho Data Integration构建的一个高效、灵活的在线任务调度(Dispatch)平台。它允许开发人员和数据工程师以简单的方式定义、管理和执行定时的数据处理任务,是大数据环境中的ETL流程自动化的好帮手
3.DPDI官网
官方网站地址
DPDI安装包和产品文档下载地址
DPDI演示环境地址
联系我们
4.DPDI实操演练第一讲
利用Dispatch PDI调度PDI任务生成日期维度表
4.1PDI流程

4.2 PDI实现步骤说明
4.2.1生成20年日期记录
用到PDI组件:输入-生成记录

4.2.2增加日期序列
用到PDI组件:转换-增加序列

4.2.3生成日期属性
用到PDI组件:脚本-JavaScript代码

4.2.4日期属性筛选
用到PDI组件:转换-字段选择

4.2.5加载数据到数据仓库
用到PDI组件:输出-表输出

4.2.6数据仓库数据库连接配置
连接名称命名为Data_warehouse、连接类型选择mysql、连接方式采用JNDI、JNDI名称设置为Data_warehouse(DPDI连接配置需要设置的名称)

4.3 Dispatch PDI调PDI任务
4.3.1登录DPDI
输入用户名和密码勾选同意并接受DispatchPDI用户协议进行登录

4.3.2新建资源库
登录后在左侧菜单中 -> 资源管理下 -> 点击资源仓库 ->点击新增资源库

选择资源库类型为文件、填写资源库编码、资源库名称、资源库简介,点击保存即可完成资源库的创建

4.3.3上传PDI文件
点击查看明细进入名Dispatch PDI资源库明细页面

上传文件夹 -> 选择目录 -> 点击上传 ->选择要上传的文件夹

选择要上传的文件夹 ->上传

确定要上传的文件个数 ->上传

再次确认文件个数 -> 确定,完成文件上传

PDI文件导入完成后结果展示

4.3.4连接配置
数据仓库JNDI名称为Data_warehouse连接配置步骤:
资源管理->连接配置、修改数据库URL(IP,端口,数据库Schema)->新增->选择数据库类型->填写数据库名称、数据库描述、数据库用户名、数据库密码->点击测试连接->测试连接成功点击确定完成数据库连接配置

配置成功后结果

4.3.5任务配置
资源管理->任务配置->新增->选择调度方式为手工执行->任务环境/服务器类型为本地->任务信息/下拉选择资源库、下拉选择脚本目录、下拉脚本名称找到任务DIM_DATE.ktr->
点击保存

任务配置成功后结果

4.3.6预警配置
配置SMTP服务器地址、SMTP服务器端口、发件人、收件人、抄送人地址,点击发送测试邮件提示测试邮件成功代表配置正确,点击保存完成预警配置

4.3.7启动任务
点击播放按钮进行启动任务

可实时监控运行日志,也可以随时停止任务

4.3.8预警记录
如果任务失败会有异常邮件通知,DPDI可以查看预警记录
,
预警配置设置的接收人和抄送人邮箱中可以看到具体的错误日志

4.3.9日志管理
日志管理可以查看运行日志


4.4 结果展示

更多实操演练请关注三倍镜官网
DPDI(Dispatch PDI)kettle调度管理平台之实操演练第001讲--手工调度本地PDI任务生成日期维度数据的更多相关文章
- 号外号外:9月13号《Speed-BI云平台案例实操--十分钟做报表》开讲了
引言:如何快速分析纷繁复杂的数据?如何快速做出老板满意的报表?如何快速将Speed-BI云平台运用到实际场景中? 本课程将通过各行各业案例背景,将Speed-BI云平台运用到实际场景中 ...
- kettle安装部署基本操作及实操文档
一.kettle是什么? Kettle,简称ETL(Extract-Transform-Load的缩写,即数据抽取.转换.装载的过程),是一款国外开源的ETL工具,纯Java编写,可以在Window. ...
- vue管理平台的动态路由(后台传递路由,前端拿到并生成侧边栏)
前端的路由从后台获取,包括权限: 大体步骤包括:路由拦截(钩子函数)---->后台获取路由数据 ----> 保存到本地或vuex中. 在router-->index.js中: rou ...
- Spark调度管理(读书笔记)
Spark调度管理(读书笔记) 转载请注明出处:http://www.cnblogs.com/BYRans/ Spark调度管理 本文主要介绍在单个任务内Spark的调度管理,Spark调度相关概念如 ...
- kettle系列-我的开源kettle调度、管理平台[kettle-manager]介绍
kettle管理工具 专门为kettle这款优秀的ETL工具开发的web端调度.管理工具. 新版本 项目简介 kettle作为非常优秀的开源ETL工具得到了非常广泛的使用,一般的使用的都是使用客户端操 ...
- kettle系列-kettle管理平台部署说明
本介绍我的开源项目[kettle-manager]kettle管理平台如何获取并部署使用,该项目介绍请参看另一篇博文:http://www.cnblogs.com/majinju/p/5739820. ...
- 基于kettle8的web端调度监控平台
发布时间:2018-11-16 技术:spring+springmvc +beetlsql+quartz+kettle8 概述 Kettle调度监控平台(以下简称KS)是一个自主开发的java ...
- 一个简单易用的容器管理平台-Humpback
什么是Humpback? 在回答这个问题前,我们得先了解下什么的 Docker(哦,现在叫 Moby,文中还是继续称 Docker). 在 Docker-百度百科 中,对 Docker 已经解释得很清 ...
- 分布式缓存管理平台XXL-CACHE
<分布式缓存管理平台XXL-CACHE> 一.简介 1.1 概述 XXL-CACHE是一个分布式缓存管理平台,其核心设计目标是"让分布式缓存的接入和管理的更加的简洁和高效&quo ...
- 容器、容器集群管理平台与 Kubernetes 技术漫谈
原文:https://www.kubernetes.org.cn/4786.html 我们为什么使用容器? 我们为什么使用虚拟机(云主机)? 为什么使用物理机? 这一系列的问题并没有一个统一的标准答案 ...
随机推荐
- Spring常用注解介绍
在Spring中,有许多高效的注解,其简化了开发并提高代码可读性,这样我们就不用再去spring.xml文件中写标签了非常方便 创建对象的注解 在Spring,有用于识别不同类型的Bean,使得Spr ...
- List<Map<String, Object>> 排序
一.代码 public class Test { public static void main(String[] args) { Map<String, Object> map = ne ...
- TypeScript 中的 type 和 interface:你真的了解它们的不同吗?
如果你有写过 Vue3 的项目,那么对 TypeScript 肯定不会陌生.不管是公司新项目技术选型还是个人学习开发新的前端项目,Vue3 + TypeScript 已经成为首选技术方案之一 在 Ty ...
- CF935D Fafa and Ancient Alphabet 题解
讲一个很暴力的方法(为描述方便,下文 \(a\) 数组代表 \(s1\),\(b\) 数组代表 \(s2\)). 发现假如当前 \(a_i\ne b_i\),就不需要再向下枚举了,于是拥有了分类讨论的 ...
- 如何修改JSONObject 的值
问 题 { "result": { "total": "3", "shops": [ { "shopId&qu ...
- surpac 中如何删除点
找到显示的编号 输入线窜线段编号
- 【由技及道】镜像星门开启:Harbor镜像推送的量子跃迁艺术【人工智障AI2077的开发日志010】
 需求分析,画出原型图(产品经理) 根据原型图输出 UI 界面及交互图(UI/UX设计师) 根据UI及交互效果画出页面, ...
- VirtualBox磁盘扩容
前言 虚拟机开始时设置的磁盘空间比较小,后面使用就不够了. # 查询磁盘使用情况 df -h 虚拟硬盘扩容 关闭正在运行的虚拟机 选中工具栏 选择虚拟硬盘,并选中需要扩容的磁盘 拖动进度条,设置想要扩 ...
- DB读写分离情况下,如何解决缓存和数据库不一致性问题?
前言 在读写分离的情况下,缓存和数据库数据不一致怎么解决? 请看这一篇如何更新缓存保证缓存和数据库双写一致性? 如何解决DB数据库的数据不一致问题? 请看这一篇怎么解决DB读写分离,导致数据不一致问题 ...