DPDI实操演练第一讲

1.DPDI简介

DPDI Online 您的智能ETL任务调度专家
DPDI Online 是一款基于Kettle的强大在线任务调度平台,凭借其高效与灵活性,专为调度和监控Kettle客户端生成的ETL任务而设计
DPDI Online 具有一下特性
多服务器多版本支持:无缝整合不同服务器和Kettle版本,确保任务执行兼容性和一致性
联合开发:由三倍镜成员团队共同研发,确保平台的创新性和专业性
灵活部署:支持属地化部署,满足您的特定业务需求
定制化开发:提供个性化定制服务,以适应不断变化的市场需求

2.DPDI背景

Pentaho Data Integration简介
PDI也称为Kettle,Kettle是利用Spoon设计器设计转换(Transformation)和作业(Job),转换主要是针对数据的各种处理,⼀个转换⾥可以包含多个步骤(Step),作业是处理流程,⼀个作业⾥包括多个作业项(Job Entry),⼀个作业项代表了⼀项⼯作,转换也是⼀个作业项
Pentaho Data Integration调度监控
Pentaho Data Integration(kettle)作为用户规模最多的开源ETL工具,强大简洁的功能深受广大ETL从业者的欢迎。但kettle本身的调度监控功能却非常弱。Pentaho官方都建议采用crontab(Unix,linux平台)和计划任务(Windows平台)来完成调度功能。所以大家在实施kettle作业调度功能的时候,通常采用以下几种方式:使用spoon程序来启动Job,使用crontab或计划任务,自主开发java程序来调用kettle的类库
DPDI online在线调度管理
DPDI online是基于Pentaho Data Integration构建的一个高效、灵活的在线任务调度(Dispatch)平台。它允许开发人员和数据工程师以简单的方式定义、管理和执行定时的数据处理任务,是大数据环境中的ETL流程自动化的好帮手

3.DPDI官网

官方网站地址
DPDI安装包和产品文档下载地址
DPDI演示环境地址
联系我们

4.DPDI实操演练第一讲

利用Dispatch PDI调度PDI任务生成日期维度表
4.1PDI流程

4.2 PDI实现步骤说明
4.2.1生成20年日期记录
用到PDI组件:输入-生成记录

4.2.2增加日期序列
用到PDI组件:转换-增加序列

4.2.3生成日期属性
用到PDI组件:脚本-JavaScript代码

4.2.4日期属性筛选
用到PDI组件:转换-字段选择

4.2.5加载数据到数据仓库
用到PDI组件:输出-表输出

4.2.6数据仓库数据库连接配置

连接名称命名为Data_warehouse、连接类型选择mysql、连接方式采用JNDI、JNDI名称设置为Data_warehouse(DPDI连接配置需要设置的名称)

4.3 Dispatch PDI调PDI任务
4.3.1登录DPDI
输入用户名和密码勾选同意并接受DispatchPDI用户协议进行登录

4.3.2新建资源库
登录后在左侧菜单中 -> 资源管理下 -> 点击资源仓库 ->点击新增资源库

选择资源库类型为文件、填写资源库编码、资源库名称、资源库简介,点击保存即可完成资源库的创建

4.3.3上传PDI文件
点击查看明细进入名Dispatch PDI资源库明细页面

上传文件夹 -> 选择目录 -> 点击上传 ->选择要上传的文件夹

选择要上传的文件夹 ->上传

确定要上传的文件个数 ->上传

再次确认文件个数 -> 确定,完成文件上传

PDI文件导入完成后结果展示

4.3.4连接配置
数据仓库JNDI名称为Data_warehouse连接配置步骤:
资源管理->连接配置、修改数据库URL(IP,端口,数据库Schema)->新增->选择数据库类型->填写数据库名称、数据库描述、数据库用户名、数据库密码->点击测试连接->测试连接成功点击确定完成数据库连接配置

配置成功后结果

4.3.5任务配置
资源管理->任务配置->新增->选择调度方式为手工执行->任务环境/服务器类型为本地->任务信息/下拉选择资源库、下拉选择脚本目录、下拉脚本名称找到任务DIM_DATE.ktr->
点击保存

任务配置成功后结果

4.3.6预警配置
配置SMTP服务器地址、SMTP服务器端口、发件人、收件人、抄送人地址,点击发送测试邮件提示测试邮件成功代表配置正确,点击保存完成预警配置

4.3.7启动任务
点击播放按钮进行启动任务

可实时监控运行日志,也可以随时停止任务

4.3.8预警记录
如果任务失败会有异常邮件通知,DPDI可以查看预警记录
,

预警配置设置的接收人和抄送人邮箱中可以看到具体的错误日志

4.3.9日志管理
日志管理可以查看运行日志

4.4 结果展示

更多实操演练请关注三倍镜官网

DPDI(Dispatch PDI)kettle调度管理平台之实操演练第001讲--手工调度本地PDI任务生成日期维度数据的更多相关文章

  1. 号外号外:9月13号《Speed-BI云平台案例实操--十分钟做报表》开讲了

    引言:如何快速分析纷繁复杂的数据?如何快速做出老板满意的报表?如何快速将Speed-BI云平台运用到实际场景中?         本课程将通过各行各业案例背景,将Speed-BI云平台运用到实际场景中 ...

  2. kettle安装部署基本操作及实操文档

    一.kettle是什么? Kettle,简称ETL(Extract-Transform-Load的缩写,即数据抽取.转换.装载的过程),是一款国外开源的ETL工具,纯Java编写,可以在Window. ...

  3. vue管理平台的动态路由(后台传递路由,前端拿到并生成侧边栏)

    前端的路由从后台获取,包括权限: 大体步骤包括:路由拦截(钩子函数)---->后台获取路由数据 ----> 保存到本地或vuex中. 在router-->index.js中: rou ...

  4. Spark调度管理(读书笔记)

    Spark调度管理(读书笔记) 转载请注明出处:http://www.cnblogs.com/BYRans/ Spark调度管理 本文主要介绍在单个任务内Spark的调度管理,Spark调度相关概念如 ...

  5. kettle系列-我的开源kettle调度、管理平台[kettle-manager]介绍

    kettle管理工具 专门为kettle这款优秀的ETL工具开发的web端调度.管理工具. 新版本 项目简介 kettle作为非常优秀的开源ETL工具得到了非常广泛的使用,一般的使用的都是使用客户端操 ...

  6. kettle系列-kettle管理平台部署说明

    本介绍我的开源项目[kettle-manager]kettle管理平台如何获取并部署使用,该项目介绍请参看另一篇博文:http://www.cnblogs.com/majinju/p/5739820. ...

  7. 基于kettle8的web端调度监控平台

    发布时间:2018-11-16   技术:spring+springmvc +beetlsql+quartz+kettle8   概述 Kettle调度监控平台(以下简称KS)是一个自主开发的java ...

  8. 一个简单易用的容器管理平台-Humpback

    什么是Humpback? 在回答这个问题前,我们得先了解下什么的 Docker(哦,现在叫 Moby,文中还是继续称 Docker). 在 Docker-百度百科 中,对 Docker 已经解释得很清 ...

  9. 分布式缓存管理平台XXL-CACHE

    <分布式缓存管理平台XXL-CACHE> 一.简介 1.1 概述 XXL-CACHE是一个分布式缓存管理平台,其核心设计目标是"让分布式缓存的接入和管理的更加的简洁和高效&quo ...

  10. 容器、容器集群管理平台与 Kubernetes 技术漫谈

    原文:https://www.kubernetes.org.cn/4786.html 我们为什么使用容器? 我们为什么使用虚拟机(云主机)? 为什么使用物理机? 这一系列的问题并没有一个统一的标准答案 ...

随机推荐

  1. BackupBuddy pg walkthrough Intermediate

    nmap ┌──(root㉿kali)-[~/lab] └─# nmap -p- -A 192.168.189.43 Starting Nmap 7.94SVN ( https://nmap.org ...

  2. Navicat怎样查看数据库密码

    Navicat怎样查看数据库密码 前言 本文来源:Navicat怎样查看数据库密码_低端玩家的博客-CSDN博客_navicat查看数据库密码 主要是怕作者删帖,因此备份 开始 1.导出链接 2.一定 ...

  3. 第15章 流与IO

    第15章 流与IO 15.1 .NET 流的架构 .NET 流的架构主要包含三个概念:** 后台存储 . 装饰器 以及 流适配器 **,如图所示: C7.0 核心技术指南 第7版.pdf - p655 ...

  4. 玩转云端 | 天翼云边缘安全加速平台AccessOne实用窍门之多款产品管理难?一站式平台管理全hold住!

    随着数字化转型深入推进,企业信息化建设成效显著,同时其所面临的安全与性能挑战也日趋复杂,既要确保业务系统的安全性,同时也要提供快速.流畅的用户体验,以提升用户满意度和业务竞争力. 在传统的解决方案中, ...

  5. 春节福利来啦!Mac用户快来抽大奖

    亲爱的Mac俱乐部(MaClub)用户及所有果粉朋友们: 值此新春佳节之际,Mac俱乐部特别推出春节抽奖活动,以回馈广大用户长期以来的支持与厚爱.我们精心准备了丰富的奖品,希望能为您的新年增添一份惊喜 ...

  6. q-analog 学习笔记(待整修)

    联考题考这个不会就来学了 首先给出对其的定义. 对于一个对象 \(u\),构造关于 \(q\) 的某表达式 \(f(q)\),使得: \[\lim_{q\to 1}f(q)=u \] 然而这个可能没有 ...

  7. Iceberg参数调整

    1.读取参数介绍 属性   默认值   描述 read.split.target-size 134217728 (128 MB) 组合数据输入分割时的目标大小 read.split.metadata- ...

  8. autMan奥特曼机器人-wxbot邀请入群插件的使用

    内置微信(非微信框架)的拉群插件怎么用? 一.安装"wxbot邀请入群"插件 二.在"我的"->"wxbot邀请入群"->配参中 ...

  9. Linux - 批量清除失效软连接

    红底白字,并且一闪一闪的都是失效的软连接,需要批量清除它们... 1.打印所有失效软连接 find ./* -type l -exec test ! -e {} \; -exec echo {} \; ...

  10. 将DeepSeek接入人类大脑会怎样??

    昨天在与同事聊起最近大火的DeepSeek, 突然,有一个不切实际的想法,如果DeepSeek或人工智能AI能以某种形式接入人类大脑, 比如,通过芯片不侵入式连接大脑 或者 外带什么眼镜. 隐形眼镜之 ...