ETL工具-nifi干货系列 第三讲 nifi web ui 使用教程
1、nifi 服务启动之后,浏览器输入https://localhost:8443/nifi ,匿名登录或者输入用户名密码进入操作页面,如下图所示:

2、组件工具栏
处理器,鼠标放到图标上提示Processor,里面里面有各种各样的组件,可以实现各种各样的功能。

拖拉处理器到画布中,出现处理器选择列表,可以根据处理器来源,标签,类型,用途等进行检索自己需要的处理器,如下图所示

这里我们选择GenerateFlowFile进行演示(后续产生测试数据的时候会频繁使用到此组件),如下图所示:

选中处理器之后,点击add按钮或者双击处理器进行添加到画布,其他工具栏按钮同样也是通过拖拉到画布的方式进行使用,如下图所示:

3、状态栏
状态栏位于组件工具栏下方。状态栏中的图标含义依次从左到右分别是如下:
(Active Threads)当前活动流中线程数。
(Total queued data)当前存在于流中的数据量。
(Transmitting Remote Process Groups)画布上每个处于正在传输状态下存在的远程处理组数量。
(Not Transmitting Remote Process Groups)画布上每个处于未传输状态下存在的远程处理组数量。
(Running Components)画布上每个处于运行状态下存在的处理器数量。
(Stoped Components)画布上每个处于停止状态下存在的处理器数量。
(Invalid Components)画布上每个处于无效状态下存在的处理器数量。
(Disabled Components)画布上每个处于已禁止状态的处理器数量。
(Up to date Versioned Process Groups)画布上每个处于最新状态下存在的版本化处理组数量。
(Locally Modifyed Versioned Process Groups)画布上每个处于本地修改状态下存在的版本化处理组数量。
(Stale Versioned Process Groups)画布上每个处于过时状态下存在的版本化处理组数量。
(Locally Modifyed and Stale Versioned Process Groups)画布上每个处于本地修改且过时状态下存在的版本化处理组数量。
(Sync failure Versioned Process Groups)画布上每个处于同步失败状态下存在的版本化处理组数量。
(Last refresh )上次刷新所有这些信息的时间戳。
4、导航面板,面板中顶部四个按钮从左到右功能依次如下:
(Zoom in)点击放大镜进行放大操作。
(Zoom out)点击放大镜进行缩小操作。
(Fit)将浏览区域调整到适合屏幕大小,以便整个数据流可以完全可视化。
(Actual)将浏览区域调整到实际大小,即数据流的实际大小,可能需要用户进行滚动查看全部内容。
鸟瞰图(鼠标可以拖动矩形移动画布)和面包屑如下图所示:

5、操作面板,面板中按钮从左到右,从上到下功能依次如下:

(Configuration)配置,点击此按钮设置处理器,处理组等相关属性。
(Enable)启用,点击此按钮设置处理器可用。
(Disable)禁用,点击此按钮设置处理器不可用。
(Start)启动,点击此按钮启动,如果页面中状态栏中的感叹号数量大于0的话是无法启动的,必须根据感叹号提示内容修正感叹号数量为0时才可以正常启动。
(Stop)停止,点击此按钮停止。
(Create Template)创建模版,点此按钮将画布内容保存为模版,可以进行复用。
(Upload Template)上传模版,点此按钮可以将本地模版文件上传使用。
(Copy),复制画布处理器等。
(Paste),粘贴已经复制的内容到画布。
(Group),点此按钮快速创建子组,会讲当前画布内容包裹到子组里面。
(Change Color),点此按钮可以改变处理器的左上角的颜色,方便识别。
(Delete),点击此按钮可以删除画布中选中的组件。
6、全局菜单,全局菜单位置在页面右上角位置。全局菜单包含一些选项,允许您在画布上操作现有的组件,暂不详细描述,后续进行流程设计时进行讲解。

ETL工具-nifi干货系列 第三讲 nifi web ui 使用教程的更多相关文章
- 基于Web的Kafka管理器工具之Kafka-manager安装之后第一次进入web UI的初步配置(图文详解)
前期博客 基于Web的Kafka管理器工具之Kafka-manager的编译部署详细安装 (支持kafka0.8.0.9和0.10以后版本)(图文详解) 基于Web的Kafka管理器工具之Kafka- ...
- Selenium系列(十七) - Web UI 自动化基础实战(4)
如果你还想从头学起Selenium,可以看看这个系列的文章哦! https://www.cnblogs.com/poloyy/category/1680176.html 其次,如果你不懂前端基础知识, ...
- Singer 开源便捷的ETL 工具
singer 是一个强大,灵活的etl 工具,我们可以方便的提取web api,file,queue,基本上各种你可以想到的 数据源. singer 有一套自己的数据处理规范, taps, targe ...
- 开源ETL工具kettle系列之常见问题
开源ETL工具kettle系列之常见问题 摘要:本文主要介绍使用kettle设计一些ETL任务时一些常见问题,这些问题大部分都不在官方FAQ上,你可以在kettle的论坛上找到一些问题的答案 1. J ...
- 数据仓库系列之ETL过程和ETL工具
上周因为在处理很多数据源集成的事情一直没有更新系列文章,在这周后开始规律更新.在维度建模中我们已经了解数据仓库中的维度建模方法以及基本要素,在这篇文章中我们将学习了解数据仓库的ETL过程以及实用的ET ...
- etl学习系列1——etl工具安装
ETL(Extract-Transform-Load的缩写,即数据抽取.转换.装载的过程),对于企业或行业应用来说,我们经常会遇到各种数据的处理,转换,迁移,所以了解并掌握一种etl工具的使用,必不可 ...
- ETL工具的功能和kettle如何来提供这些功能
不多说,直接上干货! 大家会有一个疑惑,本系列博客是Kettle,那怎么扯上ETL呢? Kettle是一款国外开源的ETL工具,纯java编写,可以在Window.Linux.Unix上运行. 说白了 ...
- 开源作业调度工具实现开源的Datax、Sqoop、Kettle等ETL工具的作业批量自动化调度
1.阿里开源软件:DataX DataX 是一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL.Oracle等).HDFS.Hive.ODPS.HBase.FTP等各种异构数据源之间稳 ...
- 【转】ETL介绍与ETL工具比较
本文转载自:http://blog.csdn.net/u013412535/article/details/43462537 ETL,是英文 Extract-Transform-Load 的缩写,用来 ...
- 【转】Spring Boot干货系列:(一)优雅的入门篇
转自Spring Boot干货系列:(一)优雅的入门篇 前言 Spring一直是很火的一个开源框架,在过去的一段时间里,Spring Boot在社区中热度一直很高,所以决定花时间来了解和学习,为自己做 ...
随机推荐
- iframe跨域,获取iframe中元素
1.需求让iframe嵌入页面,并且没有滚动条,也就是相当于两个页面拼接在一起 跨域解决,通过框架配置代理 proxy: { '/medical': { target: 'https://exampl ...
- ACK One 构建应用系统的两地三中心容灾方案
简介:本文侧重介绍了通过 ACK One 的多集群应用分发功能,可以帮助企业管理多集群环境,通过多集群主控示例提供的统一的应用下发入口,实现应用的多集群分发,差异化配置,工作流管理等分发策略.结合 ...
- 揭秘sealer背后实现整个集群一键交付的奥秘 | 龙蜥技术
简介:解读集群镜像"开箱即用"神器--sealer! 编者按:集群镜像把整个集群看成一台服务器,把 k8s 看成云操作系统,实现整个集群的镜像化打包和交付,为企业级软件提供一种& ...
- 浅谈分布式一致性:Raft 与 SOFAJRaft
简介: SOFAJRaft已开源 作者 | 家纯来源 | 阿里技术公众号 一 分布式共识算法 (Consensus Algorithm) 1 如何理解分布式共识? 多个参与者针对某一件事达成完全一致: ...
- [Gin] gin-jwt 业务逻辑中使用实例化的 middleware 的方式
依然需要按文档所示实例化一个 authMiddleware. 在路由组中使用的方式是 authMiddleware.MiddlewareFunc(). 通过追踪 MiddlewareFunc 可以知道 ...
- 使用 DISM 安全清理 C 盘 WinSxS 文件夹空间
本文将介绍如何使用系统内置 DISM 工具进行安全清理 C 盘空间,清理 WinSxS 文件夹里面的可回收删除的程序包空间 开始之前,先使用管理员权限打开 CMD 或 PowerShell 命令行窗口 ...
- openpyxl模块操作Excel
1.openpyxl模块了解 1.excel版本问题 03版本之前的excel文件后缀名xls 03版本之后的excel文件后缀名xlsx 2.python操作excel表格的模块 openpyxl ...
- 我的 Kafka 旅程 - 概念 · 特点 · 组成 · 模式 · 应用
系列目录 我的 Kafka 旅程 - 概念 · 特点 · 组成 · 模式 · 应用 我的 Kafka 旅程 - Linux下的安装 · 基础命令 · 集群 我的 Kafka 旅程 - Producer ...
- CCE云原生混部场景下的测试案例
本文分享自华为云社区<CCE云原生混部场景下在线任务抢占.压制离线任务CPU资源.保障在线任务服务质量效果测试>,作者:可以交个朋友. 背景 企业的 IT 环境通常运行两大类进程,一类是在 ...
- vim简明文档
替换 替换当前行第一个 :s/vivian/sky/ 替换当前行第一个 vivian 为 sky 从当前行替换到最后一行 :%s/vivian/sky/g 替换所有行中 vivian 为 sky 查找 ...