Apache NiFi 开发 处理器使用说明
NIFI的使用:
注意:FlowFile由【属性】和【内容】组成,在解析的过程中这个概念非常重要,因为有些组件操作的是属性,有些组件操作的是内容,在配置组件时Destination配置项的选择很重要,flowfile-content将解析结果放在数据流的内容中替换了原有的内容,flowfile-attribute将解析结果添加到flowfile的属性中,原本的内容不变。根据后续操作的需要,选择处理结果存放的位置。
(一)拖拽组件--选择类型--选择配置
处理器:
①Getfile:配置提取文件路径
②Putfile:配置接收文件路径,勾选failure、success
③SplitJson:拆分json,勾选failure、original
JsonPath Expression:选择json中需要拆分的字段名称,该字段名称中的value为json格式的多条数据,组件会将value中的多条数据拆分成数量相等的数据流,并舍弃拆分字段名称value值之外的所有数据。
Before:{"name": "lkd", "age": [{"max": "99"},{"min": "3"}],"testdata": "lkd"}
Last:{“max”:”99”}
{“min”:”3”}
将age中的两条数据拆分出来了
④PutElasticsearch5:将数据存储到ES中,勾选全部三个选项
ElasticSearch Hosts:配置主机:端口,localhost:9300
Identifier Attribute:标识符属性,选择了系统自动生成的uuid,或许可以使用我们生成的id作为标识,但是暂时没有理清数据的正确格式。能做到简单的通过uuid标识数据成功入库。
Index:索引名称
Type:类型名称
其他的必填参数系统已经自动生成,无需我们填写但是可以修改。
⑤SplitText:将文件按照行分割,Line Split Count参数设置分割步长
⑥AttributeToJson:将流数据的属性转换为json
配置attributes list:添加属性名称,可以将属性名称和属性值拼接为json键值对。
⑦EvaluateXPath组件解析xml文件。
配置选项中Destination选择flow-attribute操作流的节点。
Return Type选择string返回结果为字符串。
添加属性(corpcode),添加属性获取规则(/result/scheme/tool_info/attribute::corpcode)获取xml文件中节点下的属性。
或者(/result/scheme/tool_info)获取xml文件中节点中的内容。
EvaluateXPath组件应用XPath对xml进行操作,关于XPath的具体使用方法参考:http://www.w3school.com.cn/xpath/index.asp
⑧EvaluateXQuery:获取xml中多个节点,并将他们拆分成多个流,基于XQuery表达式语言。
XQuery参考:http://w3school.com.cn/xquery/xquery_example.asp
⑨EvaluateJsonPath:使用jsonpath表达式语言获取json文件的节点和内容。
Jsonpath与XPath的语法结构近似,我没有找到jsonpath的标准参考,在后面列出了一个博客得来的参考内容。
地址:http://www.cnblogs.com/kill0001000/p/4884803.html
⑩添加自定义组件(添加成功但是没有验证自己编写处理逻辑之后对流数据的处理)
1、在source-nifi/nifi-nar-bundles文件夹中添加自定义组件文件夹
例如:nifi-custom-bundle
2、在nifi-custom-bundle中运行mvn archetype:generate命令。
3、找到
source-nifi/nifi-nar-bundles/nifi-custom-bundle/test-processors/nifi-test-processors/src/main/java/test/processors/test/MyProcessor.java文件,修改其中的内容
4、回到test-processors文件夹下运行mvn install编译程序
5、将source-nifi/nifi-nar-bundles/nifi-custom-bundle/test-processors/nifi-test-nar/target/nifi-test-nar-1.0.0.nar文件放到二进制lib文件夹下。
6、重新启动二进制文件,在处理器选择的时候显示了自己添加的组件。
输入端口:创建输入端口,供其他平台调用
输出端口:创建输出端口,将数据流传输到其他平台
标签:添加标签,在标签中写入文本描述
模板:
①保存、上传模板:操作面板中包含启动、停止和保存模板、上传模板。
上传的模板可以在菜单列表中的模板中查看删除和下载。
并且可以在组件中的模板功能组件中放入工作区中。
(二)模块配置:勾选因处理结果不同而流向不同组件的通路。
(三)模块启动:选中组件,可以右键启动或在操作窗口中点击启动。
已经启动的组件使用相同的方式停止。
(四)删除组件:删除的组件必须从组件流的开始端删除,处于中间的组件不能直接删除,或则可以去除组件的两条连接再删除。
可以发邮件给我:1492370189@qq.com
Apache NiFi 开发 处理器使用说明的更多相关文章
- Apache Nifi 开发
Apache NiFi是由美国过国家安全局(NSA)贡献给Apache基金会的开源项目.其设计目标是自己主动化系统间的数据流.基于其工作流式的编程理念.NiFi很易于使用,强大.可靠及高可配置. 两个 ...
- Apache NiFi 开发 安装说明
系统环境: vmware安装的centos6.7虚拟机 jdk1.8版本 maven库3.3.9版本(在使用源码编译启动的时候需要修改配置文件与当前使用的maven版本匹配,最低使用版本好像是3.1. ...
- 初识Apache NiFi
一. NiFi介绍 Apache NiFi支持功能强大且可扩展的数据路由,转换和系统中介逻辑的有向图. Apache NiFi的一些高级功能和目标包括: 基于Web的用户界面 设计,控制,反馈和监控之 ...
- 深入Apache NiFi 之源码学习
前言 要问 Hortonworks 这家公司最有产品力的产品是什么,我觉得是 Apache NiFi.去年Cloudera 和 Hortonworks 合并之后,以 Cloudera 为主,两家公司进 ...
- Apache nifi 第一篇(概述)
1.什么是Apache NiFi? 简单地说,NiFi是为了自动化系统之间的数据流.虽然数据流这种形式很容易理解,但我们在此使用它来表示系统之间的自动化和不同系统之间数据的流转.企业拥有多个系统,其中 ...
- 【NIFI】 Apache NiFI 之 ExecuteScript处理(二)
本例介绍NiFI ExecuteScript处理器的使用,使用的脚本引擎ECMScript 接上一篇[NIFI] Apache NiFI 之 ExecuteScript处理(一) ExecuteScr ...
- 【NIFI】 Apache NiFI 之 ExecuteScript处理(一)
本例介绍NiFI ExecuteScript处理器的使用,使用的脚本引擎ECMScript FlowFile I / O简介 NiFi中的流文件由两个主要组件构成,即属性和内容.属性是关于内容/流文件 ...
- Apache NiFi Processor实战
1 前言 Apache NiFi是什么?NiFi官网给出如下解释:“一个易用.强大.可靠的数据处理与分发系统”.通俗的来说,即Apache NiFi 是一个易于使用.功能强大而且可靠的数据处理和分发系 ...
- Apache 下SVN项目管理使用说明
Apache 下SVN项目管理使用说明 (1)Apaceh和SVN先要装好. (2)在apache的目录下找到httpd.conf文件,在最后一行增加如下配置 Include conf/svn.pro ...
随机推荐
- Android性能优化第(一)篇---基本概念
最近打算总结几篇app性能优化方面的东西,毕竟android弄了这么久,万一到哪些转了行,岁月久了就忘记了,纯粹当个人笔记.今个是第一篇---性能优化的基本概念,毛主席说了,让理论先行,理论指导实践. ...
- EasyMvc入门教程-高级控件说明(17)对话框控件
上一节我们说到的信息框比较简单,如果我们想简单实现用户用户交互,比如常用的锁屏界面,应该如何实现呢?首先看效果: 当用户输入"mxd",后,界面显示如下: 以上效果的实现代码为: ...
- ubuntu 添加用户
sudo useradd 用户名 创建用户 sudo passwd 用户名 修改用户密码 添加sudo权限 sudo usermod -aG sudo(要添加的用户组,也可以是root) 用户名 su ...
- span设置padding无效
<span style="display:inline-block;padding-top:10px">测试<span> 给span加属性 display: ...
- 转: 低延迟系统的Java实践
from: http://blog.csdn.net/jacktan/article/details/41177779 在很久很久以前,如果有人让我用Java语言开发一个低延迟系统,我肯定会用迷茫的 ...
- .NET创建宿主设计器--DesignHost、DesignSurface.
一个窗口在运行时,是这样的: 但是,在设计时,却远比这复杂的多,它需要一个设计器对象:它仅存在于设计时,并连接到运行时存在的对象. 宿主容器 我们可以看到每个窗体和按钮均有与之相关的设计器.这两个 ...
- 解决Linux下AES解密失败
前段时间,用了个AES加密解密的方法,详见上篇博客AES加密解密. 加解密方法在window上測试的时候没有出现不论什么问题.将加密过程放在安卓上.解密公布到Linuxserver的时候,安卓将加密的 ...
- google PLDA + 实现原理及源代码分析
LDA背景 LDA(隐含狄利克雷分布)是一个主题聚类模型,是当前主题聚类领域最火.最有力的模型之中的一个,它能通过多轮迭代把特征向量集合按主题分类. 眼下,广泛运用在文本主题聚类中. LDA的开源实现 ...
- Shell脚本之:字符串
字符串可以用单引号,也可以用双引号,也可以不用引号. 单引号 str='this is a string' 单引号字符串的限制: 1.单引号里的任何字符都会原样输出,单引号字符串中的变量是无效的: 2 ...
- Cardboard虚拟现实开发初步(一)
Google Cardboard 虚拟现实眼镜开发初步(一) 虚拟现实技术简单介绍 不得不说这几年虚拟现实技术逐渐火热,伴随着虚拟现实设备的价格迅速平民化,越来越多的虚拟现实设备来到了我们眼前,也因此 ...