Flume拦截器、监控器

一、拦截器

1、拦截器：拦截器主要作用在source和channel之间，用于给event设置header消息头，如果没有设置拦截器，则event中只有message。

常见的拦截器有：

Timestamp Interceptor 时间拦截器：将时间戳插入到header中。

Host Interceptor 主机拦截器：将服务器的ip地址或者主机名插入到header中。

Regex Filtering Interceptor 正则过滤拦截器：过滤掉不需要的日志。

https://blog.csdn.net/jinywum/article/details/82598947

2、自定义拦截器：主要目的就是给日志进行分类，自定义拦截器为每个event设置header，header里标志着日志的类型。当数据传输到kafka就可以根据header知道这个日志属于哪个类型，从而通过消息的内容对日志进行路由。

自定义拦截器操作：

a、在项目pom文件中引入flume依赖

b、找到现有的TimestampInterceptor类，copy代码到自己的自定义类里，按照需求进行修改。

c、将项目打成jar包，修改名字为app_logs_flume.jar，然后放到/opt/module/flume/lib目录下。

d、在flume配置文件指定拦截器类型。

a1.sources.r1.interceptors = i1

a1.sources.r1.interceptors.i1.type = 自定义类全类名

https://blog.csdn.net/u012443641/article/details/80757229

二、监控器

1、监控器

监控器可以看到：

source尝试写入channel中的event数量，成功写入且提交的event数量；

sink尝试从channel中拉取的event数量，成功读取的事件数量；

channel相关信息，例如：启动时间，停止时间，目前的event总数，容量，占用百分比

Flume拦截器、监控器的更多相关文章

Flume 拦截器(interceptor)详解
flume 拦截器(interceptor)1.flume拦截器介绍拦截器是简单的插件式组件,设置在source和channel之间.source接收到的事件event,在写入channel之前,拦截 ...
大数据学习——flume拦截器
flume 拦截器(interceptor)1.flume拦截器介绍拦截器是简单的插件式组件,设置在source和channel之间.source接收到的事件event,在写入channel之前,拦截 ...
flume【源码分析】分析Flume的拦截器
h2 { color: #fff; background-color: #7CCD7C; padding: 3px; margin: 10px 0px } h3 { color: #fff; back ...
flume中的拦截器
Flume中的拦截器(interceptor),用户Source读取events发送到Sink的时候,在events header中加入一些有用的信息,或者对events的内容进行过滤,完成初步的数据 ...
Hadoop生态圈-Flume的组件之自定义拦截器（interceptor）
Hadoop生态圈-Flume的组件之自定义拦截器(interceptor) 作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 本篇博客只是举例了一个自定义拦截器的方法,测试字节传输速 ...
Hadoop生态圈-Flume的组件之拦截器与选择器
Hadoop生态圈-Flume的组件之拦截器与选择器作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 本篇博客只是配置的是Flume主流的Interceptors,想要了解更详细 ...
Flume自定义拦截器（Interceptors）或自带拦截器时的一些经验技巧总结（图文详解）
不多说,直接上干货! 一.自定义拦截器类型必须是:类全名$内部类名,其实就是内部类名称如:zhouls.bigdata.MySearchAndReplaceInterceptor$Builder 二 ...
第1节 flume：15、flume案例二，通过自定义拦截器实现数据的脱敏
1.7.flume案例二案例需求: 在数据采集之后,通过flume的拦截器,实现不需要的数据过滤掉,并将指定的第一个字段进行加密,加密之后再往hdfs上面保存原始数据与处理之后的数据对比图一 ...
第1节 flume：13、14、更多flume案例一，通过拦截器实现不同类型的数据区分
1.6.flume案例一 1. 案例场景 A.B两台日志服务机器实时生产日志主要类型为access.log.nginx.log.web.log 现在要求: 把A.B 机器中的access.log.ng ...

随机推荐

python实战项目 — selenium登陆豆瓣
利用selenium 模仿浏览器,登陆豆瓣重点: 1. 要设置好 chromedriver配置与使用, chromedriver.exe 和 Chrome的浏览器版本要对应, http://chro ...
Python属性的查找顺序
属性查找顺序关于属性描述符请看上文>属性描述符在梳理属性查找相关知识时,查看了很多的书籍和他人的博客,发现很多讲的过于抽象,并没有一个清晰的流程呈现.特此写下我对于此方面的理解和总结. ...
【Linux】一步一步学Linux——初识Linux命令解析器(10)
目录 00. 目录 01. Shell简介 02. Shell分类 03. 交互式shell和非交互式shell 04. 登录shell和非登录shell 05. Shell类型 06. 参考 00. ...
Navicat12下载、激活工具、激活教程
Navicat12的下载地址如下:链接: https://pan.baidu.com/s/11CHIWO74M4-P6UG0aWsF7Q 提取码: bayk 打开激活工具Navicat_Keygen_ ...
idea单行注释优化成不在行首注释
docker 入坑3
查看镜像 docker images [OPTIONS] [REPOSITORY[:TAG]] -a, --all=false -f, --filter=[] --no-trunc=false -q, ...
DuplexChannel
[ServiceContract(Namespace = "http://xx.com", CallbackContract = typeof(Ipub_c))] public i ...
NEST search查询
/// <summary> /// GET /megacorp/employee/_search /// </summary> /// <returns></ ...
js点击按钮复制内容到粘贴板
复制内容到粘贴板,就是要选择需要复制的内容并执行document.execCommand("copy")命令: //复制内容到粘贴板 function copyToClipboar ...
微信web开发问题记录
问题一.微信浏览器中无法使用reload重载文档[VUE框架] 问题分析: 微信不支持location.reload()方法,在微信浏览器中会失效 Vue中的路由跳转是类似于ajax局部刷新,因此使用 ...

Flume拦截器、监控器

Flume拦截器、监控器的更多相关文章

随机推荐

热门专题