log4j2 输入日志到flume

最近想将服务的运行日志收集起来，首先了解到flume技术栈

采用flume方案定了之后有两种方式实现

1: 在应用中，log4j2直接发送日志信息到flume ，

2: 通过监控log4j2 产生的日志文件，将日志文件新产生的日志发送到flume

下面两种方式都会介绍，首先透漏下我们选择的解决方案，我们选择了第二种监控新产生的日志文件

为什么这么选择：

第一种方式需要修改服务中log4j2的配置，添加flume Appender , 在应用中，当日志输出时，就会输出到flume，很显然，这种方式耦合了应用，并且对应用的性能有影响，到底有多大影响，这个还没有测试，其次，这种方式应用中依赖了flume的依赖，假如将来部署服务的时候不想收集日志了，会不会对项目的启动有影响，这一点也还没有验证，后续可能会验证

第二种方式完全是监控日志文件，当产生新的日志文件或者日志文件中生成新的日志时，就会触发日志收集。完全脱离应用存在。

我们介绍第二种方式的探索过程：
需求：当日志目录下产生新的文件或动态产生日志时，收集日志，发送到flume

接下来了解flume能不能解决我们的需求：

flume 入门相关概念：

source：

channel:

sink ;

source 中有很多分类，我们着重分析了几个的使用场景和特点

execSource :

spooldirSource :

taildirSource:

syslogSource ;

httpSource ;

经过分析每种Source的特点，很容易发现tailSource最接近我们的需求：

但是也有几个问题：

1：log4j2产生日志的逻辑是当日志文件内容达到设置的size上限就会重命名该日志文件（例如：sysware-2018-12-20-1.log）,然后新建一个sysware.log文件，供日志输出，重命名日志之后，和原来的sysware.log日志文件全路径不一致，taildirSource会当做一个新的日志文件，再次重复读取，造成重复读取的问题

2：dirSource监控的dir 可以指定文件名称或者通过正则，但是如果已经有子文件夹的日志读取不到

上面的问题只能通过源码方式解决了

XXXXXX

所有的准备工作都做好了，我们现在开始做一个demo

XXXX

log4j2 输入日志到flume的更多相关文章

海量日志采集Flume(HA)
海量日志采集Flume(HA) 1.介绍: Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集.聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据 ...
VisualSVN设置提交时必须输入日志信息
VisualSVN设置提交时必须输入日志信息 1.svn提交时强制输入提交信息为了阻止SVN提交空日志信息和垃圾文件可以在SVN服务器端强制必须填写日志信息,这时需用到pre-commit钩子脚本. ...
log4j2设置日志文件读写权限（filePermissions）
spring-boot使用log4j2作为日志插件的时候需要设置日志文件的读写权限,可以File 上增加filePermissions,如: <File name="File" ...
消费滚动滴log日志文件(flume监听,kafka消费,zookeeper协同)
第一步:数据源手写程序实现自动生成如下格式的日志文件: 15837312345,13737312345,2017-01-09 08:09:10,0360 打包放到服务器,使用如下命令执行,模拟持续不 ...
log4j2 扩展日志级别,支持将系统日志与业务处理日志拆分
项目中,有时候需要对系统中已处理的一些业务数据日志进行提取分析,通常log4j默认提供的日志级别可能不够用,这时候我们就需要对日志级别进行扩展,以满足我们的需求. 本文就简单介绍一下log4j2的日志 ...
log4j输出日志到flume
现需要通过log4j将日志输出到flume,通过flume将日志写到文件或hdfs中配置flume-config文件将日志下沉至文件 a1.sources = r1 a1.sinks = k1 a ...
log4j2异步日志解读（二）AsyncLogger
前文已经讲了log4j2的AsyncAppender的实现[log4j2异步日志解读(一)AsyncAppender],今天我们看看AsyncLogger的实现. 看了这个图,应该很清楚AsyncLo ...
SpringBoot整合log4j2进行日志配置及防坑指南
写在前面最近项目经理要求将原先项目中的日志配置logBack,修改为log4j2,据说是log4j2性能更优于logback,具体快多少,网上有说快10多倍,看来还是很快的,于是新的一波挑战又开始了 ...
普通Java项目中使用Sl4j+Log4j2打印日志
因工作需要,采用JavaFx开发了一个windows窗口程序.在开发过程中,由于没有引入日志框架,只能自己手动在控制台打印些信息,给调试带来了很多麻烦:因此决定引入日志框架.由于之前接触的项目 ...

随机推荐

spark[源码]-任务调度源码分析[三]
前言在上一篇文章中,我主要是讲解了DAG阶段的处理,spark是如何将一个job根据宽窄依赖划分出多个stage的,在最后一步中是将生成的TaskSet提交给了TaskSchedulerInmpl的 ...
进度条Demo
package threadAndRunnable; import java.awt.BorderLayout; import javax.swing.JFrame; import javax.swi ...
ARKit 研究笔记一
软件需求:Xcode9.x .blender 硬件需求:iphone 6s + 系统:iOS 11 + 技能储备: ARKit .SceneKit(苹果提供的3d游戏库) 或 SpriteKit(苹果 ...
WWDC 2017 苹果开发者大会
1.更新了系统固件 iOS 11 macOS High Sierra watchOS 4 tvOS 11 2.更新了硬件以及新设备升级了 iMac 以及 iMac Pro 升级了 MacBook ...
hashmap总结2
1. 关于HashMap的一些说法: a) HashMap实际上是一个“链表散列”的数据结构,即数组和链表的结合体.HashMap的底层结构是一个数组,数组中的每一项是一条链表. b) Hash ...
20145211《网络渗透》msf辅助模块的应用
20145211<网络渗透>msf辅助模块的应用一.实验准备启用VB的kali,需要用到桥接,VMware桥接总是罢工…… 二.实验步骤最好开桥接模式,要不然你就多开几个虚拟机(只要 ...
shell编程(二)
case判断前面了解了shell编程的if判断,其实除了if判断,还有case判断. case语法: case VAR in case1) command1 ;; case2) command2 ; ...
关于JavaScript对象中的一切（二） -- 继承
先上一张我制作的思维导图.
4.9版本的linux内核中实时时钟芯片pt7c4338的驱动源码在哪里
答:drivers/rtc/rtc-ds1307.c,内核配置项为CONFIG_RTC_DRV_DS1307 Location: -> Device Drivers -> Real Tim ...
基于Redis的限流系统的设计
本文讲述基于Redis的限流系统的设计,主要会谈及限流系统中限流策略这个功能的设计:在实现方面,算法使用的是令牌桶算法来,访问Redis使用lua脚本. 1.概念 In computer netw ...

log4j2 输入日志到flume

log4j2 输入日志到flume的更多相关文章

随机推荐

热门专题