转 -Filebeat + Redis 管理 LOG日志实践
Filebeat + Redis 管理 LOG日志实践
引用 转载 请注明出处
某早上,领导怒吼声远远传来,空空的办公区放大吼声的“狰狞”程度。“xxxxxx ... ...重量级的日志管理工具不能用,xxxx不代表要自己造轮子。拥抱开源不只是口号,xxxx 要行动啊。... ...”
伴着少儿不宜哔哔哔声音,我开启了探索轻量级开源日志管理工具航程。Filebeat等一干开源日志管理软件进入我的视野。所有说:别人的愤怒时刻,也许是你发现新大陆开端。
之前提到的开源日志管理工具对比文章,本文适用于轻量级应用的日志管理。准确点说:如何使用Filebeat将java服务生成log采集到redis服务里。
Filebeat简介
Filebeat是elastic公司Beats平台系列产品中的一个日志采集、入库、路由工具。官方提供功能列表:

简言之,Filebeat简化日志采集流程,完美接入数据库,轻量级的开源产品。轻量级符合我们期望,支持redis库兼容我们当前服务,因此是我们的选择。
本文是一篇教程,分为三部分:安装、配置、运行。我们以这个顺序进行介绍。注:因实施场景原因,Filebeat参数只涉及一部分。
关于版本说明
软件版本号:
- Filebeat 6.5 (发布版)
- Linux x86_64 x86_64 GNU/Linux(os版本)
- redis_version: 5.0.0 (redis使用单节点模式,对可用性要求高要采用集群或sentinel模式)
如何安装
Filebeat可安装在主流的OS上,也支持docker、k8s方式进行部署,是典型的“麻雀虽小五脏俱全”的工具。
linux下安装包是gz的压缩包。解压即安装:
tar xzvf filebeat-5.1.1-darwin-x86_64.tar.gz

让我们分别介绍目录的功能:
data存储Filebeat实例的uuid号,以及日志读取历史记录。kibana接入kibana时,其提供可视化配置功能logsFilebeat 运行日志modulemodule.d配置参数:用于快速启动功能fields.ymlFilebeat提供针对不同组件,采集的参数名称 类型等filebeat可执行文件filebeat.reference.ymlFilebeat支持的参数手册,所有支持配置参数都在这filebeat.yml启动Filebeat需要配置文件。后面我们会重点解析
如何配置
下面描述如何怎样配置,以及配置什么的问题。
Filebeat如何配置?
它提供三种配置方式:- Kibana 。它提供Filebeat参数配置界面。和其它管理功能。只是需要引入Kibana组件。
- Filebeat提供默认配置模块,调用命令可以完成配置
- 按需手动配置文件
filebeat.yml。程序猿喜欢的姿势,也是我们认知软件必经之路。我们以这种方式开始。
Filebeat配置哪些参数?
A.我们先说运行必须的、最小配置参数:
- 配置输入数据类型(log-back生成的log)
filebeat.inputs:
- type: log #采集的数据格式 log
enabled: true #激活log采集功能
paths: #采集路径
- /var/log/*.log
- /var/path2/*.log
注: 配置文件格式是yaml语言写成,一种置标语言类似json
- 配置输出数据参数
output.redis:
hosts: ["localhost"] #单机版 redis
port: 6379 #port
password: "my_password" #用户名和密码
key: "filebeat" # filebeat是数据的key
db: 0 #数据写入的库
以上配置实现日志导入Redis的基本配置了。Filebeat又有哪些特殊参数?如何实现特色的需求哪?这些在其它配置中一一说明。
B. 其它配置说明
Filebeat输出数据的格式是json。类似这样:
{
"@timestamp": "2018-12-18T08:33:01.604Z", #采集时间 UTC
"@metadata": {....}, #描述beat的信息
"message": "日志内容", ### 数据主体
"source": "/var/log/run.log", #数据来源
"prospector": { "type": "log"},
"input": {"type": "log" }, #数据类型
"beat": {.... },
"host": {.... }, #系统信息 ip 系统版本 名称等
"offset": 244 #偏移
}
输出数据格式除包含数据主体message外,还包括部分附加信息。对于不需要信息,如何进行过滤和转换哪?这涉及Filebeat不算强大的数据过滤功能。
Filebeat数据过滤
过滤内容
exclude_lines: ['^INFO'] #exclude_lines关键字排除包含内容INFO
include_lines: ['^ERR', '^WARN']
exclude_files: ['.gz/pre>] #排查压缩文件
multiline.pattern: ^\[ #内容拼接,用户异常堆栈输出多行 拼接成一条
过滤内容和内容拼接,需要日志的格式是json,否则不生效
过滤json中输出字段
Filebeat提供类似管道功能的处理器(processors),来指定生成字段,如下形式。
event -> filter1 -> event1 -> filter2 ->event2 ...
每次数据采集是一个事件,每个filter是一个处理器。让我们自己定义一个处理器,如下:
processors:
- drop_fields:
when:
has_fields: ['source']
fields: ["input_type"]
功能:过滤器功能删除字段(drop_fields),条件是当存在source字段时,删除input_type字段。
更多Filebeat处理器和过滤器:链接
- 新增字段和列
fields: #字段的类型可以是不同类型或者 list,也可以自定义
level: debug
review: 1
selfDefine: xxxxx
官方文档提示fields 可以用来过滤 json文件,但我尝试没有成功。
- Redis Key 如何设计
Filebeat提供有限度自定义redis key的功能。如果输入数据是json格式,可以提取Json的字段作为redis的key。我们的key的定义是数据入库时间。配置如下:
when.contains:
message: "INFO"
key: "debug_list" # send to debug_list if `message` field contains DEBUG
令人遗憾是:时间不是北京时间,而是UTC时间。即不支持修改,且时间输出有错误。
- 日志文件扫描参数
max_bytes: 10485760 #10M 缓存层,一次采集数据超出10M 数据会丢弃
harvester_buffer_size: 16384 #收割器大小
scan_frequency: 10s #文件扫描频率
harvester_limit: 0 #采集器数量, 0 表示无限制
close_inactive: 5m #5m 无活动,关闭采集器
使用配置过程也表明:Filebeat易于配置和使用、过滤和转换功能稍显单一的组件。和logstash相比,各有侧重,但对于大多数采集层而言已然够用。
如何启动
./filebeat -e #简单到让人发指启动命令
后记和求助
Filebeat+ redis实践过程完毕,我们发现作为配置非常简单。甚至不需要关注输入段内容、以及输出端的redis,这才是中间件应有的样子。
Filebeat不足输出端支持的数据库太少,社区也没有计划支持更多的数据库。
最近在看golang,萌生了写一个输出到postgres插件的想法。
如果开发输出到postgres插件,有什么思路,希望各位路过的大侠指点一二。感激不尽。。
https://www.jianshu.com/p/29ec43327744
转 -Filebeat + Redis 管理 LOG日志实践的更多相关文章
- filebeat+redis+logstash+elasticsearch+kibana搭建日志分析系统
filebeat+redis+elk搭建日志分析系统 官网下载地址:https://www.elastic.co/downloads 1.下载安装filebeat wget https://artif ...
- Atitit.log日志技术的最佳实践attilax总结
Atitit.log日志技术的最佳实践attilax总结 1. 日志的意义与作用1 1.1. 日志系统是一种不可或缺的单元测试,跟踪调试工具1 2. 俩种实现[1]日志系统作为一种服务进程存在 [2] ...
- ElasticSearch+Logstash+Filebeat+Kibana集群日志管理分析平台搭建
一.ELK搜索引擎原理介绍 在使用搜索引擎是你可能会觉得很简单方便,只需要在搜索栏输入想要的关键字就能显示出想要的结果.但在这简单的操作背后是搜索引擎复杂的逻辑和许多组件协同工作的结果. 搜索引擎的组 ...
- ELK+filebeat+redis 日志分析平台
一.简介 ELK Stack是软件集合Elasticsearch.Logstash.Kibana的简称,由这三个软件及其相关的组件可以打造大规模日志实时处理系统. 其中,Elasticsearch 是 ...
- android的Log日志打印管理工具类(一)
android的Log日志的打印管理工具类: package com.gzcivil.utils; import android.util.Log; /** * 日志打印管理 * * @author ...
- ELK+redis搭建nginx日志分析平台
ELK+redis搭建nginx日志分析平台发表于 2015-08-19 | 分类于 Linux/Unix | ELK简介ELKStack即Elasticsearch + Logstas ...
- php版redis插件,SSDB数据库,增强型的Redis管理api实例
php版redis插件,SSDB数据库,增强型的Redis管理api实例 SSDB是一套基于LevelDB存储引擎的非关系型数据库(NOSQL),可用于取代Redis,更适合海量数据的存储.另外,ro ...
- ELK Stack (2) —— ELK + Redis收集Nginx日志
ELK Stack (2) -- ELK + Redis收集Nginx日志 摘要 使用Elasticsearch.Logstash.Kibana与Redis(作为缓冲区)对Nginx日志进行收集 版本 ...
- ELK之filebeat替代logstash收集日志
filebeat->redis->logstash->elasticsearch 官网下载地址:https://www.elastic.co/downloads/beats/file ...
随机推荐
- Linux内存管理 (4)分配物理页面
专题:Linux内存管理专题 关键词:分配掩码.伙伴系统.水位(watermark).空闲伙伴块合并. 我们知道Linux内存管理是以页为单位进行的,对内存的管理是通过伙伴系统进行. 从Linux内存 ...
- C语言中可变参数的函数(三个点,“...”)
C语言中可变参数的函数(三个点,“...”) 本文主要介绍va_start和va_end的使用及原理. 在以前的一篇帖子Format MessageBox 详解中曾使用到va_start和va_end ...
- jenkins的安装部署
jenkins安装 参考连接: https://wiki.jenkins.io/display/JENKINS/Installing+Jenkins+on+Red+Hat+distributions ...
- Surging1.0发布在即,.NET开发者们,你们还在等什么?
Surging1.0发布在即,.NET开发者们,你们还在等什么? 开源,是近三十年来互联网经久不衰的话题.它不仅仅是一种技术分享的形态,更是一种开放,包容,互利共赢的互联网精神. 不到30年前,大神林 ...
- PostgreSql扩展Sql-动态加载共享库(C函数)
基于 psql (PostgreSQL) 10.4 pg_language表定义了函数实现所使用的语言.主要支持了C语言和SQL语句.一些可选的语言包括pl/pgsql.tcl和perl. ligan ...
- 计算机网络基础知识-OSI七层协议模型
一.物理层 物理层主要规定了物理设备的标准,如网线的类型.光纤的接口类型.各种传输介质的传输速率,物理层的数据以比特流(二进制)的形式存在,传输时将比特流转化为电流强弱,达到目的地之后再转化为比特流. ...
- Linux(Ubuntu)使用日记(七)------终端控制器Terminator安装使用
1.目的 实现分屏效果,如图: 如果使用系统自带的终端,可能会使这种效果: 综上所述,知道我们为什么要安装Terminator了吧. 2.安装过程 Terminator 的安装非常方便,在 Ubunt ...
- DAY10、函数的参数
一.实参:为形参传递值 调用函数时,实参可以由常量,变量,表达式三种的组合 1.位置实参:必须按照位置的顺序,从左到右为形参传递值 fn1(10, 20, 30) fn1(30, 20, 10) 2. ...
- [翻译] .NET Core 2.1 发布
原文: Announcing .NET Core 2.1 我们很高兴可以发布 .NET Core 2.1.这次更新包括对性能的改进,对运行时和工具的改进.还包含一种以 NuGet 包的形式部署工具的新 ...
- js 图片瀑布流效果实现
/** * Created by wwtliu on 14/9/5. */$(document).ready(function(){ $(window).on("load",fun ...