Filebeat + Redis 管理 LOG日志实践

小赵营 关注

2019.01.06 17:52* 字数 1648 阅读 24评论 0喜欢 2

引用 转载 请注明出处

某早上,领导怒吼声远远传来,空空的办公区放大吼声的“狰狞”程度。“xxxxxx ... ...重量级的日志管理工具不能用,xxxx不代表要自己造轮子。拥抱开源不只是口号,xxxx 要行动啊。... ...”

伴着少儿不宜哔哔哔声音,我开启了探索轻量级开源日志管理工具航程。Filebeat等一干开源日志管理软件进入我的视野。所有说:别人的愤怒时刻,也许是你发现新大陆开端。

之前提到的开源日志管理工具对比文章,本文适用于轻量级应用的日志管理。准确点说:如何使用Filebeat将java服务生成log采集到redis服务里。

Filebeat简介

Filebeat是elastic公司Beats平台系列产品中的一个日志采集、入库、路由工具。官方提供功能列表:

 
Filebeat introduction

简言之,Filebeat简化日志采集流程完美接入数据库轻量级的开源产品。轻量级符合我们期望,支持redis库兼容我们当前服务,因此是我们的选择。

本文是一篇教程,分为三部分:安装、配置、运行。我们以这个顺序进行介绍。注:因实施场景原因,Filebeat参数只涉及一部分。

关于版本说明

软件版本号:

  1. Filebeat 6.5 (发布版)
  2. Linux x86_64 x86_64 GNU/Linux(os版本)
  3. redis_version: 5.0.0 (redis使用单节点模式,对可用性要求高要采用集群或sentinel模式)

如何安装

Filebeat可安装在主流的OS上,也支持docker、k8s方式进行部署,是典型的“麻雀虽小五脏俱全”的工具。

下载传送门

linux下安装包是gz的压缩包。解压即安装:

tar xzvf filebeat-5.1.1-darwin-x86_64.tar.gz

 
安装目录一览

让我们分别介绍目录的功能:

  • data 存储Filebeat实例的uuid号,以及日志读取历史记录。

  • kibana 接入kibana时,其提供可视化配置功能

  • logs Filebeat 运行日志

  • module module.d 配置参数:用于快速启动功能

  • fields.yml Filebeat提供针对不同组件,采集的参数名称 类型等

  • filebeat 可执行文件

  • filebeat.reference.yml Filebeat支持的参数手册,所有支持配置参数都在这

  • filebeat.yml 启动Filebeat需要配置文件。后面我们会重点解析

如何配置

下面描述如何怎样配置,以及配置什么的问题。

  1. Filebeat如何配置?
    它提供三种配置方式:

    • Kibana 。它提供Filebeat参数配置界面。和其它管理功能。只是需要引入Kibana组件。
    • Filebeat提供默认配置模块,调用命令可以完成配置
    • 按需手动配置文件 filebeat.yml。程序猿喜欢的姿势,也是我们认知软件必经之路。我们以这种方式开始。
  2. Filebeat配置哪些参数?

    A.我们先说运行必须的、最小配置参数:

    • 配置输入数据类型(log-back生成的log)
filebeat.inputs:
- type: log #采集的数据格式 log
enabled: true #激活log采集功能
paths: #采集路径
- /var/log/*.log
- /var/path2/*.log

注: 配置文件格式是yaml语言写成,一种置标语言类似json

  • 配置输出数据参数
output.redis:
hosts: ["localhost"] #单机版 redis
port: 6379 #port
password: "my_password" #用户名和密码
key: "filebeat" # filebeat是数据的key
db: 0 #数据写入的库

以上配置实现日志导入Redis的基本配置了。Filebeat又有哪些特殊参数?如何实现特色的需求哪?这些在其它配置中一一说明。

B. 其它配置说明

Filebeat输出数据的格式是json。类似这样:

{
"@timestamp": "2018-12-18T08:33:01.604Z", #采集时间 UTC
"@metadata": {....}, #描述beat的信息
"message": "日志内容", ### 数据主体
"source": "/var/log/run.log", #数据来源
"prospector": { "type": "log"},
"input": {"type": "log" }, #数据类型
"beat": {.... },
"host": {.... }, #系统信息 ip 系统版本 名称等
"offset": 244 #偏移
}

输出数据格式除包含数据主体message外,还包括部分附加信息。对于不需要信息,如何进行过滤和转换哪?这涉及Filebeat不算强大的数据过滤功能。

  • Filebeat数据过滤

    • 过滤内容

      exclude_lines: ['^INFO'] #exclude_lines关键字排除包含内容INFO
      include_lines: ['^ERR', '^WARN']
      exclude_files: ['.gz/pre>] #排查压缩文件
      multiline.pattern: ^\[ #内容拼接,用户异常堆栈输出多行 拼接成一条
      过滤内容和内容拼接,需要日志的格式是json,否则不生效
  • 过滤json中输出字段

Filebeat提供类似管道功能的处理器(processors),来指定生成字段,如下形式。

event -> filter1 -> event1 -> filter2 ->event2 ...

每次数据采集是一个事件,每个filter是一个处理器。让我们自己定义一个处理器,如下:

processors:
- drop_fields:
when:
has_fields: ['source']
fields: ["input_type"]

功能:过滤器功能删除字段(drop_fields),条件是当存在source字段时,删除input_type字段。

更多Filebeat处理器和过滤器:链接

  • 新增字段和列
fields: #字段的类型可以是不同类型或者 list,也可以自定义
level: debug
review: 1
selfDefine: xxxxx

官方文档提示fields 可以用来过滤 json文件,但我尝试没有成功

  • Redis Key 如何设计

Filebeat提供有限度自定义redis key的功能。如果输入数据是json格式,可以提取Json的字段作为redis的key。我们的key的定义是数据入库时间。配置如下:

            when.contains:
message: "INFO"
key: "debug_list" # send to debug_list if `message` field contains DEBUG

令人遗憾是:时间不是北京时间,而是UTC时间。即不支持修改,且时间输出有错误。

  • 日志文件扫描参数
max_bytes: 10485760  #10M 缓存层,一次采集数据超出10M 数据会丢弃
harvester_buffer_size: 16384 #收割器大小
scan_frequency: 10s #文件扫描频率
harvester_limit: 0 #采集器数量, 0 表示无限制
close_inactive: 5m #5m 无活动,关闭采集器

使用配置过程也表明:Filebeat易于配置和使用、过滤和转换功能稍显单一的组件。和logstash相比,各有侧重,但对于大多数采集层而言已然够用。

如何启动

./filebeat -e #简单到让人发指启动命令

后记和求助

Filebeat+ redis实践过程完毕,我们发现作为配置非常简单。甚至不需要关注输入段内容、以及输出端的redis,这才是中间件应有的样子。

Filebeat不足输出端支持的数据库太少,社区也没有计划支持更多的数据库。

最近在看golang,萌生了写一个输出到postgres插件的想法。
如果开发输出到postgres插件,有什么思路,希望各位路过的大侠指点一二。感激不尽。。

https://www.jianshu.com/p/29ec43327744

转 -Filebeat + Redis 管理 LOG日志实践的更多相关文章

  1. filebeat+redis+logstash+elasticsearch+kibana搭建日志分析系统

    filebeat+redis+elk搭建日志分析系统 官网下载地址:https://www.elastic.co/downloads 1.下载安装filebeat wget https://artif ...

  2. Atitit.log日志技术的最佳实践attilax总结

    Atitit.log日志技术的最佳实践attilax总结 1. 日志的意义与作用1 1.1. 日志系统是一种不可或缺的单元测试,跟踪调试工具1 2. 俩种实现[1]日志系统作为一种服务进程存在 [2] ...

  3. ElasticSearch+Logstash+Filebeat+Kibana集群日志管理分析平台搭建

    一.ELK搜索引擎原理介绍 在使用搜索引擎是你可能会觉得很简单方便,只需要在搜索栏输入想要的关键字就能显示出想要的结果.但在这简单的操作背后是搜索引擎复杂的逻辑和许多组件协同工作的结果. 搜索引擎的组 ...

  4. ELK+filebeat+redis 日志分析平台

    一.简介 ELK Stack是软件集合Elasticsearch.Logstash.Kibana的简称,由这三个软件及其相关的组件可以打造大规模日志实时处理系统. 其中,Elasticsearch 是 ...

  5. android的Log日志打印管理工具类(一)

    android的Log日志的打印管理工具类: package com.gzcivil.utils; import android.util.Log; /** * 日志打印管理 * * @author ...

  6. ELK+redis搭建nginx日志分析平台

    ELK+redis搭建nginx日志分析平台发表于 2015-08-19   |   分类于 Linux/Unix   |  ELK简介ELKStack即Elasticsearch + Logstas ...

  7. php版redis插件,SSDB数据库,增强型的Redis管理api实例

    php版redis插件,SSDB数据库,增强型的Redis管理api实例 SSDB是一套基于LevelDB存储引擎的非关系型数据库(NOSQL),可用于取代Redis,更适合海量数据的存储.另外,ro ...

  8. ELK Stack (2) —— ELK + Redis收集Nginx日志

    ELK Stack (2) -- ELK + Redis收集Nginx日志 摘要 使用Elasticsearch.Logstash.Kibana与Redis(作为缓冲区)对Nginx日志进行收集 版本 ...

  9. ELK之filebeat替代logstash收集日志

    filebeat->redis->logstash->elasticsearch 官网下载地址:https://www.elastic.co/downloads/beats/file ...

随机推荐

  1. 【区块链】【一】Hash 算法【转】

    问题导读1.哈希算法在区块链的作用是什么?2.什么是哈希算法?3.哈希算法是否可逆?4.比特币采用的是什么哈希算法? 作用在学习哈希算法前,我们需要知道哈希在区块链的作用哈希算法的作用如下:区块链通过 ...

  2. openstack网络基础:网络叠加模式VLAN、VxLAN、GRE

    什么是叠加网络1.一个数据包(或帧)封装在另一个数据包内;被封装的包转发到隧道端点后再被拆装.2.叠加网络就是使用这种所谓“包内之包”的技术安全地将一个网络隐藏在另一个 网络中,然后将网络区段进行迁移 ...

  3. java高级-动态注入替换类Instrumentation

    介绍 利用java.lang.instrument(容器类) 做动态 Instrumentation(执行容器) 是 Java SE 5 的新特性. 使用 Instrumentation,开发者可以构 ...

  4. Google Closure Compiler高级压缩混淆Javascript代码

    一.背景 前端开发中,特别是移动端,Javascript代码压缩已经成为上线必备条件. 如今主流的Js代码压缩工具主要有: 1)Uglify http://lisperator.net/uglifyj ...

  5. vue.js实战——计算属性

    1set和get: 注意: this.lastName=names[names.length-1];//解决连续输入空格后lastName消失的问题 练习代码如下: <!DOCTYPE html ...

  6. Bugku 杂项 眼见非实

    把文件放进Kali中可以看到这是一个zip文件,解压后得到一个docx,继续翻 (在windows中是打不开的 在word/document.xml中可以找到flag

  7. 金融量化之Tushare模块

    一.介绍 Tushare是一个免费.开源的python财经数据接口包.主要实现对股票等金融数据从数据采集.清洗加工 到 数据存储的过程,能够为金融分析人员提供快速.整洁.和多样的便于分析的数据,为他们 ...

  8. openstack——删除网络

    #!/bin/bash #delete vm for vim in `nova list |awk '{if( NR > 2 ) {print $2}}'`;do nova delete $vi ...

  9. jmeter5.1测试websocket接口

    jmeter没有websocket协议的取样器,需要我们自己开发,但是网上已经有大神先开发好了,[相关jar包,点击左侧加群获取] 只需要放到jmeter的ext目录(D:\apache-jmeter ...

  10. Python并发编程之IO模型

    目录 IO模型介绍 阻塞IO(blocking IO) 非阻塞IO(non-blocking IO) IO多路复用 异步IO IO模型比较分析 selectors模块 一.IO模型介绍 Stevens ...