项目需要将日志收集起来做存储分析，数据的流向为rsyslog（收集） -> kafka（消息队列） -> logstash(清理) -> es、hdfs；今天我们先将如何利用rsyslog进行日志收集到kafka。

一、环境准备

通过对 rsyslog官方文档查看,得知 rsyslog对 kafka的支持是 v8.7.0版本后才提供的支持.通过 ChangeLog 也可以看出 V8.X的版本变化.

最新V8稳定版已经提供RPM包的Rsyslog-kafka插件了,直接yum安装即可,添加yum源：

[rsyslog_v8]

name=Adiscon CentOS-$releasever - local packages for $basearch

baseurl=http://rpms.adiscon.com/v8-stable/epel-$releasever/$basearch

enabled=1

gpgcheck=0

gpgkey=http://rpms.adiscon.com/RPM-GPG-KEY-Adiscon

protect=1

添加后 yum install rsyslog rsyslog-kafka.x86_64即可完成安装。

二、配置

1. 处理原则

input submit received messages to rulesets, zero or many
ruleset contains rule, rule consist of a filter and an action list
actions consist of the action call itself (e.g. ”:omusrmsg:”) as well as all action-defining configuration statements ($Action... directives)

2. Statement Types 表达式类型

通常利用RainerScript type statements进行非常简洁明了的配置声明，例如：

mail.info /var/log/mail.log

3. 流程控制

Control structures
过滤条件
1. Selector: 传统方式，格式如下:
  
  <facility>[,facility...][,*].[=,!]<priority>[,priority...][,*];<facility>[,facility...][,*].[=|!]<priority>[,priority...][,*]...
  
  其中默认facility为auth, authpriv, cron, daemon, kern, lpr, mail, mark, news, security (same as auth), syslog, user, uucp and local0 through local7；
  
  默认priority为debug, info, notice, warning, warn (same as warning), err, error (same as err), crit, alert, emerg, panic (same as emerg)；
  
  2） Property-based filters： new filter type. 形式如下：
  
  :property, [!]compare-operation, "value"
  
  分别对应名字，比较符，需要对比的字段。比较符包括 contains, isequal, startswith, regex, ereregex
  
  3） Expression based filters:
  
  if expr then action-part-of-selector-line
2. BSD-style blocks:
3. 例子： if $syslogfacility-text == 'local0' and $msg startswith 'DEVNAME' and not ($msg contains 'error1' or $msg contains 'error0') then /var/log/somelog

4. 数据处理:支持set, unset, reset操作

备注： Only message json (CEE/Lumberjack) properties can be modified by the set, unset andreset statements

5. input

有很多种input模块, 我们以imfile模块为例, 此模块将所有的文本文件内容逐行转到syslog中.

input(type="imfile" tag="kafka" file="analyze.log" ruleset="imfile-kafka"[, Facility=local.7])

6. outputs

也叫作actions，处理动作，格式如下

 action (

        type="omkafka"

        topic="kafka_test"

        broker="10.120.169.149:9092"

    )

7. Rulesets and Rules

Rulesets包括多条rule，一条规则就是rsyslog处理消息的一种方式, 每个规则包含filter和actions

input(type="imfile" tag="kafka" file="analyze.log" ruleset="rulesetname")

ruleset(name="rulesetname") {

    action(type="omfile" file="/path/to/file")

    action(type="..." ...)

    /* and so on... */

}

通过input里面的ruleset配置，将输入流进入ruleset进行规则匹配，然后执行action操作，完成对流的处理。

8. Queue parameters

将不同的输入流进入不同的队列并行处理数据，通常在ruleset或者action中配置，默认只有一个队列。配置参数例子

action(type="omfwd" target="192.168.2.11" port="10514" protocol="tcp"

       queue.filename="forwarding" queue.size="1000000" queue.type="LinkedList"

      )

9. templates

这是rsyslog一个重要的特性，它可以让用户自定义输入流格式，同样也可以用于动态生成日志文件，默认是原始格式。

一般表达式如下：

template(parameters) { list-descriptions }

list : 列表模板，包含name, type="list"，多个constant和property对。

template(name="tpl1" type="list") {

    constant(value="Syslog MSG is: '")

    property(name="msg")

    constant(value="', ")

    property(name="timereported" dateFormat="rfc3339" caseConversion="lower")

    constant(value="\n")

    }

string: 字符串自定义格式模块，由name, type="string", string="<onstant text and replacement variables>"，例如

%TIMESTAMP:::date-rfc3339% %HOSTNAME%%syslogtag%%msg:::sp-if-no-1st-sp%%msg:::drop-last-lf%\n"

将每个日志字段通过自定义变量和处理方式（property replacer）得到全局能读取的日志变量。

注意：

原始格式： v6之前的格式，$template strtpl,"PRI: %pri%, MSG: %msg%\n"。
利用action里的template参数将templates和action进行绑定，如

action(template=TEMPLATENAME,type="omfile" file="/var/log/all-msgs.log")

三. 实例

增加一个将nginx access日志通过rsyslog传输到kafka的实例，将nginx_kafka.conf放入到/etc/rsyslog.d目录中，重启rsyslog即可。

# 加载omkafka和imfile模块

module(load="omkafka")

module(load="imfile")

# nginx template

template(name="nginxAccessTemplate" type="string" string="%hostname%<-+>%syslogtag%<-+>%msg%\n")

# ruleset

ruleset(name="nginx-kafka") {

    #日志转发kafka

    action (

        type="omkafka"

        template="nginxAccessTemplate"

        confParam=["compression.codec=snappy", "queue.buffering.max.messages=400000"]

        partitions.number="4"

        topic="test_nginx"

        broker="10.120.169.149:9092"

        queue.spoolDirectory="/tmp"

        queue.filename="test_nginx_kafka"

        queue.size="360000"

        queue.maxdiskspace="2G"

        queue.highwatermark="216000"

        queue.discardmark="350000"

        queue.type="LinkedList"

        queue.dequeuebatchsize="4096"

        queue.timeoutenqueue="0"

        queue.maxfilesize="10M"

        queue.saveonshutdown="on"

        queue.workerThreads="4"

    )

}

# 定义消息来源及设置相关的action

input(type="imfile" Tag="nginx,aws" File="/var/log/access.log" Ruleset="nginx-kafka")

检查conf文件是否正确可以运行rsyslogd debug模式rsyslogd -dn运行，看日志输出结果，或者直接运行rsyslogd -N 1检查conf文件是否正确。

作者：modeyangg_cs
链接：https://www.jianshu.com/p/1b7fdb1cff3c
来源：简书
简书著作权归作者所有，任何形式的转载都请联系作者获得授权并注明出处。

日志收集之rsyslog to kafka的更多相关文章

9.3 k8s结合ELK实现日志收集
数据流: logfile -> filebeat > kafka(依赖zookeeper)-> logstash -> elasticsearch -> kibana 1 ...
ELK+kafka构建日志收集系统
ELK+kafka构建日志收集系统原文 http://lx.wxqrcode.com/index.php/post/101.html 背景: 最近线上上了ELK,但是只用了一台Redis在 ...
ELK+Kafka 企业日志收集平台(一)
背景: 最近线上上了ELK,但是只用了一台Redis在中间作为消息队列,以减轻前端es集群的压力,Redis的集群解决方案暂时没有接触过,并且Redis作为消息队列并不是它的强项:所以最近将Redis ...
【转】flume+kafka+zookeeper 日志收集平台的搭建
from:https://my.oschina.net/jastme/blog/600573 flume+kafka+zookeeper 日志收集平台的搭建收藏 jastme 发表于 10个月前阅 ...
rsyslog+LogAnalyzer 日志收集
Linux 之rsyslog+LogAnalyzer 日志收集系统一.LogAnalyzer介绍 LogAnalyzer工具提供了一个易于使用,功能强大的前端,用于搜索,查看和分析网络活动数据,包括 ...
日志收集之kafka
日志收集之kafka http://www.jianshu.com/p/f78b773ddde5 一.介绍 Kafka是一种分布式的,基于发布/订阅的消息系统.主要设计目标如下: 以时间复杂度为O(1 ...
日志收集ELK+kafka相关博客
SpringBoot+kafka+ELK分布式日志收集使用 logstash + kafka + elasticsearch 实现日志监控 Kibana 安装与汉化 windows系统安装运行f ...
Go语言学习之11 日志收集系统kafka库实战
本节主要内容: 1. 日志收集系统设计2. 日志客户端开发 1. 项目背景 a. 每个系统都有日志,当系统出现问题时,需要通过日志解决问题 b. 当系统机器比较少时,登陆到服务器上查看即可 ...
SpringBoot+kafka+ELK分布式日志收集
一.背景随着业务复杂度的提升以及微服务的兴起,传统单一项目会被按照业务规则进行垂直拆分,另外为了防止单点故障我们也会将重要的服务模块进行集群部署,通过负载均衡进行服务的调用.那么随着节点的增多,各个 ...

随机推荐

重新整理 .net core 周边阅读篇————AspNetCoreRateLimit 之规则[二]
前言本文和上文息息相关. https://www.cnblogs.com/aoximin/p/15315102.html 是紧接着上文invoke来书写的,那么现在来逐行分析invoke到底干了啥. ...
从零入门 Serverless | 一文详解 Serverless 技术选型
作者 | 李国强阿里云资深产品专家今天来讲,在 Serverless 这个大领域中,不只有函数计算这一种产品形态和应用类型,而是面向不同的用户群体和使用习惯,都有其各自适用的 Serverless ...
Linux tomcat 部署war包
将打包好的 war包放在 webapps的文件夹下在tomcat/conf 文件夹下的 server.xml 里填加 <Context path="" docBase=&q ...
Eureka使用总结
关于Eureka: 提供基于 REST的服务,在集群中主要用于服务管理.使用该框架,可以将业务组件注册到Eureka容器中,这些组件可进行集群部署,Eureka主要维护这些服务的列表并自动检查他们的状 ...
力扣 - 剑指 Offer 29. 顺时针打印矩阵
题目剑指 Offer 29. 顺时针打印矩阵思路1 其实就是按照理解题目的意思一步步从外层到内层打印出来,同时将一个外层分成四个部分分步打印可以用一个变量count来维护当前打印的第几层判断打 ...
原生js-返回顶部
html部分: <body style="height:2000px"> <div id="div1"> 返回顶部 </div&g ...
vue3.x相对于vue2.x生命周期改动
vue3.x已经正式发布了,部分小伙伴已经用了vue3.x开发,部分小伙伴还在观望中,下面是两个影响比较大的改动 1.beforeDestroy和destroyed不能用了. 这个应该是vue2.x项 ...
python的虚拟环境Anaconda使用
Anaconda 使用conda常用命令 1.首先在所在系统中安装Anaconda.可以打开命令行输入conda -V检验是否安装以及当前conda的版本. 2.conda常用的命令. 1)con ...
热身训练1 Game
http://acm.hdu.edu.cn/showproblem.php?pid=5242 简要题意: 一棵树有n个节点,每个节点x有一个权值wi,我们要从根节点出发(不可回头),去收集每个节点的权 ...
[火星补锅] 水题大战Vol.2 T1 && luogu P1904 天际线题解（线段树）
前言: 当时考场上并没有想出来...后来也是看了题解才明白解析: 大家(除了我)都知道,奇点和偶点会成对出现,而出现的前提就是建筑的高度突然发生变化.(这个性质挺重要的,我之前没看出来) 所以就可以 ...

日志收集之rsyslog to kafka