logstash之input、codec学习

Logstash最强大的功能在于丰富的过滤器插件。此过滤器提供的并不单单是过滤的功能，还可以对进入过滤器的原始数据进行复杂的逻辑处理。甚至添加独特的事件到后续流程中。

1、logstash基本语法组成

logstash主要由三部分组成：input、filter、output。而filter就是过滤器插件，这个组件可以不要，但是这样子就不能体现出logtash的强大过滤功能了。

input{

　　输入插件

}

filter{

　　过滤器插件

}

outer{

　　输出插件

}

下面我们依次对各个插件进行介绍

1.1、logstash输入插件（input）

Logstash的输入插件主要用来接收数据，Logstash支持多种数据源，常见的有读取文件、标准输入、读取syslog日志、读取网络数据等，这里分别介绍下每种接收数据源的配置方法

我们先来看个例子：

input{

    file{

            path => ["/var/log/messages"]
　　　　　　  type => "system"
　　　　　　　 start_position => "timestamp"
　　}
}
output{
　　stdout{
　　　　　  　codec => rubydebug
　　}
}

这时我们有几个小疑问：

1、logstash的input是怎么样接收日志的呢？

　　logstash使用一个名为filewatch的ruby gem库来监听文件变化，并通过一个叫.sincedb的数据库文件来记录被监听的日志文件的读取进度（时间戳）。这个sincedb数据文件的默认路径在 <path.data>/plugins/inputs/file下面，文件名类似于.sincedb_452905a167cf4509fd08acb964fdb20c。而<path.data>表示logstash插件存储目录，默认是LOGSTASH_HOME/data。(rpm包安装则是在/usr/share/logstash目录下)。

2、logstash的input技术跟Linux的那个比较像呢？

　　input就跟Linux的管道右侧内容一样，在Linux管道中，左侧的输出传给管道的右侧接收机制。而input就是如此，当他监听一个文件时，会以tail -f命令的形式逐行获取数据。不过input可以指定从哪个地方（某一时间戳）开始读取，而start_position就是指定时间戳。如果不指定则从头开始读取。type则是用来标记时间类型。

下面举个例子来看：

1.2、标准输入

stdin是从标准输入获取信息的。这里我们看一个稍微复杂一点的例子：

input {

        stdin {

                add_field => {"key"=>"apple"}

                tags => ["add1"]

                type => "test1"

        }

}

output {

                stdout {

                        codec => rubydebug

                }

}

然后我们启动一下终端，大家要注意，我这里没有指定输入文件，而指定的是stdin，表示标准输入，意思就是交互式输入数据。

[root@::172.31.22.29 /etc/logstash/conf.d]#/usr/share/logstash/bin/logstash -f /etc/logstash/conf.d/l1.conf

Sending Logstash logs to /var/log/logstash which is now configured via log4j2.properties

hello word   　　　　　　　　　　　　　　　　　　#手动输入此信息

{

          "type" => "test1",

      "@version" => "1",

       "message" => "hello word",

    "@timestamp" => 2019-01-22T05:42:08.340Z,

          "tags" => [

        [0] "add1"

    ],

          "host" => "ip-172-31-22-29.ec2.internal",

           "key" => "apple"

}

type和tags是logstash的两个特殊字段, type一般会放在input中标记事件类型, tags主要用于在事件中增加标签，以便在后续的处理流程中使用，主要用于filter或output阶段。

2、logstash编码插件（Codec）

前面的例子中，其实我们就已经用过编码插件codec了，就是这个rubydebug，它就是一种codec。

编码插件（codec）可以在logstash输入或输出时处理不同类型的数据，同时，还可以更好更方便的与其他自定义格式的数据产品共存，比如：fluent、netflow、collectd等通用数据格式的其他产品。因此，logstash不只是一个input-->filter-->output的数据流，而且是一个input-->decode-->filter-->encode-->output的数据流。

codec支持的编码格式常见有plain、json、json_lines等，下面依次介绍：

1、codec插件之plain

plain是最简单的编码插件，你输入什么信息，就返回什么信息，诸如上面的例子中的timestamp、type等都不会带有：

修改一下配置文件：

input {

        stdin {

        }

}

output {

                stdout {

                        codec => plain

                }

}

现在我们启动一下：

[root@::172.31.22.29 /etc/logstash/conf.d]#/usr/share/logstash/bin/logstash -f /etc/logstash/conf.d/l1.conf

Sending Logstash logs to /var/log/logstash which is now configured via log4j2.properties--22T06::.161Z ip----.ec2.internal hello word　　　　　　#在此输入信息

--22T06::.382Z ip----.ec2.internal hello word

2、codec插件之json、json_lines

有时候logstash采集的日志是JSON格式，那我们可以在input字段加入codec => json来进行解析，这样就可以根据具体内容生成字段，方便分析和储存。如果想让logstash输出为json格式，可以在output字段加入codec=>json。下面是一个包含json编码的时间配置文件：

input {

        stdin {

        }

}

output {

                stdout {

                        codec => json

                }

}

启动一下：

[root@:172.31.22.29 /etc/logstash/conf.d]#/usr/share/logstash/bin/logstash -f /etc/logstash/conf.d/l1.conf

Sending Logstash logs to /var/log/logstash which is now configured via log4j2.properties

hello word　　　　　　　　　　　　　　　　#输入此行信息

{"host":"ip-172-31-22-29.ec2.internal","@version":"1","message":"hello word","@timestamp":"2019-01-22T06:27:27.191Z"}

你会发现插件是json的时候，。他会自带一些信息，诸如host、@version、@timestamp。json的每个字段都是key:value格式，多个字段之间通过逗号分隔。这种输出比较长，因此我们采用json_lines编码格式稍微好一点。

2.1、我们演示一下在input里面设置json格式会怎么输入呢？

input {

        stdin {

                codec => json

        }

}

output {

                stdout {

                }

}

接下来启动一下服务：

[root@::172.31.22.29 /etc/logstash/conf.d]#/usr/share/logstash/bin/logstash -f /etc/logstash/conf.d/l1.conf

Sending Logstash logs to /var/log/logstash which is now configured via log4j2.properties

{"message":"hello word","@version":"1","@timestamp":"2019-01-22T06:32:56.973Z","host":"ip-172-31-22-29.ec2.internal"}

{

          "host" => "ip-172-31-22-29.ec2.internal",

    "@timestamp" => 2019-01-22T06:32:56.973Z,

      "@version" => "1",

       "message" => "hello word"

}

这里就是说当我输入红色方框里面的内容的时候，这里我输入的是一行JSON格式，然后系统就会返回给我信息。

logstash之input、codec学习的更多相关文章

logstash 5.1.1 学习
Logstash 5.1.1 安装配置安装和配置 java 环境: [root@ ~]# tar xf jdk-8u71-linux-x64.tar.gz [root@ ~]# mv jdk1.8. ...
logstash之Input插件
1:stdin标准输入和stdout标准输出首先执行命令: bin/logstash -e 'input { stdin { } } output { stdout { codec => ...
使用logstash的input file filter收集日志文件
使用logstash的input file filter收集日志文件一.需求二.实现步骤 1.前置知识 2.编写pipeline文件 3.Input 中 file 插件的部分参数解释: 4.启动l ...
input子系统学习笔记六按键驱动实例分析下【转】
转自:http://blog.chinaunix.net/uid-20776117-id-3212095.html 本文接着input子系统学习笔记五按键驱动实例分析上接续分析这个按键驱动实例! i ...
logstash插件配置-codec插件说明json和multiline
编码插件(Codec) Codec 是 logstash 从 1.3.0 版开始新引入的概念(Codec 来自 Coder/decoder 两个单词的首字母缩写). 在此之前,logstash 只支持 ...
logstash实战input插件syslog
vim /etc/logstash/conf.d/syslog.conf input{ syslog{ type => "system-syslog" port => ...
Linux input子系统学习总结（二）----Input事件驱动
Input 事件驱动: (主要文件 :drivers/input/evdev.c . drivers/input/input.h)基于kernel 4.0 一. 关键函数调用顺序: 1.inp ...
Linux input子系统学习总结（三）----Input设备驱动
Input 设备驱动 ---操作硬件获取硬件寄存器中设备输入的数据,并把数据交给核心层: 一 .设备驱动的注册步骤: 1.分配一个struct input_dev : struct ...
Linux input子系统学习总结（一）---- 三个重要的结构体
一 . 总体架构图上层是图形界面和应用程序,通过监听设备节点,获取用户相应的输入事件,根据输入事件来做出相应的反应:eventX (X从0开始)表示按键事件,mice 表示鼠标事件 Input ...

随机推荐

eclipse svn 忽略 target目录
这个build失败的解决方案就是不要把你项目的 target目录放在src repository 里面,还有 .project 和 .classpath最好也别放到src repository 里. ...
转：Bash Shell常用快捷键
转载:原文出处移动光标 ctrl+b: 前移一个字符(backward) ctrl+f: 后移一个字符(forward) alt+b: 前移一个单词 alt+f: 后移一个单词 ctrl+a: 移到 ...
【杂谈】Starter Template
Spring Boot 项目与普通项目在包管理上的差别主要差别就是,Spring Boot在包管理上用了starter template,你应该经常看到xxx-starter这类的dependency ...
Python sqlalchemy的基本使用
示例代码 from sqlalchemy import create_engine from sqlalchemy.ext.declarative import declarative_base fr ...
mysql更新表中日期字段时间
DATE_ADD和DATE_SUB函数可以用INTERVAL关键字标识的时间间隔进行加减操作,类似于PHP中的strtotime函数. 1.更新表中有效期valid_time字段值都增加一天 UPDA ...
Asp.net中GridView详解《转》
ASP.NET服务器控件GridView 1 ASP.NET 服务器控件GridView使用本教程不介绍服务器端控件的呈现,事件处理,状态等理论知识,只介绍服务器端控件的使用操作,如 ...
【Spring】18、springMVC对异常处理的支持
无论做什么项目,进行异常处理都是非常有必要的,而且你不能把一些只有程序员才能看懂的错误代码抛给用户去看,所以这时候进行统一的异常处理,展现一个比较友好的错误页面就显得很有必要了.跟其他MVC框架一样, ...
利用批处理文件删除系统托盘上的图标（适用于Windows各个版本）
对于我这种强迫症患者来说,如果我已经删除了一些软件,但是系统托盘里面还有它,我会很难受.所以,没办法,必须想办法把它清除掉,还自己一片安宁!!!不知各位是否遇到过和我一样的问题,下面贴一段批处理文件的 ...
vue常用笔记
vue源码解析(勾三股四):http://jiongks.name/blog/vue-code-review/ 0.npm: https://www.npmjs.com/ 1. package.jso ...
sigar获取Windows系统的硬件信息进行JAVA后台系统资源监控
windows下,将sigar-amd64-winnt.dll复制到jdk的bin目录下或者拷贝到WEB-INF/lib下 linux下,将libsigar-amd64-linux.so拷贝到jdk的 ...

logstash之input、codec学习

logstash之input、codec学习的更多相关文章

随机推荐

热门专题