Logstash使用grok插件解析Nginx日志

grok表达式的打印复制格式的完整语法是下面这样的：

%{PATTERN_NAME:capture_name:data_type}
data_type 目前只支持两个值：int 和 float。

在线gork正则的地址：http://grokdebug.herokuapp.com/
Logstash基础正则地址：https://github.com/elastic/logstash/blob/v1.4.2/patterns/grok-patterns

也可以在你的安装路径下查找grok-patterns内置的正则表达式：

/usr/local/logstash-6.2.4/vendor/bundle/jruby/2.3.0/gems/logstash-patterns-core-4.1.2/patterns/grok-patterns

例如：

URIPATH (?:/[A-Za-z0-$.+!*'(){},~:;=@#%&_\-]*)+

URIPARAM \?[A-Za-z0-$.+!*'|(){},~@#%&/=:;_?\-\[\]<>]*

-----------------------------------------------------------------------------------------

logstash-filter-mutate 插件是Logstash 另一个重要插件,它提供了丰富的基础类型数据处理能力,包括类型转换,字符串处理和字段处理等

可以设置的转换类型包括："integer"，"float" 和 "string"。示例如下：

filter {

    mutate {

        convert => ["request_time", "float"]

        gsub => [ "message", "aa", "" ]  字符串替换，此处为清除

    }

}

注意：mutate 除了转换简单的字符值，还支持对数组类型的字段进行转换，即将 ["1","2"] 转换成 [1,2]。但不支持对哈希类型的字段做类似处理。

对已有索引进行修改并且平滑过渡：

        mutate {

            convert => [ "request_time", "float" ]

            add_field => [ "response_time", "%{request_time}" ]

            remove_field => [ "request_time" ]

        }

--------------------------------------------------------------------------------

在线grok表达式解析地址：http://grokdebug.herokuapp.com/ （NGINXACCESS为规则名称，测试时不用填入）

根据已经生成的日志记录逐个参数进行调试即可。

需要注意的是当日志或可能出现“-”时，必须在NGINXACCESS中指定，例如: (?:%{NUMBER:serverelapsed}|-)

需要修改的文件位置：/usr/local/logstash/vendor/bundle/jruby/2.3.0/gems/logstash-patterns-core-4.1.2/patterns/grok-patterns

如果找不到的话，grep -rw NGINXACCESS /usr/local/logstash

首先对nginx日志格式设定如下：

log_format  main  '$remote_addr - $remote_user [$time_local] "$request_method $uri $query_string" $status $body_bytes_sent "$http_referer" "$http_user_agent" $request_time $upstream_response_time "$http_x_forwarded_for" ';

Logstash Grok默认的参数为：

NGUSERNAME [a-zA-Z\.\@\-\+_%]+

NGUSER %{NGUSERNAME}

NGINXACCESS %{IPORHOST:clientip} %{NGUSER:ident} %{NGUSER:auth} \[%{HTTPDATE:timestamp}\] "%{WORD:verb} %{URIPATHPARAM:request} HTTP/%{NUMBER:httpversion}" %{NUMBER:response}  (?:%{NUMBER:bytes}|-) (?:"(?:%{URI:referrer}|-)"|%{QS:referrer}) %{QS:agent} %{QS:xforwardedfor} %{IPORHOST:host} %{BASE10NUM:request_duration}

我这边设置的是：

#nginx

WZ ([^ ]*)

NGINXACCESS %{IP:remote_ip} \- \- \[%{HTTPDATE:timestamp}\] "%{WORD:method} %{WZ:request} HTTP/%{NUMBER:httpversion}" %{NUMBER:status} %{NUMBER:bytes} (?:%{QS:referer}|-) %{QS:agent} %{NUMBER:elapsed} (?:%{NUMBER:serverelapsed}|-) %{QS:xforward}

或拆分请求的uri和请求参数：此处需要注意的是必须确保NGINXACCESS规则是一整行

WZ ([^ ]*)

URIPARAM [A-Za-z0-9$.+!*'|(){},~@#%&/=:;_?\-\[\]<>]*  #此处重新定义该匹配规则，不匹配参数开头的？

NGINXACCESS %{IP:remote_ip} \- \- \[%{HTTPDATE:timestamp}\] "%{WORD:method} (%{URIPATH:request}|-|) (%{URIPARAM:requestParam}|-)" %{NUMBER:status}

%{NUMBER:bytes} %{QS:referer} %{QS:agent} %{NUMBER:elapsed} %{NUMBER:serverelapsed} %{QS:xforward}

自定义规则时也可以在/usr/local/logstash主目录下新建一个目录：patterns，并在该目录下新建一个grok的表达式解析文件nginx，内容同上，也可以实现相同的目的。

Nginx logstash配置文件：

input{

  file{

    path => "/usr/local/nginx/logs/access.log"

    type => "nginx"

    start_position => "beginning"

  }

  file{

    path => "/usr/local/nginx/logs/admin.log"

    type => "admin-nginx"

    start_position => "beginning"

  }

}

filter {

    grok {

      match => { "message" => "%{NGINXACCESS}" }

    }

    mutate {

      convert => [ "elapsed", "float" ]

      convert => [ "serverelapsed", "float" ]

    }

}

output{

  if [type] == "nginx" {

    elasticsearch {

    hosts=> ["172.17.102.202:9200"]

    index=> "nginx"

    }

  }

  else {

    elasticsearch {

    hosts=> ["172.17.102.202:9200"]

    index=> "admin-nginx"

    }

  }

}

Logstash使用grok插件解析Nginx日志的更多相关文章

使用logstash的grok插件解析springboot日志
使用logstash的grok插件解析springboot日志一.背景二.解决思路三.前置知识四.实现步骤 1.准备测试数据 2.编写`grok`表达式 3.编写 logstash pipel ...
ELK+Redis 解析Nginx日志
一.ELK简介 Elk是指logstash,elasticsearch,kibana三件套,我们一般使用它们做日志分析. ELK工作原理图: 简单来讲ELK具体的工作流程就是客户端的logstash ...
安装logstash5.4.1，并使用grok表达式收集nginx日志
关于收集日志的方式,最简单性能最好的应该是修改nginx的日志存储格式为json,然后直接采集就可以了. 但是实际上会有一个问题,就是如果你之前有很多旧的日志需要全部导入elk上查看,这时就有两个问题 ...
[日志分析]Graylog2进阶通过正则解析Nginx日志
之前分享的 [日志分析]Graylog2采集Nginx日志主动方式这篇文章介绍了Graylog如何通过Graylog Collector Sidecar来采集nginx日志. 由于日志是未经处理的 ...
Goaccess解析nginx日志备忘
参考 http://nginx.org/en/docs/http/ngx_http_log_module.html?&_ga=1.92028562.949762386.1481787781#l ...
logstash 使用grok正则解析日志
http://xiaorui.cc/2015/01/27/logstash%E4%BD%BF%E7%94%A8grok%E6%AD%A3%E5%88%99%E8%A7%A3%E6%9E%90%E6%9 ...
关于Logstash中grok插件的正则表达式例子
一.前言近期需要对Nginx产生的日志进行采集,问了下度娘,业内最著名的解决方案非ELK(Elasticsearch, Logstash, Kibana)莫属. Logstash负责采集日志,Ela ...
logstash 6.6.0 读取nginx日志插入到elasticsearch中
logstash.conf input { # For detail config for log4j as input, # See: https://www.elastic.co/guide/en ...
python 解析nginx 日志 url
>>> import os>>> os.chdir('e:/')>>> log=open('access.log')//这两行是获取日志流> ...

随机推荐

2019-04-11-day030-网络编程并发
内容回顾黏包 tcp协议为了保证数据的可靠传输和传输效率合包机制 : 连续多条短数据会合并成一条拆包机制 : 一个过大的数据会在发出之前被拆成几个小包 tcp的黏包发生在两端: 发送端 : 合包 ...
oracle左关联+号表示方式
1.emp表和dept表 2.emp表中empno为8888的这条数据,没有部门编号,以emp表为主表,左关联查询部门信息sql语句如下: select * from emp e,dept d whe ...
oracle-企业信息化
http://www.itpub.net/thread-1873735-1-1.html OCP考试心得 http://blog.csdn.net/rlhua/article/detai ...
Day 09 函数基础
函数初级简介 # 函数是一系列代码的集合,用来完成某项特定的功能优点 '''1. 避免代码的冗余2. 让程序代码结构更加清晰3. 让代码具有复用性,便于维护''' 函数四部分 '''1. 函数名: ...
verilog 代码分析与仿真
verilog 代码分析与仿真注意:使用vivado 自带的仿真工具, reg和wire等信号需要赋予初始值边沿检测 module signal_test( input wire cmos_pcl ...
NetCore 控制台读取配置文件
依赖: Microsoft.Extensions.Configuration Microsoft.Extensions.Configuration.Binder Microsoft.Extension ...
【python】numpy中的shape用法
转自 https://blog.csdn.net/u010758410/article/details/71554224# shape函数是numpy.core.fromnumeric中的函数,它的功 ...
<亲测>CentOS中yum安装ffmpeg
CentOS中yum安装ffmpeg 1.升级系统 sudo yum install epel-release -y sudo yum update -y sudo shutdown -r now 2 ...
nginx gzip配置
参考: https://docs.nginx.com/nginx/admin-guide/web-server/compression/ server { gzip on; gzip_types ...
2017-07-06 eclipse在线安装SVN1.9插件
1,百度搜索subeclipse,点击第一个: 2,官网说,文档已移动到github wiki上: 3,打开github wiki,复制最新发布版本地址: 4,在eclipse里面,打开help-&g ...

Logstash使用grok插件解析Nginx日志

Logstash使用grok插件解析Nginx日志的更多相关文章

随机推荐

热门专题