开始使用Logstash
开始使用Logstash
本节将指导处理安装Logstash 和确认一切是运行正常的,
后来的章节处理增加负载的配置来处理选择的使用案例。
这个章节包含下面的主题:
Installing Logstash
Stashing Your First Event: Basic Logstash Example
Parsing Logs with Logstash
Stalled Shutdown Detection
Logstash Processing Pipeline
基本的Logstash的例子:
测试你的Logstash 安装,运行做基本的Logstash 管道:
cd logstash-2.4.0
bin/logstash -e 'input { stdin { } } output { stdout {} }'
-e flag 让你指定一个配置直接从命令行, 指定配置作为命令行让你快速的测试配置不需要编辑文件在迭代期间。
这个管道从一个标准输入,stdin,和移动 输入到标准输出
使用Logstash 解析日志:
一个Logstash 管道 在很多使用情况下有一个或者多个input,和输出插件。
本节中的场景 创建一个Logstash 配置文件来指定那些插件和讨论 每个插件是做什么的。
Logstash 配置文件定义你的Logstash 管道。当你启动一个Logstash 实例,使用-f 选项
来指定配置文件,定义实例的管道
一个Logstash 管道有2个需要的参数, input和output, 以及一个可选的元素,filter.
input 插件 消费源的数据, filter 插件 修改你指定的数据,
ouput 插件写数据到一个目的地
在这个章节,你创建一个Logstash 管道,让Apache web logs 作为输入,
解析那些日志来创建特定的,命名命名的字段, 写解析好的数据到Elasticsarch集群。
相比定义管道配置在命令行,你可以定义管道在一个配置文件里。
下面的文本表示配置管道的概略:
# The # character at the beginning of a line indicates a comment. Use
# comments to describe your configuration.
input {
}
# The filter part of this file is commented out to indicate that it is
# optional.
# filter {
#
# }
output {
}
这个骨架是非功能的, 因为input和output 章节没有任何正确的选项定义:
开始, 复制和黏贴骨架配置管道到一个文件叫做 first-pipeline.conf 在你的Logstash 目录。
然后下载示例数据用于下面的例子
配置Logstash 用于文件输入:
注意:
这个例子 使用文件输入插件, tail files 在真实的世界,
你可以使用Filebeat 来传输日志到Logstash.
开始你的Logstash 管道,配置Logstash 实例从一个文件读取使用file input 插件:
input {
file {
path => "/path/to/file/*.log"
start_position => beginning
ignore_older => 0
}
}
默认的文件input 插件的行为是监控一个文件对于新的信息, 类似于UNIX tail -f 命令的方式。
改变这个默认的行为,处理整个文件,我们需要 指定位置 logstash 开始处理文件的位置:
设置ignore_older to 0 来禁用文件年龄检查 ,这样文件是被处理的,即使它是一天前的
替换 /path/to/file 为你的决定路径
解析 Web logs 使用Grok 过滤插件:
grok 过滤插件 是几种插件的一种 默认是可用的在logstash里。
对于细节关于如何管理logstash 插件,查看插件管理文档。
Grok filter 插件让你解析非结构化的数据到一些结构化的可以查询的 日志数据
因为grok 过滤插件寻找模式在进来的log data,配置需要你做决定关于如何识别模式,你使用情况感兴趣的。
web server 日志看起来像:
83.149.9.216 - - [04/Jan/2015:05:13:42 +0000] "GET /presentations/logstash-monitorama-2013/images/kibana-search.png
HTTP/1.1" 200 203023 "http://semicomplete.com/presentations/logstash-monitorama-2013/" "Mozilla/5.0 (Macintosh; Intel
Mac OS X 10_9_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/32.0.1700.77 Safari/537.36"
IP 地址在行开头是容易识别的, 括号中的时间戳,解析数据,你可以使用%{COMBINEDAPACHELOG} grok pattern,
增强你的数据使用Geoip 过滤插件:
除了分析日志数据为了更好的搜索, filter plugins 可以得到补充信息从现有的数据。
作为一个例子, geoip 插件 查找IP地址, 得到地理位置信息从ip地址,增加位置信息到logs
配置你的Logstash 实例使用geoip 过滤插件通过增加下面的行到filer 章节
geoip {
source => "clientip"
}
geoip 插件配置需要你指定 source field 的名字 包含IP地址用于查找,在这里例子中,
Clientip 字段包含IP地址。
由于过滤器是顺序评估的, 确保geoip 部分是在grok 部分后面,grok和geoip 部分是嵌套的在filter 部分像这样:
filter {
grok {
match => { "message" => "%{COMBINEDAPACHELOG}"}
}
geoip {
source => "clientip"
}
索引你的数据到Elasticsearch:
现在web logs 是被分成特定的字段,Logstash 管道可以索引数据到一个Elasticsearch cluster.
编辑first-pipeline.conf file 替换整个输出部分使用下面的文本:
output {
elasticsearch {
hosts => [ "localhost:9200" ]
}
}
在这个配置里, Logstash 使用http 协议连接到Elasticsearch
上面的例子 假设Logstash 和Elasticsearch 运行在相同的实例上。
你可以指定一个远程的Elasticsearch 通过使用hosts配置来指定像这样 hosts => [ "es-machine:9092" ].
测试你的初始化管道
在这个点上,你的 first-pipeline.conf file 已经有input,filter和output 部分配置,看起来像这样:
input {
file {
path => "/Users/myusername/tutorialdata/*.log"
start_position => beginning
ignore_older => 0
}
}
filter {
grok {
match => { "message" => "%{COMBINEDAPACHELOG}"}
}
geoip {
source => "clientip"
}
}
output {
elasticsearch {
hosts => [ "localhost:9200" ]
}
}
检验你的配置,运行下面的命令:
bin/logstash -f first-pipeline.conf --configtest
--configtest 选项 解析你的配置文件和报告任何错误。
当配置文件解析 配置test,启动Logstash 使用下面的命令:
bin/logstash -f first-pipeline.conf
整合多个input和output 插件
你需要管理来自多个不同的源,使用例子可以需要多个目的地用于你的数据。
你的logstash 管道可以使用多个input 和output 来处理那些请求:
在这个章节, 你创建一个Logstash 管道 从一个Twitter feed 输入,
写Logstash到文件:
你可以配置你的Logstash 管道写数据直接到一个文件使用file output插件。
配置你的Logstash 实例来使用实例来使用file output 插件通过增加下面的行到你的输出部分
file {
path => /path/to/target/file
}
开始使用Logstash的更多相关文章
- Logstash实践: 分布式系统的日志监控
文/赵杰 2015.11.04 1. 前言 服务端日志你有多重视? 我们没有日志 有日志,但基本不去控制需要输出的内容 经常微调日志,只输出我们想看和有用的 经常监控日志,一方面帮助日志微调,一方面及 ...
- logstash file输入,无输出原因与解决办法
1.现象 很多同学在用logstash input 为file的时候,经常会出现如下问题:配置文件无误,logstash有时一直停留在等待输入的界面 2.解释 logstash作为日志分析的管道,在实 ...
- logstash服务启动脚本
logstash服务启动脚本 最近在弄ELK,发现logstash没有sysv类型的服务启动脚本,于是按照网上一个老外提供的模板自己进行修改 #添加用户 useradd logstash -M -s ...
- Logstash时区、时间转换,message重组
适用场景 获取日志本身时间 日志时间转Unix时间 重组message 示例日志: hellow@,@world@,@2011-11-01 18:46:43 logstash 配置文件: input{ ...
- logstash日志分析的配置和使用
logstash是一个数据分析软件,主要目的是分析log日志.整一套软件可以当作一个MVC模型,logstash是controller层,Elasticsearch是一个model层,kibana是v ...
- logstash+elasticsearch+kibana管理日志(安装)
logstash1.先安装jdk2.wget https://download.elastic.co/logstash/logstash/logstash-2.4.0.tar.gz tar -xzvf ...
- 使用Logstash进行日志分析
LogStash主要用于数据收集和分析方面,配合Elasticsearch,Kibana用起来很方便,安装教程google出来很多. 推荐阅读 Elasticsearch 权威指南 精通 Elasti ...
- LogStash filter介绍(九)
LogStash plugins-filters-grok介绍 官方文档:https://www.elastic.co/guide/en/logstash/current/plugins-filter ...
- kafka(logstash) + elasticsearch 构建日志分析处理系统
第一版:logstash + es 第二版:kafka 替换 logstash的方案
- 海量日志分析方案--logstash+kibnana+kafka
下图为唯品会在qcon上面公开的日志处理平台架构图.听后觉得有些意思,好像也可以很容易的copy一个,就动手尝试了一下. 目前只对flume===>kafka===>elacsticSea ...
随机推荐
- HDU_2020——按绝对值排序
Problem Description 输入n(n<=100)个整数,按照绝对值从大到小排序后输出.题目保证对于每一个测试实例,所有的数的绝对值都不相等. Input 输入数据有多组,每组占 ...
- Beanstalkd介绍
特征 优先级:任务 (job) 可以有 0~2^32 个优先级, 0 代表最高优先级,beanstalkd 采用最大最小堆 (Min-max heap) 处理任务优先级排序, 任何时刻调用 reser ...
- IOS如何延长LaunchScreen.xib启动画面
- (BOOL)application:(UIApplication *)application didFinishLaunchingWithOptions:(NSDictionary *)launc ...
- IOS设计模式学习(19)策略
1 前言 面向对象软件设计中,我们可以把相关算法分离为不同的类,成为策略.与这种做法有关的一种设计模式成为策略模式. 2 详述 2.1 简述 策略模式中得一个关键角色是策略类,它为所有支持的或相关的算 ...
- Android Game
收起相关游戏 cytus 机械迷城 小小炼狱 deemo 神庙逃离 现代战争4零点行动 植物大战僵尸2中文版 时空幻境 无尽之剑3 超级救火队 迷你冲撞 大战僵尸鸟 侍魂2 flappy bird 混 ...
- Android 基于Netty的消息推送方案之概念和工作原理(二)
上一篇文章中我讲述了关于消息推送的方案以及一个基于Netty实现的一个简单的Hello World,为了更好的理解Hello World中的代码,今天我来讲解一下关于Netty中一些概念和工作原理的内 ...
- 根据id查询数据(向前台返回json格式的数据)
/** *@description 根据主键查询Bean */ @RequestMapping(value="/getBean/{getId}") public void getB ...
- Html.Action和Html.RederAction来创建子视图
1. 父视图和子视图 父视图是包含了调用返回子视图的动作方法的视图. 父视图包含大部分用于呈现页面的HTML.子视图仅包含用于展示视图某部分的必须的标记. 例如,一个子视图创建一个列表,视图可能仅仅包 ...
- Oracle 如何让别人能够连接到你的数据库
Oracle 初步 --Oracle的一些关键字 i和g只是版本的代号,指oracle运用的技术i代表Internet就是互联网技术g代表grid就是网格技术现在出的最新版是c就是cloud也就是云技 ...
- xml bug
在Eclipse 创建动态WEB 工程,在src 下 创建 config.xml: 1 <?xml version="1.0" encoding="UTF-8&qu ...