简介

通常日志管理是逐渐崩溃的——当日志对于人们最重要的时候，也就是出现问题的时候，这个渐进的过程就开始了。
日志管理一般会经历一下3个阶段：

初级管理员将通过一些传统工具（如cat、tail、sed、awk、perl以及grep）对日志进行检查，但它的适用范围仅限于少量的主机和日志文件类型；
考虑到现实中的可扩展性问题，日志管理也会逐步进化，使用如rsyslog和syslog-ng这样的工具进行集中化的管理；
当日志信息越来越大的时候，从快速增长的日志数据流中提取出所需的信息，并将其与其他相关联的事件进行关联，将变得越加困难，此时LogStash就提供了一个很好的解决方案

LogStash的优势：

对日志数据更好的语法分析功能；
更加灵活的日志存储方式
附带搜索和目录功能
易于安装、可扩展、性能良好等

设计及架构

LogStash
由JRuby语言编写，基于消息（message-based）的简单架构，并运行在Java虚拟机（JVM）上。不同于分离的代理端（agent）或主
机端（server），LogStash可配置单一的代理端（agent）与其它开源软件结合，以实现不同的功能。

在LogStash的生态系统中，主要分为四大组件：

Shipper：发送事件（events）至LogStash；通常，远程代理端（agent）只需要运行这个组件即可；
Broker and Indexer：接收并索引化事件；
Search and Storage：允许对事件进行搜索和存储；
Web Interface：基于Web的展示界面

正是由于以上组件在LogStash架构中可独立部署，才提供了更好的集群扩展性。

在大多数情况下，LogStash主机可分为两大类：

代理主机（agent host）：作为事件的传递者（shipper），将各种日志数据发送至中心主机；只需运行Logstash 代理（agent）程序；
中心主机（central host）：可运行包括中间转发器（Broker）、索引器（Indexer）、搜索和存储器（Search and Storage）、Web界面端（Web Interface）在内的各个组件，以实现对日志数据的接收、处理和存储。

部署

基础环境

um install java-1.7.-openjdk

java -version # 保证java版本为1.

部署LogStash

# 下载

wget https://download.elasticsearch.org/logstash/logstash/logstash-1.3.1-flatjar.jar -O logstash.jar

# 启动

java -jar logstash.jar agent -v -f shipper.conf # 启动shipper

java -jar logstash.jar agent -v -f indexer.conf # 启动indexer

部署Redis

# 安装

yum install redis-server

# 启动

/etc/init.d/redis-server start

# 测试

$ redis-cli -h 192.168.12.24

redis 192.168.12.24:> PING

PONG

部署Elasticsearch

# 下载

wget https://download.elasticsearch.org/elasticsearch/elasticsearch/elasticsearch-0.90.8.noarch.rpm

# 安装

rpm -ivh elasticsearch-0.90..noarch.rpm

# 启动

/etc/init.d/elasticsearch status

启动Kibana

# 安装

java -jar logstash.jar web # LogStash 1.3.1自带Kibana

# 查看

http://192.168.12.24:9292

Logstash配置文件与插件

input {

    stdin { }

    file {

        type => "syslog"

        path => ["/var/log/secure", "/var/log/messages"]

        exclude => ["*.gz", "shipper.log"]

    }

    zeromq {

      address => ["tcp://192.168.8.145:8889"]

      mode => "client"

      type => "zmq-input"

      topic => "weblog"

      topology => "pubsub"

      codec => "json"

    }

  }

  filter {

    mutate {

        gsub => [ "message","APPS weblog",""]

        gsub => [ "message","{",""]

        gsub => [ "message","}",""]

    }

  }

  output {

    stdout { debug => true debug_format => "json"}

    elasticsearch {

      cluster => "logstash"

      codec => "json"

    }

}

日志类别与处理方法

Apache日志：自定义apache输出日志格式，json输出，无需filter参与
Postfix日志：无法自定义，需使用如grok等filter进行过滤
Tomcat日志：需将多行日志合并至一个事件中，并排除空白行

集群扩展

扩展架构

注意事项

Redis：部署多台，仅提供高可用作用，无分担负载作用，可使用ZeroMQ代替

ElasticSearch：

# 检测节点状态：

    curl -XGET 'http://127.0.0.1:9200/_cluster/health?pretty=true'

            green status：所有shard被分配，且运行正常

            yellow status：只有主shard被分配，如集群正在节点间复制数据时

            red status：存在未被分配的shard

# 集群监控：

    Paramedic工具：

            安装：/usr/share/elasticsearch/bin/plugin -install karmi/elasticsearch-paramedic

            查看：http://log.okooo.net:9200/_plugin/paramedic/index.html

    Bigdesk工具：

            安装：/usr/share/elasticsearch/bin/plugin -install lukas-vlcek/bigdesk

            查看：http://log.okooo.net:9200/_plugin/bigdesk/index.html

# 数据保留策略：

            .LogStash默认为每一天创建1个index，可手动删除index

                curl -XDELETE http://127.0.0.1:9200/logstash-2013.12.19

                shell优化脚本：https://github.com/cnf/logstash-tools/blob/master/elasticsearch/clean-elasticsearch.sh

            .优化index：

                curl -XPOST 'http://127.0.0.1:9200/logstash-2013.12.19/_optimize'

                curl -XPOST 'http://127.0.0.1:9200/_optimize' # 优化所有index

                curl 'http://127.0.0.1:9200/logstash-2013.12.19/_stats?clear=true&store=true&pretty=true' #查看index的大小，index过多会影响优化耗时

            .默认index数据目录：/var/lib/elasticsearch/logstash

参考资料

LogStash官网：http://www.logstash.net/

Elasticsearch官网：http://www.elasticsearch.org/

Kibana查询语法：http://lucene.apache.org/core/3_6_1/queryparsersyntax.html

LogStash日志分析系统的更多相关文章

ELK_日志分析系统Logstash+ElasticSearch+Kibana4
elk 日志分析系统 Logstash+ElasticSearch+Kibana4 logstash 管理日志和事件的工具 ElasticSearch 搜索 Kibana4 功能强大的数据显示客户端 ...
Docker搭建ElasticSearch+Redis+Logstash+Filebeat日志分析系统
一.系统的基本架构在以前的博客中有介绍过在物理机上搭建ELK日志分析系统,有兴趣的朋友可以看一看-------------->>链接戳我<<.这篇博客将介绍如何使用Docke ...
elk 日志分析系统Logstash+ElasticSearch+Kibana4
elk 日志分析系统 Logstash+ElasticSearch+Kibana4 logstash 管理日志和事件的工具 ElasticSearch 搜索 Kibana4 功能强大的数据显示clie ...
filebeat+redis+logstash+elasticsearch+kibana搭建日志分析系统
filebeat+redis+elk搭建日志分析系统官网下载地址:https://www.elastic.co/downloads 1.下载安装filebeat wget https://artif ...
[原创]ubuntu14.04部署ELK+redis日志分析系统
ubuntu14.04部署ELK+redis日志分析系统 [环境] host1:172.17.0.4 搭建ELK+redis服务 host2:172.17.0.3 搭建logstash+nginx服务 ...
ELK + Filebeat 日志分析系统
ELK + Filebeat 日志分析系统架构图环境 OS:CentOS 7.4 Filebeat: 6.3.2 Logstash: 6.3.2 Elasticsearch 6.3.2 Kiban ...
苏宁基于Spark Streaming的实时日志分析系统实践 Spark Streaming 在数据平台日志解析功能的应用
https://mp.weixin.qq.com/s/KPTM02-ICt72_7ZdRZIHBA 苏宁基于Spark Streaming的实时日志分析系统实践原创: AI+落地实践 AI前线 20 ...
ELK日志分析系统简单部署
1.传统日志分析系统: 日志主要包括系统日志.应用程序日志和安全日志.系统运维和开发人员可以通过日志了解服务器软硬件信息.检查配置过程中的错误及错误发生的原因.经常分析日志可以了解服务器的负荷,性能安 ...
Rsyslog+ELK日志分析系统
转自:https://www.cnblogs.com/itworks/p/7272740.html Rsyslog+ELK日志分析系统搭建总结1.0(测试环境) 因为工作需求,最近在搭建日志分析系统, ...

随机推荐

orcale数据库分配用户
account lock:创建用户的时候锁定用户 account unlock:创建用户的时候解锁用户,默认该选项 create user zhou8–用户名 identified by zhou88 ...
html-介绍
一:概述 HTML是英文Hyper Text Mark-up Language(超文本标记语言)的缩写,他是一种制作万维网页面标准语言(标记).相当于定义统一的一套规则,大家都来遵守他,这样就可以让浏 ...
在VS中让一个JS文件智能提示另一个JS文件中的成员2--具体引用
我们知道,在html中,利用<script language="javascript" type="text/javascript" src=" ...
Elasticsearch doc_value认识
一.doc_value是什么绝大多数的fields在默认情况下是indexed,因此字段数据是可被搜索的.倒排索引中按照一定顺序存放着terms供搜索,当命中搜索时,返回包含term的documen ...
使用mockito模拟静态方法
一.为什么要使用Mock工具在做单元测试的时候,我们会发现我们要测试的方法会引用很多外部依赖的对象,比如:(发送邮件,网络通讯,远程服务, 文件系统等等). 而我们没法控制这些外部依赖的对象,为了解 ...
20155309南皓芯2016-2017 2《Java程序设计》第一周学习总结
关于java学习笔记的思考问题第一章:JDK与JRE,JVM之间有没有必然的联系第二章:可执行文件夹找到相关链接库第三章:for与while循环的用法与比较,break与continue跳出的注 ...
javascript输入验证数字方法，适合充值时输入正整数验证
说明:用于验证正整数的输入,不允许输入其他字符. html: <input type="text" id="sell_jobNum" name=" ...
NPOI 读取单元格的格式
最近做项目需要导入一部分数据, 导入的数据的中, 有部分的百分比数据使用的是excel 的百分比, 有部分的数据使用的是字符串形式的格式,(数据来源于不同的人统计), 格式略微有点乱, 要求导入系统的 ...
mysql 解除正在死锁的状态
转自:http://blog.csdn.net/hotdust/article/details/51524469 from: http://www.2cto.com/database/201303/1 ...
Anaconda 安装好了，却无法运行？
使用管理员运行:conda prompt 或者 Windows PowerShell 执行命令 conda update anaconda-navigator 还是不行就试试命令: anaconda- ...

LogStash日志分析系统