爬虫日志监控 -- Elastc Stack(ELK)部署
傻瓜式部署,只需替换IP与用户
导读:
现ELK四大组件分别为:Elasticsearch(核心)、logstash(处理)、filebeat(采集)、kibana(可视化)
在elastic官网下载组件tar包,各组件版本最好一致,配合fdm会快一点点
注意:如若后续用到sentinl(开源监控警报插件,可webhook接钉钉等),ELK的组件版本应选择与sentinl版本一致,
sentinl版本比ELK组件更新慢
我的杯具:Plugin sentinl [7.6.1] is incompatible with Kibana [7.9.0]
环境
- linux mint19
- 自带open jdk 11 ( 不能低于1.8 )
配置
主目录创建itcast,然后分配权限,本机使用user0
chown -R user0:user0 /itcast
本机配置:解压包tar -xzvf /itcast/*.tar.gz /itcast/
、修改以下配置文件
(注意:1、解压目录换成自己的版本,下略;2、缩进距离以默认文件为主)
elasticsearch相关:
/itcast/(elasticsearch解压目录)/config/elasticsearch.yml
# 集群名称,默认是elasticsearch
cluster.name: my-application
# 节点名称
node.name:node-1
# 配置IP端口
network.host:0.0.0.0
http.port: 9200
# 可以指定es的数据存储目录,默认存储在es_home/data目录下
# path.data: /path/to/data
# 可以指定es的日志存储目录,默认存储在es_home/logs目录下
# path.logs: /path/to/logs
# 子集群节点,用的上述节点设置的名称
discovery.seed_hosts:[node-1]
# !!通过配置这个参数来防止集群脑裂现象 (集群总节点数量/2)+1
discovery.zen.minimum_master_nodes= ( master候选节点数量/2+1 )
# 处理跨域的相关参数
http.cors.enabled: true
http.cors.allow-origin: "*"
http.cors.allow-methods: OPTIONS, HEAD, GET, POST, PUT, DELETE
http.cors.allow-headers: "X-Reqested-With, Content-Type, Content-Length, X-User"
kibana相关:
/itcast/(kibana解压目录)/config/kibana.yml
server.port: 5601
server.host: "0.0.0.0"
elasticsearch.hosts: ["http://192.168.199.224:9200"]
kibana.index: ".kibana"
# 自定义安全参数
xpack.encryptedSavedObjects.encryptionKey:encryptedSavedObjects12345678909876543210123
xpack.security.encryptionKey: encryptionKeysecurity12345678909876543210123
xpack.reporting.encryptionKey: encryptionKeyreporting12345678909876543210123
elasticsearch.requestTimeout: 90000
i18n.locale: "zh-CN"
logstash相关:
/itcast/(logstash解压目录)/config/logstash-sample.conf
input {
beats {
port => 5044
}
}
filter {
# 重要功能,对日志处理均在此步,按需自行搜索
mutate {
split => {"message" => "|"}
}
mutate {
add_field => {
"Date" => "%{[message][0]}"
# 坑点!!!新版本中%{}里字段如message需要加上中括号[]作为识别
"Level" => "%{[message][1]}"
"result" => "%{[message][2]}"
}
}
mutate {
convert => {
"Date" => "string"
"Leverl" => "string"
"result" => "string"
}
}
}
output {
elasticsearch {
hosts => ["http://192.168.199.224:9200"]
index => "logstash-%{+YYYY.MM.dd}"
}
}
filebeat相关:( 实际中 filebeat 部署在业务运行的主机上 )
/itcast/(filebeat解压目录)/filebeat.yml
filebeat.inputs:
- type: log
enabled: true
paths:
#目标文件,自行匹配
- /var/log/*.log
#- /itcast/elasticsearch/logs/*
tags: ["spider"]
#不需要logstash处理可直接传ela本身
#output.elasticsearch:
# hosts: ["192.168.199.224:9200"]
out.logstash:
hosts: ["192.168.199.224:5044"]
filebeat.config.modules:
path: ${path.config}/modules.d/*.yml
reload.enabled: false
setup.template.settings:
index.number_of_shards: 1
setup.kibana:
host: "192.168.199.224:5601"
其他
logstash插件sentinl安装(按需)
(kibana目录)/bin/kibana-plugin install file:~/sentinl-v7.6.1.zip # zip包自行github下载
运行
用 ufw 开启有关端口:es、kibana、logstash ( 执行业务的 filebeat连到logstash端口 )
sudo ufw allow 9200
sudo ufw allow 5601
sudo ufw allow 5044
sudo ufw enable
/etc/security/limits.conf 尾部加上字段
* soft nproc 65536
* hard nproc 65536
* soft nofile 65536
* hard nofile 65536
切换到用户,执行命令如下,
su - user0
ulimit -n
# 返回65536即设置成功,保持user0状态开启elasticsearch服务
/itcast/(elasticsearch解压目录)/bin/elasticsearch
运行另外的组件( 实际 filebeat 在业务运行的主机上运行)
/itcast/(kibana解压目录)/bin/kibana
/itcast/(logstash解压目录)/bin/logstash -f ./config/logstash-sample.conf
/itcast/(filebeat解压目录)/filebeat -e -c filebeat.yml
测试
新建控制台,cd至 filebeat 监控日志目录,此处为 /var/log
- 执行以下命令数次
echo "2020-09-01 | DEBUG | create a logmsg demo" >> demo.log
- 打开kibana(此处为192.168.199.224:5601)
- 菜单打开Stack Management( 管理中心 )
- kibana索引模式创建索引( logstash 的配置输出中 index => "logstash-%{+YYYY.MM.dd}" ),此处输入 logstash-* 即可
- 菜单打开 discover,创建新条目,选择上一步的索引,调整时间段即可返回相关数据
- 菜单打开日志,选择索引 logstash-* 亦可返回流式数据
kibana简易食用方法:
- 创建索引 (视为数据源,操作的根本)
- 创建表格( discover )
- 创建可视化(Visualize 饼图,柱形图等……)
- 创建仪表盘(dashboard 把可视化组合起来)
持续更新,权当记录
- logstash插件multiline,用于报错而产生的多行时能匹配成一条日志数据( 默认多少行=多少条数据)
./bin/logstash-plugin install logstash-filter-multiline # logstash安装插件
logstash-simple.conf中的filter里加入
multiline {
pattern => "^\d{4}-\d{1,2}-\d{1,2}\s\d{1,2}:\d{1,2}:\d{1,2}"
negate => true
what => "previous"
}
# multiline {
# charset=>... #可选 字符编码
# max_bytes=>... #可选 bytes类型 设置最大的字节数
# max_lines=>... #可选 number类型 设置最大的行数,默认是500行
# multiline_tag... #可选 string类型 设置一个事件标签,默认是multiline
# pattern=>... #必选 string类型 设置匹配的正则表达式
# patterns_dir=>... #可选 array类型 可以设置多个正则表达式
# negate=>... #可选 boolean类型 默认false不显示,可设置ture
# what=>... #必选 向前previous , 向后 next
#
# }
爬虫日志监控 -- Elastc Stack(ELK)部署的更多相关文章
- ELK日志监控平台安装部署简介--Elasticsearch安装部署
最近由于工作需要,需要搭建一个ELK日志监控平台,本次采用Filebeat(采集数据)+Elasticsearch(建立索引)+Kibana(展示)架构,实现日志搜索展示功能. 一.安装环境描述: 1 ...
- 分布式实时日志分析解决方案ELK部署架构
一.概述 ELK 已经成为目前最流行的集中式日志解决方案,它主要是由Beats.Logstash.Elasticsearch.Kibana等组件组成,来共同完成实时日志的收集,存储,展示等一站式的解决 ...
- 运维开发实践——基于Sentry搭建错误日志监控系统
错误日志监控也可称为业务逻辑监控, 旨在对业务系统运行过程中产生的错误日志进行收集归纳和监控告警.似乎有那么点曾相识?没错... 就是提到的“APM应用性能监控”.但它又与APM不同,APM系统主要注 ...
- Hadoop生态圈-flume日志收集工具完全分布式部署
Hadoop生态圈-flume日志收集工具完全分布式部署 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 目前为止,Hadoop的一个主流应用就是对于大规模web日志的分析和处理 ...
- ElasticSearch实战-日志监控平台
1.概述 在项目业务倍增的情况下,查询效率受到影响,这里我们经过讨论,引进了分布式搜索套件——ElasticSearch,通过分布式搜索来解决当下业务上存在的问题.下面给大家列出今天分析的目录: El ...
- 企业日志大数据分析系统ELK+KAFKA实现【转】
背景: 最近线上上了ELK,但是只用了一台Redis在中间作为消息队列,以减轻前端es集群的压力,Redis的集群解决方案暂时没有接触过,并且Redis作为消息队列并不是它的强项:所以最近将Redis ...
- 微服务日志监控与查询logstash + kafka + elasticsearch
使用 logstash + kafka + elasticsearch 实现日志监控 https://blog.csdn.net/github_39939645/article/details/788 ...
- Sentry错误日志监控你会用了吗?
无论作为新手还是老手程序员在程序的开发过程中,代码运行时难免会抛出异常,而且项目在部署到测试.生产环境后,我们便不可能像在开发时那样容易的及时发现处理错误了.一般我们都是在错误发生一段时间后,错误信息 ...
- Sentry 监控 - 私有 Docker Compose 部署与故障排除详解
内容整理自官方开发文档 系列 1 分钟快速使用 Docker 上手最新版 Sentry-CLI - 创建版本 快速使用 Docker 上手 Sentry-CLI - 30 秒上手 Source Map ...
随机推荐
- python open函数初习
open("路径","打开方式") 打开方式:'r'只读模式,‘w’写模式,‘a’追加模式 ‘b’二进制模式,‘+’读/写模式.例: fh=open(&quo ...
- Locust性能测试2--登录示例
无论是做接口自动化还是做压测,解决了登录就离成功进步了一大半,下面做个简单的登录案例,后续再说下数据依赖及参数化等问题 1. 登录 登录示例 from locust import HttpUser, ...
- Java数据结构——根据遍历结果构造二叉树
一.已知前序.中序.后序遍历结果的其中两种,还原二叉树. ①已知前序遍历结果:1,2,4,5,3,6,7 中序遍历结果:4,2,5,1,6,3,7还原二叉树后BFS出结果. TreeNode.java ...
- Java面试题(多线程篇)
多线程 35.并行和并发有什么区别? 1.并行是指两个或者多个事件在同一时刻发生:而并发是指两个或多个事件在同一时间间隔发生. 2.并行是在不同实体上的多个事件,并发是在同一实体上的多个事件. 3.在 ...
- 【转】ANDROID LOLLIPOP SCREEN CAPTURE AND SHARING
https://datatheorem.github.io/android/2014/12/26/android-screencapture/ https://www.youtube.com/watc ...
- LaTeX分分钟上手【转】
原文地址:<LaTeX新人教程,30分钟从完全陌生到基本入门> 需要说明的几点: 1.文中说用XeTex,但是我的总是失败(出现!undefined control sequence.), ...
- 【问题】Java和Scala混合编译下无法正常使用lombok的问题
工作中有java和scala和混合编译的工程,最近遇到一个问题,就是工程中有依赖java bean的scala文件,编译过程中发现编译器无法找到Java bean 中 lombok生成的getter, ...
- 通过股票K线图来谈谈真正的技术和现实的技术
开局一张图 这是一张股票日线图,上面记载这近期每个交易日该股的开盘价,收盘价,最高价,最低价. 有兴趣的人可以估算下数据量和表的设计,似乎有点工作量.可这还只是一部分,你还可以获得每日分时数据,成交量 ...
- 为商务办公赋能,TOM商务邮箱,塑造职场新形象
转眼已至2020年,互联网的这10年发生了翻天覆地的改变.短视频红利崛起.人脸识别支付.AI智能机器人对话...很多产品从默默无闻到一夜崛起.而对于商务邮箱领域,邮箱已成为一种习惯,却往往忽略了它的点 ...
- FFmpeg开发笔记(三):ffmpeg介绍、windows编译以及开发环境搭建
前言 本篇章是对之前windows环境的补充,之前windows的是无需进行编译的,此篇使用源码进行编译,版本就使用3.4.8. FFmpeg简介 FFmpeg是领先的多媒体框架,能够解码 ...