Filebeat 日志采集工具安装
Filebeat 是比较轻量的日志采集工具,对于一些简单的采集任务可以直接使用 Filebeat 采集,同时也支持很多的方式输出,可以输出至 Kafka、Elasticsearch、Redis 等,下面我们来简单配置下。
首先下载好安装包,例如:filebeat-8.6.2-linux-x86_64.tar.gz
然后直接解压安装包到指定的安装位置:
tar -xvzf filebeat-8.6.2-linux-x86_64.tar.gz -C /opt
cd /opt/filebeat-8.6.2-linux-x86_64
这样我们就将 filebeat 安装到了 cd /opt/filebeat-8.6.2-linux-x86_64 下面,然后我们来简单配置一下,编辑配置文件 filebeat.yml
- type: filestream
# Unique ID among all inputs, an ID is required.
id: myprogram-filestream-id
# Change to true to enable this input configuration.
enabled: true
# Paths that should be crawled and fetched. Glob based paths.
paths:
- /opt/myprogram/logs/program.log
processors:
- add_fields:
target: ""
fields:
streamId: 'myprogram-filestream-id'
parsers:
- ndjson:
target: "jsonObject"
- type: filestream
id: syslog-filestream-id
enabled: true
paths:
- /var/log/messages
上面主要是关于采集的文件输入部分,可以配置多个文件流,但是每个文件流都必须有一个唯一的 id,这样方便 filebeat 通过 inode 去跟踪文件的变化,并且 paths 配置支持多个文件的目录,也就是同时监听多个文件,然后下面可以添加一些处理器,比如这里附加了一个 streamId 的字段用于在输出时知道来源,同时方便后续的检索,然后日志如果是 JSON 格式还可以配置解析方式,比如上面是 ndjson,输出的字段是 jsonObject,然后下级字段就是具体 JSON 解析的内容。第二个流是采集了系统日志,没有添加其他附加的功能。
另外还可以对日志进行简单的正则匹配或者过滤,具体可以参考文档:https://www.elastic.co/guide/en/beats/filebeat/8.6/filebeat-input-filestream.html
然后可以继续配置输出,支持多种输出,但是每次只能设置一种。
配置 Elasticsearch 如下:
output.elasticsearch:
# Array of hosts to connect to.
hosts: ["localhost:9200"]
# Protocol - either `http` (default) or `https`.
protocol: "https"
# Authentication credentials - either API key or username/password.
#api_key: "id:api_key"
#username: "elastic"
#password: "changeme"
配置直接输出到控制台,在调试时比较方便:
output.console:
pretty: true
还可以输出到 Redis,实际上是写入 list 类型的队列:
output.redis:
hosts: ["localhost:6379"]
password: ""
key: "filebeat"
db: 2
timeout: 5
除了上面方式还可以输出到 Logstach 方便二次处理等。
最后还可以配置一些公共的处理器,默认的内容如下:
processors:
- add_host_metadata:
when.not.contains.tags: forwarded
- add_cloud_metadata: ~
- add_docker_metadata: ~
- add_kubernetes_metadata: ~
其中 add_host_metadata 会添加很多机器本身的信息,例如网卡、操作系统、CPU 型号等,下面的分别就是采集主流云厂商、Docker 以及 k8s 的信息处理器,这些处理器可以根据需要选择,如果关掉直接注释即可,另外还可以手动添加其他的处理器,可以参考:https://www.elastic.co/guide/en/beats/filebeat/8.6/filtering-and-enhancing-data.html,处理器既可以添加到全局也可以添加到指定的 input 下面,只对特定的输入生效。
最后保存配置文件,然后尝试运行 filebeat:
./filebeat -e
运行后从已配置的输出查看具体的内容即可。
Reference:
1. https://www.elastic.co/guide/en/beats/filebeat/8.6/filebeat-overview.html
Filebeat 日志采集工具安装的更多相关文章
- Filebeat轻量级日志采集工具
Beats 平台集合了多种单一用途数据采集器.这些采集器安装后可用作轻量型代理,从成百上千或成千上万台机器向 Logstash 或 Elasticsearch 发送数据. 一.架构图 此次试验基于前几 ...
- 【RSYSLOG】rsyslog作为日志采集器安装配置说明
RSYSLOG is the rocket-fast system for log processing. About 由于环境基于CentOS 6.7 x64,rsyslog本身就是OS的组件,由于 ...
- flume 日志采集工具
Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集.聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据:同时,Flume提供对数据进行简单处理,并 ...
- logstash日志采集工具的安装部署
1.从官网下载安装包,并通过Xftp5上传到机器集群上 下载logstash-6.2.3.tar.gz版本,并通过Xftp5上传到hadoop机器集群的第一个节点node1上的/opt/uploads ...
- 日志采集工具Flume的安装与使用方法
安装Flume,参考厦门大学林子雨教程:http://dblab.xmu.edu.cn/blog/1102/ 并完成案例1 1.案例1:Avro source Avro可以发送一个给定的文件给Flum ...
- Filebeat 日志收集器 安装和配置
Filebeat的配置文件是/etc/filebeat/filebeat.yml,遵循YAML语法.具体可以配置如下几个项目: Filebeat Output Shipper Logging(可选) ...
- 自建Kubernetes logtail日志采集客户端安装方式
自建Kubernetes安装方式 前提条件 Kubernetes集群版本1.8及以上. 已经安装Helm命令,版本2.6.4及以上. 安装步骤 在日志服务控制台创建一个Project,Project名 ...
- mysql 慢查询日志 pt-query-digest 工具安装
介绍:pt-query-digest是用于分析mysql慢查询的一个工具,它可以分析binlog.General log.slowlog,也可以通过SHOWPROCESSLIST或者通过tcpdump ...
- (七)日志采集工具sleuth--分布式链路跟踪(zipkin)
微服务架构上通过业务来划分服务的,通过REST调用,对外暴露的一个接口,可能需要很多个服务协同才能完成这个接口功能,如果链路上任何一个服务出现问题或者网络超时,都会形成导致接口调用失败.随着业务的不断 ...
- scribe日志分析工具安装
系统CentOS6.2 x86_64 1.yum安装gcc,flex,m4,python/python-devel,ruby,libevent/libevent-devel,openssl/opens ...
随机推荐
- Module not specified-使用IDEA出现问题
一.问题由来 使用IDE导入一个项目时,准备启动这个项目,然后突然报错,错误信息如标题中所示Module not specified.这个项目之前都还好好的 怎么突然就运行不了了呢?让我感到很是疑惑, ...
- 【深度学习】批量归一化 BatchNormalization
一.背景 机器学习的本质是对物理世界进行建模,做的就是拟合数据分布. 但是在模型训练过程中,神经网络参数不断更新,导数中间层的数据分布频繁地变化(内部协变量偏移),不利于网络参数 ...
- UDP可靠传输协议KCP的一些理解
UDP主要用在哪两个方面 游戏 音视频通话 为什么要使用UDP? 实时性的考虑,丢包重传,TCP协议栈重传无法控制,UDP重发可以自定义策略. 在DNS查询的时候,也使用UDP,对资源的考虑. 如何做 ...
- 掌握python的dataclass,让你的代码更简洁优雅
dataclass是从Python3.7版本开始,作为标准库中的模块被引入.随着Python版本的不断更新,dataclass也逐步发展和完善,为Python开发者提供了更加便捷的数据类创建和管理方式 ...
- 【Django】如何在类视图、普通视图单独不做CSRF校验
一.背景 在某些特定场合下,需要局部禁用CSRF校验,比如,期望整个项目都启用CSRF,但是中途遇到某一两个视图要去掉这个校验 二.方案 1.如果你写Django的路由用的类视图,那么需要这样写 在 ...
- python基础六(函数基础及参数使用)
一. 函数定义 1.什么是函数 函数就相当于具备某一功能的工具 函数的使用必须遵循一个原则: 先定义 后调用2.为何要用函数 代码冗余,程序的组织结构不清晰,可读性差 可维护性.扩展性差3.如何用函数 ...
- App启动流程
目录介绍 1.什么是Zygote进程 1.1 简单介绍 1.2 各个进程的先后顺序 1.3 进程作用说明 2.Zygote进程的启动流程 2.1 源码位置 2.2 ZygoteInit类的main方法 ...
- Python实现简易版Netcat
Netcat Netcat是一种网络工具,也称为"nc",可用于在计算机网络之间进行TCP/IP或UDP连接.它可以用于连接到其他计算机上的端口,发送和接收数据,扫描端口以及创建服 ...
- flutter3-dylive仿抖音App实例|Flutter3+Getx实战短视频直播应用
原创研发flutter3+getX+mediaKit跨平台仿抖音app短视频直播实战Flutter3-DouYin. flutter3_dylive使用最新跨平台技术flutter3.x+dart3+ ...
- 深入浅出Java 23种设计模式,最全PDF版本终于开放下载了!!(文末有福利)
写在前面 在「 冰河技术 」微信公众号中[设计模式专题]更新完毕已有一段时间了.不少小伙伴在我微信上留言说:冰河,你能不能把[设计模式专题]的文章汇总成PDF文档呢?一直没有时间整理,最近在公众号后台 ...