Filebeat 日志采集工具安装

Filebeat 是比较轻量的日志采集工具，对于一些简单的采集任务可以直接使用 Filebeat 采集，同时也支持很多的方式输出，可以输出至 Kafka、Elasticsearch、Redis 等，下面我们来简单配置下。

首先下载好安装包，例如：filebeat-8.6.2-linux-x86_64.tar.gz

然后直接解压安装包到指定的安装位置：

tar -xvzf filebeat-8.6.2-linux-x86_64.tar.gz -C /opt

cd /opt/filebeat-8.6.2-linux-x86_64

这样我们就将 filebeat 安装到了 cd /opt/filebeat-8.6.2-linux-x86_64 下面，然后我们来简单配置一下，编辑配置文件 filebeat.yml

- type: filestream

  # Unique ID among all inputs, an ID is required.

  id: myprogram-filestream-id

  # Change to true to enable this input configuration.

  enabled: true

  # Paths that should be crawled and fetched. Glob based paths.

  paths:

    - /opt/myprogram/logs/program.log

  processors:

  - add_fields:

      target: ""

      fields:

        streamId: 'myprogram-filestream-id'

  parsers:

    - ndjson:

        target: "jsonObject"

- type: filestream

  id: syslog-filestream-id

  enabled: true

  paths:

    - /var/log/messages

上面主要是关于采集的文件输入部分，可以配置多个文件流，但是每个文件流都必须有一个唯一的 id，这样方便 filebeat 通过 inode 去跟踪文件的变化，并且 paths 配置支持多个文件的目录，也就是同时监听多个文件，然后下面可以添加一些处理器，比如这里附加了一个 streamId 的字段用于在输出时知道来源，同时方便后续的检索，然后日志如果是 JSON 格式还可以配置解析方式，比如上面是 ndjson，输出的字段是 jsonObject，然后下级字段就是具体 JSON 解析的内容。第二个流是采集了系统日志，没有添加其他附加的功能。

另外还可以对日志进行简单的正则匹配或者过滤，具体可以参考文档：https://www.elastic.co/guide/en/beats/filebeat/8.6/filebeat-input-filestream.html

然后可以继续配置输出，支持多种输出，但是每次只能设置一种。

配置 Elasticsearch 如下：

output.elasticsearch:

  # Array of hosts to connect to.

  hosts: ["localhost:9200"]

  # Protocol - either `http` (default) or `https`.

  protocol: "https"

  # Authentication credentials - either API key or username/password.

  #api_key: "id:api_key"

  #username: "elastic"

  #password: "changeme"

配置直接输出到控制台，在调试时比较方便：

output.console:

  pretty: true

还可以输出到 Redis，实际上是写入 list 类型的队列：

output.redis:

  hosts: ["localhost:6379"]

  password: ""

  key: "filebeat"

  db: 2

  timeout: 5

除了上面方式还可以输出到 Logstach 方便二次处理等。

最后还可以配置一些公共的处理器，默认的内容如下：

processors:

  - add_host_metadata:

      when.not.contains.tags: forwarded

  - add_cloud_metadata: ~

  - add_docker_metadata: ~

  - add_kubernetes_metadata: ~

其中 add_host_metadata 会添加很多机器本身的信息，例如网卡、操作系统、CPU 型号等，下面的分别就是采集主流云厂商、Docker 以及 k8s 的信息处理器，这些处理器可以根据需要选择，如果关掉直接注释即可，另外还可以手动添加其他的处理器，可以参考：https://www.elastic.co/guide/en/beats/filebeat/8.6/filtering-and-enhancing-data.html，处理器既可以添加到全局也可以添加到指定的 input 下面，只对特定的输入生效。

最后保存配置文件，然后尝试运行 filebeat：

./filebeat -e

运行后从已配置的输出查看具体的内容即可。

Reference:

1. https://www.elastic.co/guide/en/beats/filebeat/8.6/filebeat-overview.html

Filebeat 日志采集工具安装的更多相关文章

Filebeat轻量级日志采集工具
Beats 平台集合了多种单一用途数据采集器.这些采集器安装后可用作轻量型代理,从成百上千或成千上万台机器向 Logstash 或 Elasticsearch 发送数据. 一.架构图此次试验基于前几 ...
【RSYSLOG】rsyslog作为日志采集器安装配置说明
RSYSLOG is the rocket-fast system for log processing. About 由于环境基于CentOS 6.7 x64,rsyslog本身就是OS的组件,由于 ...
flume 日志采集工具
Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集.聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据:同时,Flume提供对数据进行简单处理,并 ...
logstash日志采集工具的安装部署
1.从官网下载安装包,并通过Xftp5上传到机器集群上下载logstash-6.2.3.tar.gz版本,并通过Xftp5上传到hadoop机器集群的第一个节点node1上的/opt/uploads ...
日志采集工具Flume的安装与使用方法
安装Flume,参考厦门大学林子雨教程:http://dblab.xmu.edu.cn/blog/1102/ 并完成案例1 1.案例1:Avro source Avro可以发送一个给定的文件给Flum ...
Filebeat 日志收集器安装和配置
Filebeat的配置文件是/etc/filebeat/filebeat.yml,遵循YAML语法.具体可以配置如下几个项目: Filebeat Output Shipper Logging(可选) ...
自建Kubernetes logtail日志采集客户端安装方式
自建Kubernetes安装方式前提条件 Kubernetes集群版本1.8及以上. 已经安装Helm命令,版本2.6.4及以上. 安装步骤在日志服务控制台创建一个Project,Project名 ...
mysql 慢查询日志 pt-query-digest 工具安装
介绍:pt-query-digest是用于分析mysql慢查询的一个工具,它可以分析binlog.General log.slowlog,也可以通过SHOWPROCESSLIST或者通过tcpdump ...
（七）日志采集工具sleuth--分布式链路跟踪（zipkin）
微服务架构上通过业务来划分服务的,通过REST调用,对外暴露的一个接口,可能需要很多个服务协同才能完成这个接口功能,如果链路上任何一个服务出现问题或者网络超时,都会形成导致接口调用失败.随着业务的不断 ...
scribe日志分析工具安装
系统CentOS6.2 x86_64 1.yum安装gcc,flex,m4,python/python-devel,ruby,libevent/libevent-devel,openssl/opens ...

随机推荐

Module not specified-使用IDEA出现问题
一.问题由来使用IDE导入一个项目时,准备启动这个项目,然后突然报错,错误信息如标题中所示Module not specified.这个项目之前都还好好的怎么突然就运行不了了呢?让我感到很是疑惑, ...
【深度学习】批量归一化 BatchNormalization
一.背景机器学习的本质是对物理世界进行建模,做的就是拟合数据分布. 但是在模型训练过程中,神经网络参数不断更新,导数中间层的数据分布频繁地变化(内部协变量偏移),不利于网络参数 ...
UDP可靠传输协议KCP的一些理解
UDP主要用在哪两个方面游戏音视频通话为什么要使用UDP? 实时性的考虑,丢包重传,TCP协议栈重传无法控制,UDP重发可以自定义策略. 在DNS查询的时候,也使用UDP,对资源的考虑. 如何做 ...
掌握python的dataclass，让你的代码更简洁优雅
dataclass是从Python3.7版本开始,作为标准库中的模块被引入.随着Python版本的不断更新,dataclass也逐步发展和完善,为Python开发者提供了更加便捷的数据类创建和管理方式 ...
【Django】如何在类视图、普通视图单独不做CSRF校验
一.背景在某些特定场合下,需要局部禁用CSRF校验,比如,期望整个项目都启用CSRF,但是中途遇到某一两个视图要去掉这个校验二.方案 1.如果你写Django的路由用的类视图,那么需要这样写在 ...
python基础六（函数基础及参数使用）
一. 函数定义 1.什么是函数函数就相当于具备某一功能的工具函数的使用必须遵循一个原则: 先定义后调用2.为何要用函数代码冗余,程序的组织结构不清晰,可读性差可维护性.扩展性差3.如何用函数 ...
App启动流程
目录介绍 1.什么是Zygote进程 1.1 简单介绍 1.2 各个进程的先后顺序 1.3 进程作用说明 2.Zygote进程的启动流程 2.1 源码位置 2.2 ZygoteInit类的main方法 ...
Python实现简易版Netcat
Netcat Netcat是一种网络工具,也称为"nc",可用于在计算机网络之间进行TCP/IP或UDP连接.它可以用于连接到其他计算机上的端口,发送和接收数据,扫描端口以及创建服 ...
flutter3-dylive仿抖音App实例|Flutter3+Getx实战短视频直播应用
原创研发flutter3+getX+mediaKit跨平台仿抖音app短视频直播实战Flutter3-DouYin. flutter3_dylive使用最新跨平台技术flutter3.x+dart3+ ...
深入浅出Java 23种设计模式，最全PDF版本终于开放下载了！！（文末有福利）
写在前面在「冰河技术」微信公众号中[设计模式专题]更新完毕已有一段时间了.不少小伙伴在我微信上留言说:冰河,你能不能把[设计模式专题]的文章汇总成PDF文档呢?一直没有时间整理,最近在公众号后台 ...

Filebeat 日志采集工具安装

Filebeat 日志采集工具安装的更多相关文章

随机推荐

热门专题