通过helm部署EFK收集应用日志，ingress-nginx日志解析。

前段时间看了马哥的k8s新书，最后几章讲了下EFK，尝试部署了下，很多问题，这里改进下，写个笔记记录下吧。

准备工作

所有组件都通过helm3部署，选添加几个仓库。

helm repo add bitnami https://charts.bitnami.com/bitnami

helm repo add fluent https://fluent.github.io/helm-charts

存储用的nfs的sc，自行解决。

三个4G内存工作节点的k8s集群。

部署es

其中动态pv, prometheus 根据实际情况修改，没装prometheus也没什么事。

[root@bjzb-lecar-ops-jenkins-master-33 cluster-log]# cat bitnami-elasticsearch-values.yaml

clusterDomain: cluster.local   # Kubernetes集群域名；

name: elasticsearch   # Elasticsearch集群名称；

master:   # 准主节点相关的配置；

  name: master

  replicas: 2   # 实例数量；

  heapSize: 512m   # 堆内存大小；

  resources:

    limits: {}

    #   cpu: 1000m

    #   memory: 2048Mi

    requests:

      cpu: 200m

      memory: 512Mi

  persistence:   # 持久卷相关的配置；

    enabled: true    # 禁用时将自动使用emptyDir存储卷；

    storageClass: "managed-nfs-storage"   # 从指定存储类中动态创建PV；

    # existingClaim: my-persistent-volume-claim   # 使用现有的PVC；

    # existingVolume: my-persistent-volume    # 使用现有的PV；

    accessModes:

      - ReadWriteOnce

    size: 8Gi

  service:   # 服务配置

    type: ClusterIP

    port: 9300   # 节点间的transport流量使用端口；

coordinating:   # 仅协调节点相关的配置；

  replicas: 2   # 实例数量；

  heapSize: 128m

  resources:

    requests:

      cpu: 250m

      memory: 512Mi

  service:   # 仅协调节点相关的服务，这也是接收Elasticsearch客户端请求的入口；

    type: ClusterIP

    port: 9200

    # nodePort:

    # loadBalancerIP:

data:   # 数据节点相关的配置；

  name: data

  replicas: 2

  heapSize: 512m

  resources:   # 数据节点是CPU密集及IO密集型的应用，资源需求和限制要谨慎设定；

    limits: {}

    #   cpu: 100m

    #   memory: 2176Mi

    requests:

      cpu: 250m

      memory: 512Mi

  persistence:

    enabled: true

    storageClass: "managed-nfs-storage"

    # existingClaim: my-persistent-volume-claim

    # existingVolume: my-persistent-volume

    accessModes:

      - ReadWriteOnce

    size: 10Gi

ingest:   # 摄取节点相关的配置；

  enabled: false   # 默认为禁用状态；

  name: ingest

  replicas: 2

  heapSize: 128m

  resources:

    limits: {}

    #   cpu: 100m

    #   memory: 384Mi

    requests:

      cpu: 500m

      memory: 512Mi

  service:

    type: ClusterIP

    port: 9300

curator:   # curator相关的配置；

  enabled: false

  name: curator

  cronjob:   # 执行周期及相关的配置；

    # At 01:00 every day

    schedule: "0 1 * * *"

    concurrencyPolicy: ""

    failedJobsHistoryLimit: ""

    successfulJobsHistoryLimit: ""

    jobRestartPolicy: Never

metrics:   # 用于暴露指标的exporter；

  enabled: true

  name: metrics

  service:

    type: ClusterIP

    annotations:   # 指标采集相关的注解信息；

      prometheus.io/scrape: "true"

      prometheus.io/port: "9114"

  resources:

    limits: {}

    #   cpu: 100m

    #   memory: 128Mi

    requests:

       cpu: 100m

       memory: 128Mi

  podAnnotations:   # Pod上的注解，用于支持指标采集；

    prometheus.io/scrape: "true"

    prometheus.io/port: "8080"

  serviceMonitor:   # Service监控相关的配置

    enabled: false

    namespace: monitoring

    interval: 10s

    scrapeTimeout: 10s

helm install es -f bitnami-elasticsearch-values.yaml  bitnami/elasticsearch -n logging

哎，这一步各种问题，会遇到镜像下载慢，k8s集群资源不够（我已经把yml里申请的资源调的很低了），存储权限问题，反正大家注意点就行。

部署fluent-bit

[root@bj-k8s-master efk]# cat fluent-fluent-bit-values.yaml

# kind -- DaemonSet or Deployment

kind: DaemonSet

image:

  repository: fluent/fluent-bit

  pullPolicy: IfNotPresent

service:

  type: ClusterIP

  port: 2020

  annotations:

    prometheus.io/path: "/api/v1/metrics/prometheus"

    prometheus.io/port: "2020"

    prometheus.io/scrape: "true"

resources: {}

  # limits:

  #   cpu: 100m

  #   memory: 128Mi

  #requests:

  #  cpu: 100m

  #  memory: 128Mi

tolerations:

  - key: node-role.kubernetes.io/master

    effect: NoSchedule

config:

  service: |

    [SERVICE]

        Flush 3

        Daemon Off

        #Log_Level info

        Log_Level debug

        Parsers_File custom_parsers.conf

        Parsers_File parsers.conf

        HTTP_Server On

        HTTP_Listen 0.0.0.0

        HTTP_Port 2020

  inputs: |

    [INPUT]

        Name tail

        Path /var/log/containers/*.log

        Parser docker

        Tag kube.*

        Mem_Buf_Limit 5MB

        Skip_Long_Lines On

        Refresh_Interval  10

    [INPUT]

        Name tail

        Path /var/log/containers/nginx-demo*.log

        Parser docker

        Tag nginx-demo.*

        Mem_Buf_Limit 5MB

        Skip_Long_Lines On

        Refresh_Interval  10

    [INPUT]

        Name tail

        Path /var/log/containers/ingress-nginx-controller*.log

        Parser docker

        Tag ingress-nginx-controller.*

        Mem_Buf_Limit 5MB

        Skip_Long_Lines On

        Refresh_Interval  10

  filters: |

    [FILTER]

        Name                kubernetes

        Match               kube.*

        Kube_URL            https://kubernetes.default.svc:443

        Kube_CA_File        /var/run/secrets/kubernetes.io/serviceaccount/ca.crt

        Kube_Token_File     /var/run/secrets/kubernetes.io/serviceaccount/token

        Kube_Tag_Prefix     kube.var.log.containers.

        Merge_Log           On

        Keep_Log            Off

        K8S-Logging.Exclude On

        K8S-Logging.Parser On

    [FILTER]

        Name                kubernetes

        Match               ingress-nginx-controller.*

        Kube_URL            https://kubernetes.default.svc:443

        Kube_CA_File        /var/run/secrets/kubernetes.io/serviceaccount/ca.crt

        Kube_Token_File     /var/run/secrets/kubernetes.io/serviceaccount/token

        Kube_Tag_Prefix     kube.var.log.containers.

        Merge_Log           On

        Merge_Parser        ingress-nginx

        Keep_Log            Off

        K8S-Logging.Exclude On

        K8S-Logging.Parser On

  outputs: |

    [OUTPUT]

        Name es

        Match kube.*

        Host es-elasticsearch-coordinating-only.logging.svc.cluster.local.

        Logstash_Format On

        Logstash_Prefix k8s-cluster

        Type  flb_type

        Replace_Dots On

    [OUTPUT]

        Name es

        Match nginx-demo.*

        Host es-elasticsearch-coordinating-only.logging.svc.cluster.local.

        Logstash_Format On

        Logstash_Prefix nginx-demo

        Type  flb_type

        Replace_Dots On

    [OUTPUT]

        Name es

        Match ingress-nginx-controller.*

        Host es-elasticsearch-coordinating-only.logging.svc.cluster.local.

        Logstash_Format On

        Logstash_Prefix ingress-nginx-controller

        Type  flb_type

        Replace_Dots On

  customParsers: |

    [PARSER]

        Name docker_no_time

        Format json

        Time_Keep Off

        Time_Key time

        Time_Format %Y-%m-%dT%H:%M:%S.%L

    [PARSER]

        Name        ingress-nginx

        Format      regex

        Regex       ^(?<message>(?<remote>[^ ]*) - (?<user>[^ ]*) \[(?<time>[^\]]*)\] "(?<method>\S+)(?: +(?<path>[^\"]*?)(?: +\S*)?)?" (?<code>[^ ]*) (?<size>[^ ]*) "(?<referer>[^\"]*)" "(?<agent>[^\"]*)" (?<request_length>[^ ]*) (?<request_time>[^ ]*) \[(?<proxy_upstream_name>[^ ]*)\] \[(?<proxy_alternative_upstream_name>[^ ]*)\] (?<upstream_addr>[^ ]*) (?<upstream_response_length>[^ ]*) (?<upstream_response_time>[^ ]*) (?<upstream_status>[^ ]*) (?<req_id>[^ ]*).*)$

        Time_Key    time

        Time_Format %d/%b/%Y:%H:%M:%S %z

helm install fb -f fluent-fluent-bit-values.yaml fluent/fluent-bit -n logging

注意下es的host地址，如果跟我不是一样的namespace记得改下，吃过亏。这个书里提供的都写一个index里，nginx-ingress日志也不解析，fluent-bit研究了半天，大概就这程度吧，通过docker不同的log名字打上tag，这样每个应用在es里单独的index。当然量不大都写进一个index，通过label字段查询某应用的日志也行。

部署kibana

[root@bj-k8s-master efk]# cat bitnami-kibana-values.yaml

replicaCount: 1

updateStrategy:

  type: RollingUpdate

plugins:

  - https://github.com/pjhampton/kibana-prometheus-exporter/releases/download/7.8.1/kibana-prometheus-exporter-7.8.1.zip

persistence:

  enabled: true

  storageClass: "managed-nfs-storage"

  # existingClaim: your-claim

  accessMode: ReadWriteOnce

  size: 10Gi

service:

  port: 5601

  type: ClusterIP

  # nodePort:

  externalTrafficPolicy: Cluster

  annotations: {}

  # loadBalancerIP:

  # extraPorts:

ingress:

  enabled: true

  certManager: false

  annotations:

    kubernetes.io/ingress.class: nginx

  hostname: kibana.ilinux.io

  path: /

  tls: false

      # tlsHosts:

      #   - www.kibana.local

      #   - kibana.local

      # tlsSecret: kibana.local-tls

configuration:

  server:

    basePath: ""

    rewriteBasePath: false

metrics:

  enabled: true

  service:

    annotations:

      prometheus.io/scrape: "true"

      prometheus.io/port: "80"

      prometheus.io/path: "_prometheus/metrics"

  serviceMonitor:

    enabled: false

    # namespace: monitoring

    # interval: 10s

    # scrapeTimeout: 10s

    # selector:

    #   prometheus: my-prometheus

elasticsearch:

  hosts:

  - es-elasticsearch-coordinating-only.logging.svc.cluster.local.

  # - elasticsearch-2

  port: 9200

helm install kib -f bitnami-kibana-values.yaml bitnami/kibana -n logging

同上如果跟我namespace不一样记得改下es地址。这地方书里有坑，把charts pull下来看了下，values.yml文件有出入，估计是写书的时候chart版本不一样导致的。

配置kibana

自己改下hosts解析到ingress地址，访问kibana

添加匹配的索引

每个应用日志独立的index

ingress-nginx日志已解析

fluentbit官方文档

https://docs.fluentbit.io/

在线正则匹配

https://rubular.com/

通过helm部署EFK收集应用日志，ingress-nginx日志解析。的更多相关文章

Nginx访问日志、 Nginx日志切割、静态文件不记录日志和过期时间
1.Nginx访问日志配制访问日志:默认定义格式: log_format combined_realip '$remote_addr $http_x_forwarded_for [$time_loc ...
rsyslog服务器同步其他服务器上面应用日志（如mysql审计日志、nginx日志）
**环境说明**系统:ubuntu 14.04 (CentOS可以参考http://www.cnblogs.com/hanyifeng/p/5463338.html) rsyslog版本 :8.16. ...
Linux centosVMware Nginx访问日志、Nginx日志切割、静态文件不记录日志和过期时间
一.Nginx访问日志 vim /usr/local/nginx/conf/nginx.conf //搜索log_format 日至格式改为davery格式 $remote_addr 客户端IP ...
nginx日志、nginx日志切割、静态文件不记录日志和过期时间
2019独角兽企业重金招聘Python工程师标准>>> 12.10 Nginx访问日志日志格式 vim /usr/local/nginx/conf/nginx.conf //搜索l ...
elk 日志收集 filebeat 集群搭建 php业务服务日志 nginx日志 json 7.12版本 ELK 解决方案
难的不是技术,难的是业务.熟悉业务流程才是最难的. 其实搜索进来的每一个人的需求不一样,希望你能从我的这篇文章里面收获到. 建议还是看官方文档,更全面一些. 一.背景 1,收集nginx acces ...
第七章·Logstash深入-收集NGINX日志
1.NGINX安装配置源码安装nginx 因为资源问题,我们先将nginx安装在Logstash所在机器 #安装nginx依赖包 [root@elkstack03 ~]# yum install - ...
利用ELK分析Nginx日志生产实战(高清多图)
本文以api.mingongge.com.cn域名为测试对象进行统计,日志为crm.mingongge.com.cn和risk.mingongge.com.cn请求之和(此二者域名不具生产换环境统计意 ...
利用ELK分析Nginx日志
本文以api.mingongge.com.cn域名为测试对象进行统计,日志为crm.mingongge.com.cn和risk.mingongge.com.cn请求之和(此二者域名不具生产换环境统计意 ...
elk系列3之通过json格式采集Nginx日志
preface 公司采用的LNMP平台,跑着挺多nginx,所以可以利用elk好好分析nginx的日志.下面就聊聊它吧. 下面的所有操作都在linux-node2上操作安装Nginx nginx是开 ...

随机推荐

克鲁斯卡尔（Kruskal）算法（代码）
算法代码 C#代码 using System; using System.Linq; namespace Kruskal { class Program { static void Main(stri ...
Java on Visual Studio Code的更新 – 2021年4月
杨尧今 from Microsoft VS Code Java Team 欢迎来到这一期的VS Code Java更新.又是一个忙碌而富有成效的月份. Java调试器和Java测试扩展获得了新功能.在 ...
[DB] MapReduce 例题
词频统计(word count) 一篇文章用哈希表统计即可对互联网所有网页的词频进行统计(Google搜索引擎的需求),无法将所有网页读入内存 map:将单词提取出来,对每个单词输入一个<wo ...
Linux GCC lib库相互引用，互相依赖（交叉引用）链接解决办法
Linux GCC中,如果lib a依赖b,b又依赖a,链接的时候无论a放在前,还是b放在前,都会提示unrefrence. 解决办法就是: 链接的时候a链接两次,即: -la -lb -la
ltp日志
grep "fail" -i /var/log/messages |wc -lgrep "fail" -i /var/log/messagesgrep &quo ...
Linux中级之keepalived配置
hacmp: ibm的高可用集群软件,并且是商业的(收费),一般用于非x86架构机器当中 AIX,Unix 去IOE:ibm,oracle,emckeepalived: 一款高可用集群软件,利用vrr ...
矩阵中的路径 DFS+剪枝
给定一个 m x n 二维字符网格 board 和一个字符串单词 word .如果 word 存在于网格中,返回 true :否则,返回 false . 单词必须按照字母顺序,通过相邻的单元格内的字母 ...
android格式化日期
import android.text.format.DateFormat import java.util.* dateTextView.text = DateFormat.format(" ...
EVE-NG 入门教程 (Mac OSX BIg Sur)
EVE-NG 入门搭建指南 1. 什么是 EVE-NG EVE-NG (Emulate d Virtual Environment) 是一个可以运行虚拟主机.网络设备的模拟器,目前该软件分为了社区版. ...
Go语言协程并发---select多路复用应用
package main import ( "fmt" "time" ) /* ·循环从一写两读三条管道中随机选择一条能走的路 ·等所有路都走不通了就退出循环 ...

通过helm部署EFK收集应用日志，ingress-nginx日志解析。

通过helm部署EFK收集应用日志，ingress-nginx日志解析。的更多相关文章

随机推荐

热门专题