福利

Prometheus监控实战PDF电子书下载

链接:https://pan.baidu.com/s/1QH4Kvha5g70OhYQdp4YsfQ 
提取码:oou5 
若你喜欢该资料,请购买该资料原版……以及不用于商业用途,或仅用于研究目的,24小时内删除。

以下部分为我个人的阅读分享,即所谓的化重点部分


正文开始

监控应该服务于两个方面:一个是技术(提升技术),一个是业务(保证服务)

Zabbix等监控使用的静态阀值的缺点。需要考虑到系统的动态性,复杂性

底层系统的监控对于实际业务的价值不大.不能说你系统没问题,应用就没有问题。对底层操作系统的监控,只适合作为监控辅助

监控顺序应该先从靠近客户侧开始,业务监控为主,应用监控为辅,系统监控次之

监控内容应该要准确。例如不应该只监控HTTP200状态吗,还应该监控到具体的业务层面,例如页面是否正常显示,客户访问延迟有多少,访问失败率是否过高等。

监控时尽量不要使用平均值等指标,而应该使用百分位数,加上其他指标,建议是50分位数,90分位数,最大值。这里以100个用户访问站点的时间为例,解释一下所谓的百分位数,即所有用户访问站点的时间从小到大排列,其中前面90个用户都在3秒甚至更短的时间内成功访问到站点,那么我们就可以说用户访问站点的90分位数的时间是3秒,换句话说就是90%都在3秒甚至更短的时间内成功访问到站点。

对于系统层面的监控,我们应该采用USE模式。其中U(使用率),S(饱和度),E(错误率)

对于应用程序的监控,我们应该采用谷歌的四大环境指标——延迟,流量,错误,饱和度

监控周期应该尽可能频繁,避免导致检查间隔期丢失关键事件

监控服务应该尽可能自动化,自服务,减少人为的后期配置

监控方法分为探针和内省,探针针对的是从外部探测应用服务状态,例如http返回码,ICMP检查等。内省是针对检查应用程序内部运行状态,更适合报告和诊断,探针则是适合发现问题

指标类型分为:测量型(上下浮动),计数型(累加,可重置归零),直方图(相当于频率分布区间)

Prometheus监控实战day1-监控简介的更多相关文章

  1. Docker 监控实战

    如今,越来越多的公司开始使用 Docker 了,现在来给大家看几组数据: 2 / 3 的公司在尝试了 Docker 后最终使用了它 也就是说 Docker 的转化率达到了 67%,而转化市场也控制在 ...

  2. 监控实战Prometheus+Grafana

    这期的分享是监控实战,其实不想写这篇的,因为网上相关的文章也挺多的,但是出于光说不练都是假把式,而且也想告诉你:当帅气的普罗米修斯(Prometheus)遇到高颜值的格拉法纳(Grafana)究竟会擦 ...

  3. K8S(13)监控实战-部署prometheus

    k8s监控实战-部署prometheus 目录 k8s监控实战-部署prometheus 1 prometheus前言相关 1.1 Prometheus的特点 1.2 基本原理 1.2.1 原理说明 ...

  4. prometheus和granfana企业级监控实战v5

    文件地址:https://files.cnblogs.com/files/sanduzxcvbnm/prometheus和granfana企业级监控实战v5.pdf

  5. 监控实战之Prometheus

    author:JevonWei 版权声明:原创作品 目录 一 背景 二 部署Prometheus Server Prometheus 主配置文件 targets 节点配置文件 rules 告警规则 运 ...

  6. 项目实战——企业级Zabbix监控实战(一)

    项目实战--企业级Zabbix监控实战 实验一:Zabbix监控的搭建 1.实验准备 centos系统服务器3台. 一台作为监控服务器, 两台台作为被监控节点, 配置好yum源. 防火墙关闭. 各节点 ...

  7. 百度网络监控实战:NetRadar横空出世(下)

    原文:https://mp.weixin.qq.com/s/CvCs-6rX8Lb5vSTSjYQaBg 转自订阅号「AIOps智能运维」,已授权运维帮转发 作者简介:运小贝,百度高级研发工程师 负责 ...

  8. 百度网络监控实战:NetRadar横空出世(上)

    原文:https://mp.weixin.qq.com/s/VBShicsqReDtureKAdEgDA 转自订阅号「AIOps智能运维」,已授权运维帮转发 作者简介:运小贝,百度高级研发工程师 负责 ...

  9. Centos7.X 搭建Prometheus+node_exporter+Grafana实时监控平台

    Prometheus简介 什么是 Prometheus Prometheus是一个开源监控报警系统和时序列数据库 主要功能 多维数据模型(时序由 metric 名字和 k/v 的 labels 构成) ...

随机推荐

  1. graylog-日志收集

    1.linux主机日志收集 使用syslog协议将系统日志发送到graylog上进行收集,可以指定端口 touch /etc/rsyslog.d/graylog.conf *.* @192.168.9 ...

  2. windows使用 xxx.bat运行相关指令

    今日思语:成人的世界,请停止低层次的忙碌 一般是windows上需要执行一些支持的命令时,我们一般都会直接使用控制台去操作,对于需要频繁操作的指令来说,使用控制台略显有些不便,比如不小心关闭后控制台后 ...

  3. Landscaping Gym - 101128F (网络流)

    Problem F: Landscaping \[ Time Limit: 1 s \quad Memory Limit: 256 MiB \] 题意 题意是给出一个\(n*m\)的格子,其中一些是低 ...

  4. Git常用命令与入门

    Git 仓库就是那个.git 目录,其中存放的是我们所提交的文档索引内容,Git 可基于文档索引内容对其所管理的文档进行内容追踪,从而实现文档的版本控制..git目录位于工作目录内.对于任何一个文件, ...

  5. P4211 [LNOI2014]LCA LCT

    P4211 [LNOI2014]LCA 链接 loj luogu 思路 多次询问\(\sum\limits_{l \leq i \leq r}dep[LCA(i,z)]\) 可以转化成l到r上的点到根 ...

  6. Js更改整页a标签跳转方式

    <script> var anchors = document.getElementsByTagName("a"); for(i=0;i<anchors.leng ...

  7. 你知道多少this,new,bind,call,apply?那我告诉你

    那么什么是this,new,bind,call,apply呢?这些你都用过吗?掌握这些内容都是基础中的基础了.如果你不了解,那还不赶快去复习复习,上网查阅资料啥的! 通过call,apply,bind ...

  8. shell 四则运算

    test.sh #/bin/bash read -p "请输入第一个数:" a read -p "请输入第二个数:" b if [ $a -gt $b ] th ...

  9. 【POJ2676】Sudoku

    本题传送门 本题知识点:深度优先搜索 + 回溯 问题就是要让我们解决一个数独问题.如果你懂得怎么玩数独的话,那就很自然想到用暴力搜索去做题.(比如我就不会,所以先WA了一发quq) 数独符合三个条件 ...

  10. oracle 如何通过分组计数查出重复数据?

      1.情景展示 现在,机构表数据中机构名称有重复数据,如何筛选出来? 2.分析 第一步:统计是否存在重复数据. 方式一: 方式二: 说明表中确实存在重复数据 第二步:统计重复次数及机构名称. 需要通 ...