Prometheus监控实战day1-监控简介
福利
Prometheus监控实战PDF电子书下载
链接:https://pan.baidu.com/s/1QH4Kvha5g70OhYQdp4YsfQ
提取码:oou5
若你喜欢该资料,请购买该资料原版……以及不用于商业用途,或仅用于研究目的,24小时内删除。
以下部分为我个人的阅读分享,即所谓的化重点部分
正文开始
监控应该服务于两个方面:一个是技术(提升技术),一个是业务(保证服务)
Zabbix等监控使用的静态阀值的缺点。需要考虑到系统的动态性,复杂性
底层系统的监控对于实际业务的价值不大.不能说你系统没问题,应用就没有问题。对底层操作系统的监控,只适合作为监控辅助
监控顺序应该先从靠近客户侧开始,业务监控为主,应用监控为辅,系统监控次之。
监控内容应该要准确。例如不应该只监控HTTP200状态吗,还应该监控到具体的业务层面,例如页面是否正常显示,客户访问延迟有多少,访问失败率是否过高等。
监控时尽量不要使用平均值等指标,而应该使用百分位数,加上其他指标,建议是50分位数,90分位数,最大值。这里以100个用户访问站点的时间为例,解释一下所谓的百分位数,即所有用户访问站点的时间从小到大排列,其中前面90个用户都在3秒甚至更短的时间内成功访问到站点,那么我们就可以说用户访问站点的90分位数的时间是3秒,换句话说就是90%都在3秒甚至更短的时间内成功访问到站点。
对于系统层面的监控,我们应该采用USE模式。其中U(使用率),S(饱和度),E(错误率)
对于应用程序的监控,我们应该采用谷歌的四大环境指标——延迟,流量,错误,饱和度
监控周期应该尽可能频繁,避免导致检查间隔期丢失关键事件
监控服务应该尽可能自动化,自服务,减少人为的后期配置
监控方法分为探针和内省,探针针对的是从外部探测应用服务状态,例如http返回码,ICMP检查等。内省是针对检查应用程序内部运行状态,更适合报告和诊断,探针则是适合发现问题
指标类型分为:测量型(上下浮动),计数型(累加,可重置归零),直方图(相当于频率分布区间)
Prometheus监控实战day1-监控简介的更多相关文章
- Docker 监控实战
如今,越来越多的公司开始使用 Docker 了,现在来给大家看几组数据: 2 / 3 的公司在尝试了 Docker 后最终使用了它 也就是说 Docker 的转化率达到了 67%,而转化市场也控制在 ...
- 监控实战Prometheus+Grafana
这期的分享是监控实战,其实不想写这篇的,因为网上相关的文章也挺多的,但是出于光说不练都是假把式,而且也想告诉你:当帅气的普罗米修斯(Prometheus)遇到高颜值的格拉法纳(Grafana)究竟会擦 ...
- K8S(13)监控实战-部署prometheus
k8s监控实战-部署prometheus 目录 k8s监控实战-部署prometheus 1 prometheus前言相关 1.1 Prometheus的特点 1.2 基本原理 1.2.1 原理说明 ...
- prometheus和granfana企业级监控实战v5
文件地址:https://files.cnblogs.com/files/sanduzxcvbnm/prometheus和granfana企业级监控实战v5.pdf
- 监控实战之Prometheus
author:JevonWei 版权声明:原创作品 目录 一 背景 二 部署Prometheus Server Prometheus 主配置文件 targets 节点配置文件 rules 告警规则 运 ...
- 项目实战——企业级Zabbix监控实战(一)
项目实战--企业级Zabbix监控实战 实验一:Zabbix监控的搭建 1.实验准备 centos系统服务器3台. 一台作为监控服务器, 两台台作为被监控节点, 配置好yum源. 防火墙关闭. 各节点 ...
- 百度网络监控实战:NetRadar横空出世(下)
原文:https://mp.weixin.qq.com/s/CvCs-6rX8Lb5vSTSjYQaBg 转自订阅号「AIOps智能运维」,已授权运维帮转发 作者简介:运小贝,百度高级研发工程师 负责 ...
- 百度网络监控实战:NetRadar横空出世(上)
原文:https://mp.weixin.qq.com/s/VBShicsqReDtureKAdEgDA 转自订阅号「AIOps智能运维」,已授权运维帮转发 作者简介:运小贝,百度高级研发工程师 负责 ...
- Centos7.X 搭建Prometheus+node_exporter+Grafana实时监控平台
Prometheus简介 什么是 Prometheus Prometheus是一个开源监控报警系统和时序列数据库 主要功能 多维数据模型(时序由 metric 名字和 k/v 的 labels 构成) ...
随机推荐
- Entity 类中加了@Id 注解后仍然出现org.hibernate.AnnotationException: No identifier specified for entity 错误
查看网上的资料,应该是报错的实体类com.example.domain.p.User中没有添加加主键的注解@Id,这个是必须的.但是我的实体类中明明已经添加了@Id,为什么还会报这个错误呢? 后来检查 ...
- LeetCode 916. Word Subsets
原题链接在这里:https://leetcode.com/problems/word-subsets/ 题目: We are given two arrays A and B of words. E ...
- mysql和sqliet连接
Python里Django框架数据库要配置1.setting已经自己配置好2.需要自己连接.找到setting里DATABASES进行连接自己数据库MySQL数据库连接 model里创建数据表就是Dj ...
- 关于kmp算法
字符串匹配算法简称kmp 日常安利大佬博客(真的是一篇很好的文章) 觉得百度百科讲的也挺好 就是给出两个字符串a, b 求b在a中的所有位置 next数组:代表当前字符之前的字符串中,有多大长度的相同 ...
- CCF 201812-3 CIDR合并
CCF 201812-3 CIDR合并 //100分 93ms #include<stdio.h>//CCF上stdio.h比cstdio快!!! #include<string.h ...
- nginx.conf 配置解析之 server配置
server{} 包含在http{}内部,每一个server{}都是一个虚拟主机(站点) 以下为nginx.conf配置文件中server{ }部分的内容. server { listen ; // ...
- GEE windows 环境配置
参照GEE开发大神的一篇文章GEE学习笔记 三十五:windows下配置本地开发环境 - 无形的风的文章 - 知乎. 按他的顺序下来还是出了点问题,再整理一下自己遇到的问题. 1.安装Google的 ...
- 解决linux环境下nohup: redirecting stderr to stdout问题
在生产环境下启动Weblogic时,发现原来好好的nohup信息输出到指定文件中的功能,突然出问题了.现象是控制台输出的信息一部分输出到了我指定的文件,另一部分却输出到了nohup.out,而我是不想 ...
- 数据结构Java版之基数排序(四)
基数排序: 基数排序分为两种:第一种是LSD ,从最低位开始排序, 第二种是 MSD 从最高位开始排.这里介绍第一种LSD排序算法. 首先,我们先了解什么是基数.基数是根据具体的排序情况而定的,比如我 ...
- Linux(环境篇):系统搭建本地FTP后,无法登录(331 Please specify the password.)问题解决
首先 Linux 搭建ftp,开放21端口.(省略...) 你可能会遇到以下问题:错误 SELinux is disabled 解决: setenforce: SELinux is disabled ...