面上有很多优秀的 OS 级监控系统 (比如 falcon), 这些监控系统主要聚焦在 CPU/IO/Mem/Disk 和应用端口, falcon 甚至可以监控到 JVM. 但对于应用系统内部的一些监控, 比如程序的 exception/接口性能/调用链, 这些系统级的监控系统就不太好用了.
大众点评开源的 cat, 就是一个为数不多的面向应用的监控系统, 而且应该最好的一个.

======================
cat 使用场景:
======================
亮点:
1. [Event 类]: 使用 cat 收集程序抛出的 exception. cat 有报错大盘界面.
2. [Transaction 类]: 性能监控, 跨越边界的行为往往会引起性能问题.
3. [Event 类]: 实时监某系统访问频率.
4. [Transaction 类]: 分布式调用链监控, 这在微服务架构中尤其重要.
其他场景:
1. [Heatbeat 类]: 监控业务系统自身的一些指标, 比如 cpu/io 等. 程序需要主动定期执行心跳汇报指令.
2. [Metric 类]: 监控单位时间内的一些业务指标, 这些指标可以是累加计数类, 也可以是数值类. 对于累加计数类,

Cat 提供发送 alert 功能, 我们可以将报警以邮件/微信形式发送出去.

======================
Cat 内部机制:
======================
1. 业务应用: 业务应用通过 cat 的客户端进行埋点.
2. cat 客户端 (Cat-client): cat 客户端负责将埋点消息以队列形式传递到 cat 消费机.
cat 客户端和 cat 消费机之间是通过 TCP 长连接方式通讯的, 另外又是异步的消息队列, 所以性能很好.
3. cat 消费机 (Cat-consumer): cat 消费机不断地从网络中取出消息树, 然后转到服务端的消费队列中.
4. 控制台 (cat-home): cat-home 负责 Web UI 展现, 所有的 cat 节点都可作为控制台.
5. 告警端 (alarm-machine), 启动告警线程, 进行规则匹配, 发送告警信息, cat 集群中只有一个节点可以作为告警机.
6. 任务机 (job-machine), 做一些离线的任务,合并天、周、月等报表, cat 集群中只有一个节点可以作为任务机.
7. cat 原始日志转储 (Cat-consumer 组件之一), cat 原始日志转储可以认为是一个特殊的报表分析器, 它不生成报表, 仅仅是将消息存储到本地文件系统.

cat 所有服务器组件, 包括 cat-consumer 和 cat-home , 都是运行在同一个 JVM 内部的, 所以每个 cat 服务端既可以作为 consumer, 也可以作为 home, 另外一个 cat 集群可以跨多个数据中心.

实时报表: CAT 会生成每小时的报表, 对于当前小时, 是基于内存的, 所以 cat 能显示实时报表, 即使是多台机器构成的 cat 集群, 在报表上呈现的也是所有机器汇总, 而不是单台机器的汇总. cat 会展现单位时间内指标的总和, 对于数值类 metric, cat 会自动计算平均值等统计指标.

c

消息树可以嵌套

======================
Message-ID 格式
======================
Message-ID 格式: applicationName-ip-time-seq
第一段:是应用名 applicationName, 所以 applicationName 取名不要太长, 以减少网络开销.
第二段:是当前这台机器的 IP 的 16 进制格式.
第三段:是系统当前时间除以小时得到的整点数.
第四段:是表示当前这个客户端在当前小时的顺序递增号 (AtomicInteger 自增,每小时结束后重置).

======================
参考
======================

深入详解美团点评CAT跨语言服务监控(一) CAT简介与部署
https://blog.csdn.net/caohao0591/article/details/80693289
官网:
http://unidal.org/ http://cat.meituan.com/
发布历史
http://unidal.org/cat/r/home?op=view&docName=release
源码和文档
https://github.com/dianping/cat
透过 CAT,来看分布式实时监控系统的设计与实现
http://www.chanpin100.com/article/45629
深度剖析开源分布式监控 CAT
https://tech.meituan.com/CAT_in_Depth_Java_Application_Monitoring.html
大众点评CAT开源监控系统剖析
https://www.cnblogs.com/yeahwell/p/cat.html

点评cat系列-简介的更多相关文章

  1. 点评cat系列-服务器开发环境部署

    我们有三种部署方式:1. docker 部署2. 采用官方的 war 包部署. 3. 源码部署 很显然 docker 部署是最简单的, 我尝试了多次, 都在 cat docker 容器镜像的编译过程失 ...

  2. 点评cat系列-应用集成

    ========================消息的基本属性========================消息的几个属性:type: 定义消息的 category, 比如 SQL 或 RPC 或 ...

  3. 深入详解美团点评CAT跨语言服务监控(一) CAT简介与部署

    前言: CAT是一个实时和接近全量的监控系统,它侧重于对Java应用的监控,除了与点评RPC组件融合的很好之外,他将会能与Spring.MyBatis.Dubbo 等框架以及Log4j 等结合,支持P ...

  4. 美团点评CAT监控平台研究

    1. 美团点评CAT监控平台研究 1.1. 前言 此文根据我对官方文档阅读并记录整理所得,中间可能会穿插一些自己的思考和遇坑 1.2. 简介 CAT 是基于 Java 开发的实时应用监控平台,为美团点 ...

  5. 深入详解美团点评CAT跨语言服务监控(六)消息分析器与报表(一)

    大众点评CAT微服务监控架构对于消息的具体处理,是由消息分析器完成的,消息分析器会轮训读取PeriodTask中队列的消息来处理,一共有12类消息分析器,处理后的结果就是生成各类报表. 消息分析器的构 ...

  6. 深入详解美团点评CAT跨语言服务监控(四)服务端消息分发

    这边首先介绍下大众点评CAT消息分发大概的架构如下: 图4 消息分发架构图 分析管理器的初始化 我们在第一章讲到服务器将接收到的消息交给解码器(MessageDecoder)去做解码最后交给具体的消费 ...

  7. 深入详解美团点评CAT跨语言服务监控(三)CAT客户端原理

    cat客户端部分核心类 message目录下面有消息相关的部分接口 internal目录包含主要的CAT客户端内部实现类: io目录包含建立服务端连接.重连.消息队列监听.上报等io实现类: spi目 ...

  8. 深入详解美团点评CAT跨语言服务监控(二) CAT服务端初始化

    Cat模块 Cat-client : cat客户端,编译后生成 cat-client-2.0.0.jar ,用户可以通过它来向cat-home上报统一格式的日志信息,可以集成到 mybatis.spr ...

  9. 大众点评cat实时监控简介及部署

    简介 背景 CAT(Central Application Tracking)是由吴其敏(前大众点评首席架构师,现携程架构负责人)主导设计基于Java开发打造的实时应用监控平台,为大众点评网提供了全面 ...

随机推荐

  1. 英语口语练习系列-C10-up and down

    <长恨歌>·白居易 长恨歌朗读视频,点我可听,thanks 长恨歌-白居易 汉皇重色思倾国,御宇多年求不得.杨家有女初长成,养在深闺人未识. 天生丽质难自弃,一朝选在君王侧.回眸一笑百媚生 ...

  2. CSS---文档流布局 | 脱标-postion-zindex | 脱标-浮动

    一.css文档流布局概念 1.1,什么是标准文档流 1.2,标准文档流下有哪些微观现象 二.CSS---position属性 2.1,position:relative 2.2,position:fi ...

  3. Redis其他常用操作

    详细Redis操作手册: http://doc.redisfans.com/ ============================================================= ...

  4. SQL MID() 函数

    MID() 函数 MID 函数用于从文本字段中提取字符. SQL MID() 语法 SELECT MID(column_name,start[,length]) FROM table_name 参数 ...

  5. w3m 使用总结

    安装 sudo apt install w3m终端 w3m www.baidu.com 即可打开w3m是个开放源代码的命令行下面的网页浏览器.一般的linux系统都会自带这个工具,可以通过它在命令行下 ...

  6. grep -v、-e、-E

    在Linux的grep命令中如何使用OR,AND,NOT操作符呢? 其实,在grep命令中,有OR和NOT操作符的等价选项,但是并没有grep AND这种操作符.不过呢,可以使用patterns来模拟 ...

  7. Django模板语言(Template)

    1.变量 变量相关用 { { } }   逻辑相关用{% %} 2.Filter过滤器 (1)default 如果一个变量是false或者为空,使用给定的默认值. 否则,使用变量的值.   {{ va ...

  8. Linux内存管理 (22)内存检测技术(slub_debug/kmemleak/kasan)

    专题:Linux内存管理专题 关键词:slub_debug.kmemleak.kasan.oob.Redzone.Padding. Linux常见的内存访问错误有: 越界访问(out of bound ...

  9. 点击button自动刷新页面的奇葩错误

    以前在写练习的时候遇到过这样一个问题,自己在html中写了一个button <button>test1</button> 在没有给其附上onclick事件时是点击是不会有任何反 ...

  10. 静态类(C#)

    基本简介: 类可以声明为 static 的,以指示它仅包含静态成员.不能使用 new 关键字创建静态类的实例.静态类在加载包含该类的程序或命名空间时由 .NET Framework 公共语言运行库 ( ...