从SpringBoot构建十万博文聊聊Tomcat集群监控

前言
在十万博文终极架构中,我们使用了Tomcat集群,但这并不能保证系统不会出问题,为了保证系统的稳定运行,我们还需要对 Tomcat 进行有效的运维监控手段,不至于问题出现或者许久一段时间才知道。凌晨一点这个锅可谁都不想背,为此基于目前的情况搭建了以下这么一套监控预警系统。
架构图

相关软件
- Nginx:代理访问 Grafana
 - Grafana: 可视化面板(Dashboard),有着非常漂亮的图表和布局展示
 - Influxdb:开源的时间序列数据库,适用于记录度量,事件及执行分析
 - Telegraf:收集系统和服务的统计数据
 - Docker:开源的应用容器引擎,让开发者可以打包他们的应用以及依赖包到一个可移植的容器中
 
监控架构

GTI监控预警系统,架构流程说明:
- 第一步:数据采集,Telegraf 采集 Tomcat 相关参数数据
 - 第二步:数据存储,Influxdb 存储 Telegraf 采集的数据
 - 第三步:数据可视化,Grafana 配置 Tomcat 监控面板
 - 第四步:预警通知,配置钉钉、邮件等预警
 
安装配置
这里只对Grafana、Telegraf、Influxdb、Tomcat 做相应的安装说明,Nginx 以及 Docker 请自行查阅资料。
Grafana
Grafana只是一个接入数据源的可视化面板,这里为了方便,我们选择Docker安装。
mkdir grafana
ID=$(id -u)
docker run -d --user $ID --name=grafana  --volume "$PWD/grafana:/var/lib/grafana" -p 3000:3000 grafana/grafana
# 如果生产环境配置,最好提前配置好域名
docker run -d --user $ID --name=grafana --volume "$PWD/data:/var/lib/grafana" -p 3000:3000 -e "GF_SERVER_ROOT_URL=http://monitor.52itstyle.vip" grafana/grafana
执行成功以后,执行以下命令:
docker ps
如果出现grafana运行容器说明安装成功。
查看容器相关参数:
docker inspect docker.io/grafana/grafana
进入:
docker exec -it grafana /bin/sh
Grafana的默认配置文件grafana.ini位于容器中的/etc/grafana,这个文件是映射不出来的。不过可以先创建并运行一个容器,拷贝出来重新创建运行容器。
参数说明(这里截取了部分重点参数):
##################### Grafana 几个重要的参数(参考一下) #####################
[paths]
# 存放临时文件、session以及sqlite3数据库的目录
;data = /var/lib/grafana
# 存放日志的地方
;logs = /var/log/grafana
# 存放相关插件的地方
;plugins = /var/lib/grafana/plugins
#################################### Server ####################################
[server]
# 默认协议 支持(http, https, socket)
;protocol = http
# 默认端口
;http_port = 3000
# 这里配置访问地址,如果使用了反向代理请配置域名,发送告警通知的时候作为访问地址
root_url = http://grafana.52itstyle.vip
#################################### Database ####################################
[database]
# 默认使用的数据库sqlite3,位于/var/lib/grafana目录下面
;path = grafana.db
#################################### Session ####################################
[session]
# session 存储方式,默认是file即可  Either "memory", "file", "redis", "mysql", "postgres", default is "file"
;provider = file
#################################### SMTP / Emailing ##########################
[smtp]
# 邮件服务器配置,自行修改配置
enabled = true
host = smtp.mxhichina.com:465
user = admin@52itstyle.vip
# If the password contains # or ; you have to wrap it with trippel quotes. Ex """#password;"""
password = 123456
;cert_file =
;key_file =
;skip_verify = false
from_address = admin@52itstyle.vip
# 这里不要设置中文,否则会发送失败
from_name = Grafana
Influxdb
创建并运行容器
docker run -d -p 8083:8083 -p 8086:8086 -e ADMIN_USER="root" -e INFLUXDB_INIT_PWD="root" -e PRE_CREATE_DB="telegraf" --name influxdb tutum/influxdb:latest
各个参数含义:
-d:容器在后台运行
--name:容器名称
-e:指定环境变量,容器中可以使用该环境变量 
-p:将容器内端口映射到宿主机端口,格式为 宿主机端口:容器内端口;8083是influxdb的web管理工具端口,8086是influxdb的HTTP API端口
执行成功以后,执行以下命令:
docker ps
如果出现influxdb运行容器说明安装成功。
访问地址:http://ip:8083/

Telegraf
docker pull telegraf
把telegraf相关配置拷贝到宿机
docker cp telegraf:/etc/telegraf/telegraf.conf ./telegraf
采集Tomcat数据:
如果想监控多个Tomcat,这里配置多个[[inputs.tomcat]]即可,但是一定要配置不同的tags标识。
[[inputs.tomcat]]
url = "http://192.168.1.190:8080/manager/status/all?XML=true"
# Tomcat访问账号密码 必须配置
username = "tomcat"
password = "tomcat"
timeout = "5s"
# 标识Tomcat名称、根据实际项目部署情况而定
[inputs.tomcat.tags]
host = "blog"
[[inputs.tomcat]]
url = "http://192.168.1.190:8081/manager/status/all?XML=true"
# Tomcat访问账号密码 必须配置
username = "tomcat"
password = "tomcat"
timeout = "5s"
# 标识Tomcat名称、根据实际项目部署情况而定
[inputs.tomcat.tags]
host = "bbs"
采集数据到influxdb:
[[outputs.influxdb]]
      # urls = ["udp://localhost:8089"] # UDP endpoint example
      urls = ["http://localhost:8086"] # required,这个url改成自己host
      ## The target database for metrics (telegraf will create it if not exists).
      database = "telegraf" # 这个会在influx库创建一个库
把配置文件复制到容器:
docker cp telegraf.conf telegraf:/etc/telegraf/telegraf.conf
重启telegraf服务:
docker restart docker
Tomcat
由于telegraf收集Tomcat相关数据需要配置访问权限,这里我们选择Tomcat7做配置说明。
修改位于conf下的tomcat-users.xml文件:
<tomcat-users>
<user username="tomcat" password="tomcat" roles="manager-gui,manager-script,manager-jmx,manager-status"/>
</tomcat-users>
重启Tomcat容器,访问以下地址:
http://ip:8080/manager/status/all?XML=true

如果出现以上界面,说明配置成功。
监控配置
依次启动Tomcat、Influxdb、Telegraf、Grafana完成后,我们进入Grafana后台管理进行相关配置。
配置Influxdb数据源:
选择 datasources/Add datasource

输入正确的HTTP地址以及数据库账号密码,点击保存,如果出现绿色提示框,说明配置成功。
配置Tomcat仪表盘:
选择 dashboard/import

这里有三种方式导入面板:
- 选择输入官方面板ID或者URL
 - 直接复制黏贴JSON格式代码
 - 导入第三方面板JSON格式文件
 
这里我们导入事先自己定制保存的Tomcat监控面板,最后点击导入保存。

如果不出意外,将会是下图的样子。

告警配置
前期做了这么多,我们的最终目的是为了提前预警通知,在系统即将发生灾难之前作出相应的准备调整。这里我们以Tomcat的线程数量阈值作为预警通知。
点击线程面板-选择编辑:

配置相关参数:

1、Alert名称,可以自定义。
2、执行的频率,这里我选择每60s检测一次。
3、判断标准,默认是avg,这里是下拉框,自己按需求选择。
4、query(A,5m,now),字母A代表选择的metrics中设置的sql,也可以选择其它在metrics中设置的,但这里是单选。5m代表从现在起往之前的五分钟,即5m之前的那个点为时间的起始点,now为时间的结束点,此外这里可以自己手动输入时间。
5、设置的预警临界点,这里手动输入,和6是同样功能,6可以手动移动,两种操作是等同的。
配置预警信息以及通知方式:

这里我们选择的是邮件预警通知,但是要提前进行配置,详见一开始grafana.ini中 SMTP / Emailing 相关参数配置。


点击发送测试,提示成功会发送一份告警Demo到指定邮箱:

总结
讲道理,这一套东西还是挺强大的。特别是对于中小公司来说,各种成熟的开源组间一整合完美搭建出一套监控系统,时间成本、人力成本、技术成本可以降到最低。
参考文档
大家安装过程中,版本可能不尽相同,相关页面展示会不一致,但是不会影响最终功能呈现。
https://docs.influxdata.com/influxdb/
https://docs.influxdata.com/telegraf/
https://blog.52itstyle.vip/archives/2014/
https://blog.52itstyle.vip/archives/2029/
https://github.com/influxdata/telegraf/pull/3277
从SpringBoot构建十万博文聊聊Tomcat集群监控的更多相关文章
- 从SpringBoot构建十万博文聊聊限流特技
		
前言 在开发十万博客系统的的过程中,前面主要分享了爬虫.缓存穿透以及文章阅读量计数等等.爬虫的目的就是解决十万+问题:缓存穿透是为了保护后端数据库查询服务:计数服务解决了接近真实阅读数以及数据库服务的 ...
 - 从SpringBoot构建十万博文聊聊缓存穿透
		
前言 在博客系统中,为了提升响应速度,加入了 Redis 缓存,把文章主键 ID 作为 key 值去缓存查询,如果不存在对应的 value,就去数据库中查找 .这个时候,如果请求的并发量很大,就会对后 ...
 - 从SpringBoot构建十万博文聊聊高并发文章浏览量设计
		
前言 在经历了,缓存.限流.布隆穿透等等一系列加强功能,十万博客基本算是成型,网站上线以后也加入了百度统计来见证十万+ 的整个过程. 但是百度统计并不能对每篇博文进行详细的浏览量统计,如果做一些热点博 ...
 - nginx+tomcat集群配置(4)--rewrite规则和多应用根目录设定思路
		
前言: nginx中有一块很重要的概念, 就是rewrite规则. 它会对URL进行修改, 然后进行内部的重定向. rewrite授予了nginx更多的自由, 使得后级服务的接入更加地方便. 本文将简 ...
 - 【原创】搭建Nginx(负载均衡)+Redis(Session共享)+Tomcat集群
		
为什么移除首页?哪里不符合要求?倒是回我邮件啊! 一.环境搭建 Linux下Vagrant搭建Tomcat7.Java7 二.Nginx的安装配置与测试 *虚拟机下转至root sudo -i 1)下 ...
 - 搭建Nginx(负载均衡)+Redis(Session共享)+Tomcat集群
		
一.环境搭建 Linux下Vagrant搭建Tomcat7.Java7 二.Nginx的安装配置与测试 *虚拟机下转至root sudo -i 1)下载并解压(目前官网最新版本) 创建安装目录:mkd ...
 - linux下实现redis共享session的tomcat集群
		
为了实现主域名与子域名的下不同的产品间一次登录,到处访问的效果,因此采用rediss实现tomcat的集群效果.基于redis能够异步讲缓存内容固化到磁盘上,从而当服务器意外重启后,仍然能够让sess ...
 - Tomcat集群+Nginx+Redis服务搭建
		
由于公司新业务突然上来了,单个Tomcat实例已经不能满足业务发展的需要了,只能通过搭建集群来解决问题了.所以就出现了下面的内容: 1.Redis保存Session信息 为了保存Session信息在集 ...
 - Tomcat集群如何同步会话
		
Tocmat集群中最重要的交换信息就是会话消息,对某个tomcat实例某会话做的更改要同步到集群其他tomcat实例的该会话对象,这样才能保证集群所有实例的会话数据一致.在tribes组件的基础上完成 ...
 
随机推荐
- Centos7 搭建owncloud云存储
			
Centos7 搭建owncloud云存储 首先准备必要的软件和资料. 这里我已经整理好了: 百度云共享 不过最好还是自己去官网上下.这里只不过是提供了快捷方式. owncloud官网:https:/ ...
 - Python基础总结之初步认识---clsaa类(上)。第十四天开始(新手可相互督促)
			
最近的类看着很疼,坚持就是胜利~~~ python中的类,什么是类?类是由属性和方法组成的.类中可能有很多属性,以及方法. 我们这样定义一个类: 前面是class关键字 后面school是一个类的名字 ...
 - Java模拟并解决缓存穿透
			
什么叫做缓存穿透 缓存穿透只会发生在高并发的时候,就是当有10000个并发进行查询数据的时候,我们一般都会先去redis里面查询进行数据,但是如果redis里面没有这个数据的时候,那么这10000个并 ...
 - 七天学会NodeJS——第一天
			
转载请注明出处:葡萄城官网,葡萄城为开发者提供专业的开发工具.解决方案和服务,赋能开发者.原文出处:http://nqdeng.github.io/7-days-nodejs Node.js 是一个能 ...
 - 记我的一次 Java 服务性能优化
			
背景 前段时间我们的服务遇到了性能瓶颈,由于前期需求太急没有注意这方面的优化,到了要还技术债的时候就非常痛苦了. 在很低的 QPS 压力下服务器 load 就能达到 10-20,CPU 使用率 60% ...
 - mongoDB的CRUD的总结
			
今天开始接触非关系型数据库的mongoDB,现在将自己做的笔记发出来,供大家参考,也便于自己以后忘记了可以查看. 首先,mongoDB,是一种数据库,但是又区别与mysql,sqlserver.orc ...
 - vue 辅助开发工具(利用node自动生成相关文件,自动注册路由)
			
vue 辅助开发工具 前言 有没有因为新建view,component,store的繁琐操作而苦恼,需要新建文件件,新建vue文件,新建js文件,注册路由...等一系列无价值操作浪费时间,为了解决这个 ...
 - java中File IO流的笔记
			
1.File文件的属性和操作 boolean exists( ) 判断文件或目录是否存在boolean isFile( ) 判断是否是文件boolean isDirectory( ) 判断是否是目 ...
 - python 之 前端开发(基本选择器、组合选择器、 交集与并集选择器、序列选择器、属性选择器、伪类选择器、伪元素选择器)
			
11.3 css 11.31 基本选择器 11.311 id选择器 根据指定的id名称,在当前界面中找到对应的唯一一个的标签,然后设置属性 <!DOCTYPE html> <html ...
 - linux100day(day3)--常用文本处理命令和vim文本编辑器
			
今天,来介绍几个常用文本处理命令和vim文本编辑器 day3--常用文本处理命令和vim文本编辑器 col,用于过滤控制字符,-b过滤掉所有控制字符,这个命令并不常用,但可以使用man 命令名| co ...