【MySQL】常用监控指标及监控方法

转自：https://www.cnblogs.com/wwcom123/p/10759494.html

对之前生产中使用过的MySQL数据库监控指标做个小结。

指标分类	指标名称	指标说明
性能类指标	QPS	数据库每秒处理的请求数量
	TPS	数据库每秒处理的事务数量
	并发数	数据库实例当前并行处理的会话数量
	连接数	连接到数据库会话的数量
	缓存命中率	查询命中缓存的比例
高可用指标	可用性	数据库是否可以正常对外服务
	阻塞	当前阻塞的会话数
	慢查询	慢查询情况
	主从延迟	主从延迟时间
	主从状态	主从链路是否正常
	死锁	查看死锁信息

【QPS指标】　　

show global status where variable_name in ('Queries', 'uptime');

QPS = (Queries2 -Queries1) / (uptime2 - uptime1)

【TPS指标】　　

show global status where variable_name in ('com_insert' , 'com_delete' , 'com_update', 'uptime');

事务数TC ≈'com_insert' , 'com_delete' , 'com_update'

TPS ≈ (TC2 -TC1) / (uptime2 - uptime1)

【并发数】

show global status like 'Threads_running';

【连接数】

当前连接数：

show global status like 'Threads_connected';

最大连接数：

show global status like 'max_connections';

生产中配置报警阈值：Threads_connected / max_connections > 0.8

【缓存命中率】

innodb缓冲池查询总数：

show global status like 'innodb_buffer_pool_read_requests';

innodb从磁盘查询数：

show global status like 'innodb_buffer_pool_reads';

生产中配置报警阈值：(innodb_buffer_pool_read_requests - innodb_buffer_pool_reads) / innodb_buffer_pool_read_requests > 0.95

【可用性】

方法1：周期性连接数据库并执行 select @@version;

方法2：mysqladmin -u数据库用户名 -p数据库密码 -h数据库实例IP ping

【阻塞】

　 MySQL5.7之前：

select b.trx_mysql_thread_id as '被阻塞线程',

     b.trx_query as '被阻塞SQL',

     c.trx_mysql_thread_id as '阻塞线程',

     c.trx_query as '阻塞SQL',

     (unix_timestamp()-unix_timestamp(c.trx_started)) as '阻塞时间'

from information_schema.innodb_lock_waits a

join information_schema.innodb_trx b on a.requesting_trx_id=b.trx_id

join information_schema.innodb_trx c on a.blocking_trx_id=c.trx.id

where(unix_timestamp()-unix_timestamp(c.trx_started))>阻塞秒数

　　MySQL5.7及之后：

　　为方便查询阻塞指标，MySQL将2张表join构造了一个view sys.innodb_lock_waits，查询语句得以大大简化。

select waiting_pid as '被阻塞线程',

    waiting_query as '被阻塞SQL',

     blocking_pid as '阻塞线程',

     blocking_query as '阻塞SQL',

     wait_age as '阻塞时间',

     sql_kill_blocking_query as '建议操作'

from sys.innodb_lock_waits

where(unix_timestamp()-unix_timestamp(wait_started))>阻塞秒数

【慢查询】

方法1：开启慢查询日志。my.inf

slow_query_log=on

slow_query_log_file=存放目录

long_query_time=0.1秒

log_queries_not_using_indexes=on

注：只对新建连接生效，实时生效使用命令set global 上述配置项。

方法2：

select * from information_schema.'processlist';

【主从延迟】

方法1：

show slave status;

问题：

该方法是基于relaylog的时间与master的时间差值，并不太准，例如大事务时，主从延时已发生，但relaylog还未生成。

方法2：使用Percona的pt-heartbeat工具

Master后台周期写入：

pt-heartbeat --user=Master用户名 --password=Master密码 --h MasterIP --create-table --database 测试库名 --updatte --daemonize --interval=1

--create-table 在Master上创建心跳监控表heartbeat，通过更新该表知道主从延迟的差距。

--daemonize 后台执行。

--interval=1 默认1秒执行一次。

Slave后台周期同步读取：

pt-heartbeat --user=Slave用户名 --password=Slave密码 --h SlaveIP --database 库名 --monitor --daemonize --log /slave_lag.log

--monitor参数是持续监测并输出结果

【主从状态】

show slave status;

【死锁】

方法1：查看最近一次死锁信息：

show engine innodb status;

方法2：使用Percona的pt-deadlock-logger工具

1.打开死锁打印全局开关

set global innodb_print_all_deadlocks=on;

2.使用pt-deadlock-logger工具

监控到的死锁结果可以输出到文件、指定表、或者界面打印。

pt-deadlock-logger h=数据库IP,u=数据库用户名,p=数据库密码

输出结果非常详尽：

server:数据库服务器地址，即死锁产生的数据库主机

ts:检测到死锁的时间戳

thread:产生死锁的线程id，这个id和show processlist里面的线程id是一致的

txn_id:innodb的事务ID

txd_time:死锁检查到前，事务执行时间

user:执行transcation的用户名

hostname:客户端主机名

ip:客户端ip

db:发生死锁的DB名

tbl:死锁发生的表名

idx:产生死锁的索引名(在上面这个demo里面，我们直接走的主键，加的记录锁)

lock_type:锁的类型(记录锁，gap锁，next-key锁)

lock_mode:锁模式(S,X)

wait_hold:是否等着锁释放，一般死锁都是两个wait

victim:该会话是否做了牺牲，终止了执行

query:造成死锁的SQL语句

wwcom123

【MySQL】常用监控指标及监控方法

对之前生产中使用过的MySQL数据库监控指标做个小结。

指标分类	指标名称	指标说明
性能类指标	QPS	数据库每秒处理的请求数量
	TPS	数据库每秒处理的事务数量
	并发数	数据库实例当前并行处理的会话数量
	连接数	连接到数据库会话的数量
	缓存命中率	查询命中缓存的比例
高可用指标	可用性	数据库是否可以正常对外服务
	阻塞	当前阻塞的会话数
	慢查询	慢查询情况
	主从延迟	主从延迟时间
	主从状态	主从链路是否正常
	死锁	查看死锁信息

【QPS指标】　　

show global status where variable_name in ('Queries', 'uptime');

QPS = (Queries2 -Queries1) / (uptime2 - uptime1)

【TPS指标】　　

show global status where variable_name in ('com_insert' , 'com_delete' , 'com_update', 'uptime');

事务数TC ≈'com_insert' , 'com_delete' , 'com_update'

TPS ≈ (TC2 -TC1) / (uptime2 - uptime1)

【并发数】

show global status like 'Threads_running';

【连接数】

当前连接数：

show global status like 'Threads_connected';

最大连接数：

show global status like 'max_connections';

生产中配置报警阈值：Threads_connected / max_connections > 0.8

【缓存命中率】

innodb缓冲池查询总数：

show global status like 'innodb_buffer_pool_read_requests';

innodb从磁盘查询数：

show global status like 'innodb_buffer_pool_reads';

生产中配置报警阈值：(innodb_buffer_pool_read_requests - innodb_buffer_pool_reads) / innodb_buffer_pool_read_requests > 0.95

【可用性】

方法1：周期性连接数据库并执行 select @@version;

方法2：mysqladmin -u数据库用户名 -p数据库密码 -h数据库实例IP ping

【阻塞】

　 MySQL5.7之前：

select b.trx_mysql_thread_id as '被阻塞线程',

     b.trx_query as '被阻塞SQL',

     c.trx_mysql_thread_id as '阻塞线程',

     c.trx_query as '阻塞SQL',

     (unix_timestamp()-unix_timestamp(c.trx_started)) as '阻塞时间'

from information_schema.innodb_lock_waits a

join information_schema.innodb_trx b on a.requesting_trx_id=b.trx_id

join information_schema.innodb_trx c on a.blocking_trx_id=c.trx.id

where(unix_timestamp()-unix_timestamp(c.trx_started))>阻塞秒数

　　MySQL5.7及之后：

　　为方便查询阻塞指标，MySQL将2张表join构造了一个view sys.innodb_lock_waits，查询语句得以大大简化。

select waiting_pid as '被阻塞线程',

    waiting_query as '被阻塞SQL',

     blocking_pid as '阻塞线程',

     blocking_query as '阻塞SQL',

     wait_age as '阻塞时间',

     sql_kill_blocking_query as '建议操作'

from sys.innodb_lock_waits

where(unix_timestamp()-unix_timestamp(wait_started))>阻塞秒数

【慢查询】

方法1：开启慢查询日志。my.inf

slow_query_log=on

slow_query_log_file=存放目录

long_query_time=0.1秒

log_queries_not_using_indexes=on

注：只对新建连接生效，实时生效使用命令set global 上述配置项。

方法2：

select * from information_schema.'processlist';

【主从延迟】

方法1：

show slave status;

问题：

该方法是基于relaylog的时间与master的时间差值，并不太准，例如大事务时，主从延时已发生，但relaylog还未生成。

方法2：使用Percona的pt-heartbeat工具

Master后台周期写入：

pt-heartbeat --user=Master用户名 --password=Master密码 --h MasterIP --create-table --database 测试库名 --updatte --daemonize --interval=1

--create-table 在Master上创建心跳监控表heartbeat，通过更新该表知道主从延迟的差距。

--daemonize 后台执行。

--interval=1 默认1秒执行一次。

Slave后台周期同步读取：

pt-heartbeat --user=Slave用户名 --password=Slave密码 --h SlaveIP --database 库名 --monitor --daemonize --log /slave_lag.log

--monitor参数是持续监测并输出结果

【主从状态】

show slave status;

【死锁】

方法1：查看最近一次死锁信息：

show engine innodb status;

方法2：使用Percona的pt-deadlock-logger工具

1.打开死锁打印全局开关

set global innodb_print_all_deadlocks=on;

2.使用pt-deadlock-logger工具

监控到的死锁结果可以输出到文件、指定表、或者界面打印。

pt-deadlock-logger h=数据库IP,u=数据库用户名,p=数据库密码

输出结果非常详尽：

server:数据库服务器地址，即死锁产生的数据库主机

ts:检测到死锁的时间戳

thread:产生死锁的线程id，这个id和show processlist里面的线程id是一致的

txn_id:innodb的事务ID

txd_time:死锁检查到前，事务执行时间

user:执行transcation的用户名

hostname:客户端主机名

ip:客户端ip

db:发生死锁的DB名

tbl:死锁发生的表名

idx:产生死锁的索引名(在上面这个demo里面，我们直接走的主键，加的记录锁)

lock_type:锁的类型(记录锁，gap锁，next-key锁)

lock_mode:锁模式(S,X)

wait_hold:是否等着锁释放，一般死锁都是两个wait

victim:该会话是否做了牺牲，终止了执行

query:造成死锁的SQL语句

分类: MySQL

谢谢推荐！关注我收藏该文

wwcom123
关注 - 0
粉丝 - 0

+加关注

支持成功

«上一篇：【MySQL】percona-toolkit工具包
»下一篇：【TOGAF】总体认知

posted @ 2019-04-24 21:35 wwcom123 阅读(353) 评论(0) 编辑收藏

刷新评论刷新页面返回顶部

发表评论

昵称：

评论内容：

退出订阅评论

[Ctrl+Enter快捷键提交]

公告

昵称： wwcom123
园龄： 1年3个月
粉丝： 0
关注： 0

+加关注

2019年8月

日

一

二

三

四

五

六

搜索

我的标签

elasticsearch(2)

随笔分类

随笔档案

文章分类

ElasticSearch

阅读排行榜

【0.2】【MySQL】常用监控指标及监控方法（转）的更多相关文章

【MySQL】常用监控指标及监控方法
对之前生产中使用过的MySQL数据库监控指标做个小结. 指标分类指标名称指标说明性能类指标 QPS 数据库每秒处理的请求数量 TPS 数据库每秒处理的事务数量并发数数据库实例当前并行处理的 ...
LoadRunner监控Unix、Windows方法及常用性能指标
目录一.LoadRunner监控Linux资源.... 3 (一).准备工作... 3 1.可以通过两种方法验证服务器上是否配置了rstatd守护程序:... 3 (2)使用find命令... ...
es相关监控指标梳理
###################ElasticSearch监控指标梳理########################### #author:lugh1 # #date:2021-09-26 # ...
Web 前端页面性能监控指标
Web 前端页面性能监控指标性能监控 / 性能指标 / 性能优化白屏时间计算 FCP 白屏时间:从浏览器输入地址并回车后到页面开始有内容的时间: 首屏时间计算 FMP 首屏时间:从浏览器输入地址并 ...
探索Windows Azure 监控和自动伸缩系列2 - 获取虚拟机的监控定义和监控数据
上一篇博文介绍了如何连接Windows Azure: http://www.cnblogs.com/teld/p/5113063.html 本篇我们继续上次的示例代码,获取虚拟机的监控定义和监控数据. ...
[博客迁移]探索Windows Azure 监控和自动伸缩系列2 - 获取虚拟机的监控定义和监控数据
上一篇博文介绍了如何连接Windows Azure: http://www.cnblogs.com/teld/p/5113063.html 本篇我们继续上次的示例代码,获取虚拟机的监控定义和监控数据. ...
MySQL 监控指标
为了排查问题,对数据库的监控是必不可少的,在此介绍下 MySQL 中的常用监控指标. 简介 MySQL 有多个分支版本,常见的有 MySQL.Percona.MariaDB,各个版本所对应的监控项也会 ...
如何进行TIDB优化之Grafana(TiDB 3.0)关注监控指标
前言在对数据库进行优化前,我们先要思考一下数据库系统可能存在的瓶颈所在之外.数据库服务是运行在不同的硬件设备上的,优化即通过参数配置(不考虑应用客户端程序的情况下),而实现硬件资源的最大利用化.那么 ...
MySQL数据库重点监控指标
MySQL数据库重点监控指标 QPS queries per seconds 每秒中查询数量 show global status like 'Question%'; Queries/seconds ...

随机推荐

FZU - 2218 Simple String Problem 状压dp
FZU - 2218Simple String Problem 题目大意:给一个长度为n含有k个不同字母的串,从中挑选出两个连续的子串,要求两个子串中含有不同的字符,问这样的两个子串长度乘积最大是多少 ...
pandas优化
目录前言使用Datetime数据节省时间 pandas数据的循环操作使用itertuples() 和iterrows() 循环 Pandas的 .apply()方法矢量化操作:使用.isin( ...
Thread（简单使用）
/***thread.c***/#include<stdio.h> #include<stdlib.h> #include<pthread.h> void prin ...
两篇将rf和boosting方法用在搜索排序上的paper
在网上看到关于排序学习的早期文章,这两篇文章大致都使用了Random Forest和Boosting方法. 一.paper 1.Web-Search Ranking with Initialized ...
PHP处理kafka消息队列
在安装php-kafka 扩展后,就可以开始编写 php 消费消息的脚本了,php-rdkafka 扩展提供了几种消息处理的方式低级方式(Low level) 这种方式没有消费组的概念 <?p ...
flask 第七篇路由系统
Flask中的路由系统其实我们并不陌生了,从一开始到现在都一直在应用 @app.route("/",methods=["GET","POST" ...
Linux 多线程按照线程顺序打印字符
#include <stdio.h> #include <pthread.h> #include <unistd.h> ; pthread_mutex_t mute ...
20165213 Exp9 Web安全基础
Exp9 Web安全基础一.基础性问答 (1)SQL注入攻击原理,如何防御原理:SQL注入即是指web应用程序对用户输入数据的合法性没有判断,攻击者可以在web应用程序中事先定义好的查询语句的结尾 ...
koa 项目实战（三）创建测试接口和用户模型
1.创建测试接口,并引入用户模型根目录/routes/api/users.js const Router = require('koa-router'); const router = new Ro ...
ThinkPhp sql语句执行方法
ThinkPHP内置的ORM和ActiveRecord模式实现了方便的数据存取操作,而且新版增加的连贯操作功能更是让这个数据操作更加清晰,但是ThinkPHP仍然保留了原生的SQL查询和执行操作支持, ...

【0.2】【MySQL】常用监控指标及监控方法（转）

【MySQL】常用监控指标及监控方法

【QPS指标】

【TPS指标】

【并发数】

【连接数】

【缓存命中率】

【可用性】

【阻塞】

【慢查询】

【主从延迟】

【主从状态】

【死锁】

wwcom123

【MySQL】常用监控指标及监控方法

【QPS指标】

【TPS指标】

【并发数】

【连接数】

【缓存命中率】

【可用性】

【阻塞】

【慢查询】

【主从延迟】

【主从状态】

【死锁】

公告

搜索

我的标签

随笔分类

随笔档案

文章分类

阅读排行榜

推荐排行榜

【0.2】【MySQL】常用监控指标及监控方法（转）的更多相关文章

随机推荐

热门专题