mysql性能优化分析 --- 上篇

概要

之前看过《高性能mysql》对mysql数据库有了系统化的理解,虽然没能达到精通，但有了概念，遇到问题时会有逻辑条理的分析;

问题

问题：公司xxx页面调用某个接口时,loading数秒,之后返回结果集不完整；

分析思路

查看服务A端日志,日志并没有发现error;但发现该API接口还调用了另外一个服务B的API接口,并且返回内容和预期返回结果不匹配(返回结果不完整),将问题定位到服务B端; 查看服务B端日志发现,偶发性的报如下error，但不报error时返回结果集依然存在不完整;　

org.apache.catalina.connector.ClientAbortException: java.io.IOException: Broken pipe

    at org.apache.catalina.connector.OutputBuffer.doFlush(OutputBuffer.java:321)

    at org.apache.catalina.connector.OutputBuffer.flush(OutputBuffer.java:284)

    at org.apache.catalina.connector.CoyoteOutputStream.flush(CoyoteOutputStream.java:118)

    at com.fasterxml.jackson.core.json.UTF8JsonGenerator.flush(UTF8JsonGenerator.java:1054)

    at com.fasterxml.jackson.databind.ObjectWriter.writeValue(ObjectWriter.java:953)

    at org.springframework.http.converter.json.AbstractJackson2HttpMessageConverter.writeInternal(AbstractJackson2HttpMessageConverter.java:286)

    at org.springframework.http.converter.AbstractGenericHttpMessageConverter.write(AbstractGenericHttpMessageConverter.java:106)

    at org.springframework.web.servlet.mvc.method.annotation.AbstractMessageConverterMethodProcessor.writeWithMessageConverters(AbstractMessageConverterMethodProcessor.java:231)

其余内容省略

(具体过程略，因为重点不讲这个)通过google 查询分析推测是由于Client 端主动关闭连接导致的，根据服务B日志发现，处理服务A请求花了12~16s之间，而服务端A的OkHttp connection timeout为10s；于是相关开发人员将超时时间调到了60s，发现问题解决了。然后就干其他事情去了；

虽然看上去问题是已经解决了，但其实并没有解决根本问题；本人之前系统化的看过sql相关书籍所以非常感兴趣，利用工作业余时间去尝试探知分析一下，随之仔细排查，发现处理的地方应该是服务B请求过长问题；根据服务B Api接口发现，主要操作为Sql语句；为此我整理出里相关sql语句；如下

-- ①

select count(p.id) from poeinfo p,recordregistryinfo r where p.record_registry_info_id=r.id and r.contract_address=?

-- ②

select sum(a.oss_volume) from (select p.url ,p.oss_volume from poehistoryinfo p,recordregistryinfo r where p.record_registry_info_id=r.id and r.contract_address=? group by p.url,p.oss_volume) a 

-- ③

select p.record_data,p.cooperation_name,p.cooperation_id,p.block_time,p.oss_volume as userOSSCapacity,p.txhash,p.seq_id,p.pre_seq_id,p.custom_string FROM poehistoryinfo p LEFT JOIN recordregistryinfo r ON p.record_registry_info_id=r.id LEFT JOIN identityinfo i ON i.account_id=r.mgmt_account_id  where r.contract_address=? GROUP BY r.contract_address,p.record_data,p.cooperation_name,p.cooperation_id,p.block_time,p.txhash,p.seq_id,p.pre_seq_id,p.custom_string,p.oss_volume ORDER BY p.block_time DESC limit ?,?

-- ④

select count(r.id) FROM poehistoryinfo p LEFT JOIN recordregistryinfo r ON p.record_registry_info_id=r.id LEFT JOIN identityinfo i ON i.account_id=r.mgmt_account_id where r.contract_address=?

首先非常庆幸服务B使用的不是JPA，如果是使用JPA而且没有用@query 原生态sql的话那就排查比较麻烦了，不过还好能看到sql语句很亲切，但sql语句有些很长,我在每条sql上进行标号为方便后续讲解；

第一步：需要自己模拟一个数据库和数据进行测试，毕竟线上的东西是不能碰滴；

第二步: 在VirtualBox 上搭建环境如下:

名称	描述
mysql	5.7，MySQL APT Repository 方式安装
系统环境	linux 16.04
内存	预设6G
硬盘	预设80G

又因为在执行该接口时，服务B ECS无异常波动，RDS cup、内存也无异常波动，所以排除间歇性问题；而着重去考虑sql优化问题；

说实在的，这里的sql语句确实渣渣了点，也无需先做explain、profile 分析，先直接来优化完在按执行计划分析；

优化原则：

索引覆盖
索引,多条件下坚持使用向左原则，必要时建立复合索引
筛选大范围，再逐层筛选

优化方式:

使用explain 查看执行计划,关注Type、rows、Extra字段进行优化；
还不够理想，可以使用如下方式，排查 set profiling = 1; show profiles; show profile for query 1;
使用 show status分析计数器

-- ① 使用左连接

select count(p.id) from poeinfo p  left join on p.record_registry_info_id=r.id where r.contract_address=?;

-- ② 使用 去除临时表，用distinct，使用内连接

SELECT distinct p.url ,p.oss_volume from  poehistoryinfo p INNER JOIN  recordregistryinfo r ON p.record_registry_info_id = r.id where r.contract_address = ?

-- ③ 去除group by 发现与业务无关，无实际意义； 分页查询先使用全盖索覆引获取ID，在根据ID获取结果集

SELECT p.record_data,p.cooperation_name,p.cooperation_id,p.block_time,p.oss_volume as userOSSCapacity,p.txhash,p.seq_id,p.pre_seq_id,p.custom_string FROM poehistoryinfo p  INNER JOIN

    (SELECT p1.id FROM poehistoryinfo p1 LEFT JOIN recordregistryinfo r ON p1.record_registry_info_id=r.id LEFT JOIN identityinfo i ON i.account_id=r.mgmt_account_id  where r.contract_address=? ORDER BY p1.block_time DESC limit ?,?) a ON a.id = p.id ;

-- ④ 无需优化

select count(r.id) FROM poehistoryinfo p LEFT JOIN recordregistryinfo r ON p.record_registry_info_id=r.id LEFT JOIN identityinfo i ON i.account_id=r.mgmt_account_id where r.contract_address=?

　　下面对③进行详细分析；使用执行计划得

explain select p.record_data,p.cooperation_name,p.cooperation_id,p.block_time,p.oss_volume as userOSSCapacity,p.txhash,p.seq_id,p.pre_seq_id,p.custom_string FROM poehistoryinfo p LEFT JOIN recordregistryinfo r ON p.record_registry_info_id=r.id LEFT JOIN identityinfo i ON i.account_id=r.mgmt_account_id  where r.contract_address='85b692c81d16bfa49ce0b8a166458c71f522fd5b' GROUP BY r.contract_address,p.record_data,p.cooperation_name,p.cooperation_id,p.block_time,p.txhash,p.seq_id,p.pre_seq_id,p.custom_string,p.oss_volume ORDER BY p.block_time DESC limit 1,25;

+----+-------------+-------+------------+------+-----------------------------+-----------------------------+---------+-----------------------------+--------+----------+----------------------------------------------------+

| id | select_type | table | partitions | type | possible_keys               | key                         | key_len | ref                         | rows   | filtered | Extra                                              |

+----+-------------+-------+------------+------+-----------------------------+-----------------------------+---------+-----------------------------+--------+----------+----------------------------------------------------+

|  1 | SIMPLE      | r     | NULL       | ALL  | PRIMARY                     | NULL                        | NULL    | NULL                        |     65 |    10.00 | Using where; Using temporary; Using filesort       |

|  1 | SIMPLE      | i     | NULL       | ref  | identityinfo_account_id_ind | identityinfo_account_id_ind | 153     | sync_test.r.mgmt_account_id |      1 |   100.00 | Using where; Using index                           |

|  1 | SIMPLE      | p     | NULL       | ALL  | NULL                        | NULL                        | NULL    | NULL                        | 226366 |    10.00 | Using where; Using join buffer (Block Nested Loop) |

+----+-------------+-------+------------+------+-----------------------------+-----------------------------+---------+-----------------------------+--------+----------+----------------------------------------------------+

3 rows in set, 1 warning (0.00 sec)

set profiling=1;

 select p.record_data,p.cooperation_name,p.cooperation_id,p.block_time,p.oss_volume as userOSSCapacity,p.txhash,p.seq_id,p.pre_seq_id,p.custom_string FROM poehistoryinfo p LEFT JOIN recordregistryinfo r ON p.record_registry_info_id=r.id LEFT JOIN identityinfo i ON i.account_id=r.mgmt_account_id  where r.contract_address='85b692c81d16bfa49ce0b8a166458c71f522fd5b' GROUP BY r.contract_address,p.record_data,p.cooperation_name,p.cooperation_id,p.block_time,p.txhash,p.seq_id,p.pre_seq_id,p.custom_string,p.oss_volume ORDER BY p.block_time DESC limit 1,25;

show profiles;

show profile for query 1;

+---------------------------+----------+

| Status                    | Duration |

+---------------------------+----------+

| starting                  | 0.000246 |

| checking permissions      | 0.000014 |

| checking permissions      | 0.000004 |

| checking permissions      | 0.000007 |

| Opening tables            | 0.000043 |

| init                      | 0.000088 |

| System lock               | 0.000020 |

| optimizing                | 0.000026 |

| statistics                | 0.000083 |

| preparing                 | 0.000047 |

| Creating tmp table        | 0.000068 |

| Sorting result            | 0.000010 |

| executing                 | 0.000002 |

| Sending data              | 0.125882 |

| converting HEAP to ondisk | 0.015473 |

| Sending data              | 0.773666 |

| Creating sort index       | 0.004720 |

| end                       | 0.015822 |

| query end                 | 0.000057 |

| removing tmp table        | 0.000526 |

| query end                 | 0.000015 |

| closing tables            | 0.000020 |

| freeing items             | 0.000069 |

| cleaning up               | 0.000035 |

+---------------------------+----------+

24 rows in set, 1 warning (0.00 sec)

type： 2个ALL全表查询，一个索引访问；而最后一个全表rows有226366，需要优化;

Using where:索引覆盖查询

Using index:索引查询

Using join buffer (Block Nested Loop):关联查询

Using filesort:外部索引排序

Using temporary：查询结果排序时的临时表；

花费时间最多的是2个 sending data;

目前可以总结分析: 优化点有2个：

2个ALL全表查询，特别是rows为226366的
结合实际业务发现GROUP BY r.contract_address,p.record_data,p.cooperation_name,p.cooperation_id,p.block_time,p.txhash,p.seq_id,p.pre_seq_id,p.custom_string,p.oss_volume 无实际意义
优化Limit分页；我们通常会使用LIMIT加上偏移量的办法实现，同时加上合适的ORDER BY字句。如果有对应的索引，通常效率会不错，否则，MySQL需要做大量的文件排序操作。But 在偏移量非常大的时候，那么代价也是非常大的；优化此类分页查询的一个最简单办法就是尽可能地使用索引覆盖扫描，而不是查询所有的列；

优化后

SELECT p.record_data,p.cooperation_name,p.cooperation_id,p.block_time,p.oss_volume as userOSSCapacity,p.txhash,p.seq_id,p.pre_seq_id,p.custom_string FROM poehistoryinfo p  INNER JOIN

    (SELECT p1.id FROM poehistoryinfo p1 LEFT JOIN recordregistryinfo r ON p1.record_registry_info_id=r.id LEFT JOIN identityinfo i ON i.account_id=r.mgmt_account_id  where r.contract_address=? ORDER BY p1.block_time DESC limit ?,?) a ON a.id = p.id ;

explain SELECT p.record_data,p.cooperation_name,p.cooperation_id,p.block_time,p.oss_volume as userOSSCapacity,p.txhash,p.seq_id,p.pre_seq_id,p.custom_string FROM poehistoryinfo p  INNER JOIN

     (SELECT p1.id FROM poehistoryinfo p1 LEFT JOIN recordregistryinfo r ON p1.record_registry_info_id=r.id LEFT JOIN identityinfo i ON i.account_id=r.mgmt_account_id  where r.contract_address='85b692c81d16bfa49ce0b8a166458c71f522fd5b' ORDER BY p1.block_time DESC limit 1,25) a ON a.id = p.id ;

+----+-------------+------------+------------+--------+-----------------------------+-----------------------------+---------+--------------------------------------+------+----------+--------------------------+

| id | select_type | table      | partitions | type   | possible_keys               | key                         | key_len | ref                                  | rows | filtered | Extra                    |

+----+-------------+------------+------------+--------+-----------------------------+-----------------------------+---------+--------------------------------------+------+----------+--------------------------+

|  1 | PRIMARY     | <derived2> | NULL       | ALL    | NULL                        | NULL                        | NULL    | NULL                                 |   26 |   100.00 | NULL                     |

|  1 | PRIMARY     | p          | NULL       | eq_ref | PRIMARY                     | PRIMARY                     | 4       | a.id                                 |    1 |   100.00 | NULL                     |

|  2 | DERIVED     | p1         | NULL       | index  | NULL                        | poeinfo_block_time_ind      | 6       | NULL                                 |  259 |   100.00 | NULL                     |

|  2 | DERIVED     | r          | NULL       | eq_ref | PRIMARY                     | PRIMARY                     | 4       | sync_test.p1.record_registry_info_id |    1 |    10.00 | Using where              |

|  2 | DERIVED     | i          | NULL       | ref    | identityinfo_account_id_ind | identityinfo_account_id_ind | 153     | sync_test.r.mgmt_account_id          |    1 |   100.00 | Using where; Using index |

+----+-------------+------------+------------+--------+-----------------------------+-----------------------------+---------+--------------------------------------+------+----------+--------------------------+

5 rows in set, 1 warning (0.00 sec)

　一看问题基本已解决执行结果发现优化后的速度比优化前块了47倍；但是放回到阿里云RDS上时，出现2个问题：

在不优化的情况下自建数据库执行③slq语句比RDS数据库要快5倍以上；
优化之后的sql语句放到RDS上，比之前未优化的sql语句还慢；这时的我就一脸懵了，what happen ? what should I do ?

-- 优化前执行时间

25 rows in set (0.47 sec)

-- 优化后执行时间

25 rows in set (0.01 sec)

在运维的建议下，我打算提工单咨询一下阿里云RDS工作人员; 具体内容等出结果再写；

mysql性能优化分析 --- 上篇的更多相关文章

mysql性能优化分析 --- 下篇
概要回顾之前看过<高性能mysql>对mysql数据库有了系统化的理解,虽然没能达到精通,但有了概念,遇到问题时会有逻辑条理的分析; 这回继上次sql分析结果的一个继续延伸分析,我拿了; ...
mysql性能优化-慢查询分析、优化索引和配置（慢查询日志，explain，profile）
mysql性能优化-慢查询分析.优化索引和配置 (慢查询日志,explain,profile) 一.优化概述二.查询与索引优化分析 1性能瓶颈定位 Show命令慢查询日志 explain分析查询 ...
Mysql性能优化三（分表、增量备份、还原）
接上篇Mysql性能优化二对表进行水平划分如果一个表的记录数太多了,比如上千万条,而且需要经常检索,那么我们就有必要化整为零了.如果我拆成100个表,那么每个表只有10万条记录.当然这需要数据在逻 ...
Mysql - 性能优化之子查询
记得在做项目的时候, 听到过一句话, 尽量不要使用子查询, 那么这一篇就来看一下, 这句话是否是正确的. 那在这之前, 需要介绍一些概念性东西和mysql对语句的大致处理. 当Mysql Server ...
mysql 性能优化方向
国内私募机构九鼎控股打造APP,来就送 20元现金领取地址:http://jdb.jiudingcapital.com/phone.html内部邀请码:C8E245J (不写邀请码,没有现金送)国内私 ...
MySQL性能优化总结
一.MySQL的主要适用场景 1.Web网站系统 2.日志记录系统 3.数据仓库系统 4.嵌入式系统二.MySQL架构图: 三.MySQL存储引擎概述 1)MyISAM存储引擎 MyISAM存储引擎 ...
MYSQL性能优化的最佳20+条经验
MYSQL性能优化的最佳20+条经验 2009年11月27日陈皓评论 148 条评论 131,702 人阅读今天,数据库的操作越来越成为整个应用的性能瓶颈了,这点对于Web应用尤其明显.关于数 ...
mysql 性能优化方案
网上有不少MySQL 性能优化方案,不过,mysql的优化同sql server相比,更为麻烦与复杂,同样的设置,在不同的环境下 ,由于内存,访问量,读写频率,数据差异等等情况,可能会出现不同的结果 ...
mysql 性能优化方案1
网上有不少mysql 性能优化方案,不过,mysql的优化同sql server相比,更为麻烦与复杂,同样的设置,在不同的环境下 ,由于内存,访问量,读写频率,数据差异等等情况,可能会出现不同的结果 ...

随机推荐

原生sql整理
mysql -uroot -p #登录mysql命令password: #输入密码 mysql> #每条mysql命令后面都要加分号结尾show databases; #打印整个mysql数据库 ...
centos7之zabbix的web检测
一.web监控 Web scenarios(Web 场景)是用来监控Web程序的,可以监控到Web程序的下载速度.返回码及响应时间,还支持把一组连续的Web动作作为一个整体进行监控. 1.web监控的 ...
Ubuntu系统桌面任务栏和启动器全部消失解决方案
ubuntu桌面上没有启动器,没有任务栏,只有一个背景,但是运行正常.这种情况很可能是文件管理程序出现异常了. 解决办法: Ctrl+Alt+F1 进入命令行,输入: sudo service lig ...
4月23日 MySQL学习-DDL
今日学习的是DDL的操作(数据定义语言) create table teachers (id int,name varchar(50));//创建一个表给了两个类型alter table stude ...
Flex弹性布局以及box-sizing
(本篇内容代表本人理解,如有错误请指出!) box-sizing box-sizing 属性用于更改用于计算元素宽度和高度的默认的 CSS 盒子模型.可以使用此属性来模拟不正确支持CSS盒子模型规范的 ...
怎么写自己的CMakeLists.txt
一. 为什么要使用cmake 理论上说,任意一个C++程序都可以用g++来编译.但当程序规模越来越大时,一个工程可能有许多个文件夹和源文件,这时输入的编译命令将越来越长.通常一个小型C++项目可能含有 ...
java篇之 java概念
Jvm:java虚拟机,让java拥有跨平台的能力,一次编写,导出运行 Java优点:提供了一个解释性环境(多线程,可执行程序跨平台,加快开发,支持动态更新) 没有指针,有垃圾将回收器(回收内存) 执 ...
sqlserver登录名权限和用户名权限语句设置
在sqlserver的安全体系中分为登录名和用户名,登录名是用于登录整个数据库系统用的,用户名是针对各个具体的数据来创建的用户,所以针对权限设置要有这个两个用户进行分别设置,下面写下用语句设置这两个用 ...
Luogu4363 [九省联考2018]一双木棋chess 【状压DP】【进制转换】
题目分析: 首先跑个暴力,求一下有多少种状态,发现只有18xxxx种,然后每个状态有10的转移,所以复杂度大约是200w,然后利用进制转换的技巧求一下每个状态的十进制码就行了. 代码: #includ ...
Mysql高性能笔记（一）:Schema与数据类型优化
1.数据类型 1.1.几个参考优化原则 a. 更小的通常更好 i.更小的数据类型,占用更少磁盘.内存和CPU缓存,需要的CPU周期更少 ii.如果无法确定哪个数据类型是最好的,就选择不会超过范围的最 ...

mysql性能优化分析 --- 上篇

概要

问题

分析思路

mysql性能优化分析 --- 上篇的更多相关文章

随机推荐

热门专题