0316 【案例】MySQL count操作优化案例一则
转自http://blog.itpub.net/22664653/viewspace-1791124/
某业务的数据库定期报 thread_runing 飙高,通定位发现一个慢查询sql导致会话堆积。执行sql 耗时如下
- root@db 05:32:05>select count(item_id) from xxxtable where selid = 345705650 and end_time > now();
 - +----------------+
 - | count(item_id) |
 - +----------------+
 - | 2247052 |
 - +----------------+
 - 1 row in set (4.65 sec)
 
二 分析  
慢查询表结构如下
- root@db >show create table xxxtable \G
 - *************************** 1. row ***************************
 - Table: uac_shop_item_promotion_0091
 - Create Table: CREATE TABLE `uac_shop_item_promotion_0091` (
 - `id` bigint(20) unsigned NOT NULL AUTO_INCREMENT COMMENT '主键',
 - `gmt_modified` datetime NOT NULL COMMENT '修改时间',
 - `selid` bigint(20) NOT NULL COMMENT '分表字段',
 - `end_time` datetime NOT NULL COMMENT '活动结束时间',
 - `item_id` bigint(20) NOT NULL COMMENT '商品id',
 - PRIMARY KEY (`id`),
 - UNIQUE KEY `idx_uq_item` (`item_id`),
 - KEY `idx_deller_id_end_time` (`selid`,`end_time`),
 - KEY `idx_deller_id_start_time` (`selid`,`start_time`),
 - KEY `idx_seller_item_start` (`selid`,`start_time`,`item_id`)
 - ) ENGINE=InnoDB AUTO_INCREMENT=42132149 DEFAULT CHARSET=gbk COMMENT='索引表'
 - 1 row in set (0.00 sec)
 
很明显出现问题的sql由于使用了count(item_id) ,而item_id字段并没有和 selid 和end_time 构成有效索引 故该sql 没有合理的使用索引 。查看其直系计划
- root@db >explain select count(item_id) from xxxtable
 - >where selid = 345705650 and end_time > now() \G
 - *************************** 1. row ***************************
 - id: 1
 - select_type: SIMPLE
 - table: xxxtable
 - type: ref
 - possible_keys: idx_deller_id_end_time,idx_deller_id_start_time,idx_seller_item_start
 - key: idx_deller_id_end_time
 - key_len: 8
 - ref: const
 - rows: 1726757
 - Extra: Using where
 - 1 row in set (0.00 sec)
 
从key_len=8 和Extra: Using where 可以看出MySQL没有完全利用到idx_deller_id_end_time组合索引而是利用到了 selid字段作为过滤条件回表查询。
count(item_id)的意思是符合where条件的结果集中item_id非空集合的总和。
三 如何优化
根据该sql的业务需求是需要获取到某商家参加活动且活动截止时间大于当前时间的商品总数,可以使用如下sql满足要求:
- select count(*) from xxxtable where selid = 345705650 and end_time > now()
 
执行时间仅为原来的1/4,新的sql发布之后thread_running报警消失,业务校验时间明显缩短。
- root@db >select count(*) from xxxtable where selid = 345705650 and end_time > now();
 - +----------+
 - | count(*) |
 - +----------+
 - | 2247052 |
 - +----------+
 - 1 row in set (0.82 sec)
 - root@db >select count(1) from xxxtable where selid = 345705650 and end_time > now();
 - +----------+
 - | count(1) |
 - +----------+
 - | 2247052 |
 - +----------+
 - 1 row in set (0.79 sec)
 
优化后的sql的explain 方式如下:
- root@db >explain select count(*) from xxxtable where selid = 345705650 and end_time > now() \G
 - *************************** 1. row ***************************
 - id: 1
 - select_type: SIMPLE
 - table: xxxtable
 - type: range
 - possible_keys: idx_deller_id_end_time,idx_deller_id_start_time,idx_seller_item_start
 - key: idx_deller_id_end_time
 - key_len: 16
 - ref: NULL
 - rows: 1726768
 - Extra: Using where; Using index
 - 1 row in set (0.00 sec)
 
四 小结
 a 这个问题是在没有修改索引的基础中做出的优化,老的sql没有有效的利用当前的索引导致耗时操作
 b 对于不同count类型的sql 总结如下
   count(*)/count(1) 返回结果集的总和包括null和重复的值。
   count(column) 返回结果集中非空 column 的总和,执行查询的过程中会校验字段是否非空。
 c 在业务设计的时候 满足业务逻辑的前提下推荐使用count(*).
 d 从官方文档中摘录 Using where 和 Using index 的区别
- Using index
 - The column information is retrieved from the table using only information in the index tree without having to do an additional seek to read the actual row. This strategy can be used when the query uses only columns that are part of a single index.
 - If the Extra column also says Using where, it means the index is being used to perform lookups of key values. Without Using where, the optimizer may be reading the index to avoid reading data rows but not using it for lookups. For example, if the index is a covering index for the query, the optimizer may scan it without using it for lookups. For InnoDB tables that have a user-defined clustered index, that index can be used even when Using index is absent from the Extra column. This is the case if type is index and key is PRIMARY.
 - Using where
 - A WHERE clause is used to restrict which rows to match against the next table or send to the client. Unless you specifically intend to fetch orexamine all rows from the table, you may have something wrong in your query if the Extra value is not Using where and the table join type is ALLor index. Even if you are using an index for all parts of a WHERE clause, you may see Using where if the column can be NULL.
 
0316 【案例】MySQL count操作优化案例一则的更多相关文章
- mysql的sql优化案例
		
前言 mysql的sql优化器比较弱,选择执行计划貌似很随机. 案例 一.表结构说明mysql> show create table table_order\G***************** ...
 - mysql的性能优化案例
		
在一次项目实现中,以前写了个程序,将在txt文件中的电话号码和对应的类型往数据库中插入,小数据量的情况下,用个数组遍历循环的方式,很容易解决,但是当数据量一下 但是,几十万个电话一次性插入,就变得耗时 ...
 - 《Mysql -  Count(*) 的优化》
		
一:Count(*) 的实现方式? - 要明确的是,在不同的 MySQL 引擎中,count(*) 有不同的实现方式. - MyISAM 引擎把一个表的总行数存在了磁盘上,因此执行 count(*) ...
 - mysql优化案例
		
MySQL优化案例 Mysql5.1大表分区效率测试 Mysql5.1大表分区效率测试MySQL | add at 2009-03-27 12:29:31 by PConline | view:60, ...
 - 记一次mysql多表查询(left jion)优化案例
		
一次mysql多表查询(left jion)优化案例 在新上线的供需模块中,发现某一个查询按钮点击后,出不来结果,找到该按钮对应sql手动执行,发现需要20-30秒才能出结果,所以服务端程序判断超时, ...
 - MySQL参数优化案例
		
环境介绍 优化层级与指导思想 优化过程 最小化安装情况下的性能表现 优化innodb_buffer_pool_size 优化innodb_log_files_in_group&innodb_l ...
 - MySQL数据库索引类型、MySQL索引的优化及MySQL索引案例
		
关于MySQL索引的好处,如果正确合理设计并且使用索引的MySQL是一辆兰博基尼的话,那么没有设计和使用索引的MySQL就是一个人力三轮车.对于没有索引的表,单表查询可能几十万数据就是瓶颈,而通常大型 ...
 - Python 操作mysql数据库之 SQLAlchemy 案例详解
		
前言: 字段声明类型中,最右边的是数据库中对应的字段,我们依然可以使用,其左边的的 SQLAchemy 则是其自身封装的自定义类型. 本篇不会讲太多的理论知识,因为这个实用性更强,所以通篇全部都是 ...
 - MySQL的索引单表优化案例分析
		
建表 建立本次优化案例中所需的数据库及数据表 CREATE DATABASE db0206; USE db0206; CREATE TABLE `db0206`.`article`( `id` INT ...
 
随机推荐
- 通过指针访问C++对象的私有成员
			
C++对象的私有成员是禁止类外的访问的.但是我们仍然可以通过指针访问C++对象的私有成员. #include <iostream> using namespace std; class A ...
 - 电脑升级win10后visio的问题
			
上周由于电脑意外蓝屏,系统从win7升级到了win10,昨天工作写文档时才发现缺少画图的工具,于是按照了visio2013,在编辑设计图时发现,一旦用visio打开或编辑图后再到word里设计图的内容 ...
 - poj1041 John's trip——字典序欧拉回路
			
题目:http://poj.org/problem?id=1041 求字典序欧拉回路: 首先,如果图是欧拉图,就一定存在欧拉回路,直接 dfs 即可,不用 return 判断什么的,否则TLE... ...
 - C# Task 源代码阅读(2)
			
上篇已经讲到Task 的默认的TaskScheduler 为ThreadPoolTaskScheduler. 这时我们回到原来的task 的start方法,在代码最后,调用了 ScheduleAndS ...
 - CentOS7 内核参数优化
			
# allow testing with buffers up to 128MBnet.core.rmem_max = 134217728net.core.wmem_max = 134217728# ...
 - C语言程序判断文件夹是否存在
			
#include <stdio.h> #include <io.h> int main(void){ if ( !access("C://Users/hui" ...
 - PCB MS SQL 将字符串分割,并指定索引返回字符串(标量函数)
			
Create FUNCTION [dbo].[SplitIndex] ( @str AS VARCHAR(max), @Index AS INT, ) = '/' ) ) AS BEGIN ) --待 ...
 - 常见文件MIME类型
			
常见文件MIME类型.asx,video/x-ms-asf .xml,text/xml .tsv,text/tab-separated-values .ra,audio/x-pn-realaudio ...
 - windows服务安装错误 在‘安装’过程发生异常:System.ComponentModel.Win32Exception:系统正在关机
			
今天安装windows服务的时候先是在本地安装测试通过,但是一到服务器就一直安装失败 在‘安装’过程发生异常:System.ComponentModel.Win32Exception:系统正在关机 然 ...
 - 自学Python七  爬虫实战一
			
此文承接上文,让我们写一个简简单单的爬虫,循序而渐进不是吗?此次进行的练习是爬取前5页什么值得买网站中的白菜价包邮信息.包括名称,价格,推荐人,时间. 我们所需要做的工作:1.确定URL并获得页面代码 ...