0316 【案例】MySQL count操作优化案例一则
转自http://blog.itpub.net/22664653/viewspace-1791124/
某业务的数据库定期报 thread_runing 飙高,通定位发现一个慢查询sql导致会话堆积。执行sql 耗时如下
- root@db 05:32:05>select count(item_id) from xxxtable where selid = 345705650 and end_time > now();
- +----------------+
- | count(item_id) |
- +----------------+
- | 2247052 |
- +----------------+
- 1 row in set (4.65 sec)
二 分析
慢查询表结构如下
- root@db >show create table xxxtable \G
- *************************** 1. row ***************************
- Table: uac_shop_item_promotion_0091
- Create Table: CREATE TABLE `uac_shop_item_promotion_0091` (
- `id` bigint(20) unsigned NOT NULL AUTO_INCREMENT COMMENT '主键',
- `gmt_modified` datetime NOT NULL COMMENT '修改时间',
- `selid` bigint(20) NOT NULL COMMENT '分表字段',
- `end_time` datetime NOT NULL COMMENT '活动结束时间',
- `item_id` bigint(20) NOT NULL COMMENT '商品id',
- PRIMARY KEY (`id`),
- UNIQUE KEY `idx_uq_item` (`item_id`),
- KEY `idx_deller_id_end_time` (`selid`,`end_time`),
- KEY `idx_deller_id_start_time` (`selid`,`start_time`),
- KEY `idx_seller_item_start` (`selid`,`start_time`,`item_id`)
- ) ENGINE=InnoDB AUTO_INCREMENT=42132149 DEFAULT CHARSET=gbk COMMENT='索引表'
- 1 row in set (0.00 sec)
很明显出现问题的sql由于使用了count(item_id) ,而item_id字段并没有和 selid 和end_time 构成有效索引 故该sql 没有合理的使用索引 。查看其直系计划
- root@db >explain select count(item_id) from xxxtable
- >where selid = 345705650 and end_time > now() \G
- *************************** 1. row ***************************
- id: 1
- select_type: SIMPLE
- table: xxxtable
- type: ref
- possible_keys: idx_deller_id_end_time,idx_deller_id_start_time,idx_seller_item_start
- key: idx_deller_id_end_time
- key_len: 8
- ref: const
- rows: 1726757
- Extra: Using where
- 1 row in set (0.00 sec)
从key_len=8 和Extra: Using where 可以看出MySQL没有完全利用到idx_deller_id_end_time组合索引而是利用到了 selid字段作为过滤条件回表查询。
count(item_id)的意思是符合where条件的结果集中item_id非空集合的总和。
三 如何优化
根据该sql的业务需求是需要获取到某商家参加活动且活动截止时间大于当前时间的商品总数,可以使用如下sql满足要求:
- select count(*) from xxxtable where selid = 345705650 and end_time > now()
执行时间仅为原来的1/4,新的sql发布之后thread_running报警消失,业务校验时间明显缩短。
- root@db >select count(*) from xxxtable where selid = 345705650 and end_time > now();
- +----------+
- | count(*) |
- +----------+
- | 2247052 |
- +----------+
- 1 row in set (0.82 sec)
- root@db >select count(1) from xxxtable where selid = 345705650 and end_time > now();
- +----------+
- | count(1) |
- +----------+
- | 2247052 |
- +----------+
- 1 row in set (0.79 sec)
优化后的sql的explain 方式如下:
- root@db >explain select count(*) from xxxtable where selid = 345705650 and end_time > now() \G
- *************************** 1. row ***************************
- id: 1
- select_type: SIMPLE
- table: xxxtable
- type: range
- possible_keys: idx_deller_id_end_time,idx_deller_id_start_time,idx_seller_item_start
- key: idx_deller_id_end_time
- key_len: 16
- ref: NULL
- rows: 1726768
- Extra: Using where; Using index
- 1 row in set (0.00 sec)
四 小结
a 这个问题是在没有修改索引的基础中做出的优化,老的sql没有有效的利用当前的索引导致耗时操作
b 对于不同count类型的sql 总结如下
count(*)/count(1) 返回结果集的总和包括null和重复的值。
count(column) 返回结果集中非空 column 的总和,执行查询的过程中会校验字段是否非空。
c 在业务设计的时候 满足业务逻辑的前提下推荐使用count(*).
d 从官方文档中摘录 Using where 和 Using index 的区别
- Using index
- The column information is retrieved from the table using only information in the index tree without having to do an additional seek to read the actual row. This strategy can be used when the query uses only columns that are part of a single index.
- If the Extra column also says Using where, it means the index is being used to perform lookups of key values. Without Using where, the optimizer may be reading the index to avoid reading data rows but not using it for lookups. For example, if the index is a covering index for the query, the optimizer may scan it without using it for lookups. For InnoDB tables that have a user-defined clustered index, that index can be used even when Using index is absent from the Extra column. This is the case if type is index and key is PRIMARY.
- Using where
- A WHERE clause is used to restrict which rows to match against the next table or send to the client. Unless you specifically intend to fetch orexamine all rows from the table, you may have something wrong in your query if the Extra value is not Using where and the table join type is ALLor index. Even if you are using an index for all parts of a WHERE clause, you may see Using where if the column can be NULL.
0316 【案例】MySQL count操作优化案例一则的更多相关文章
- mysql的sql优化案例
前言 mysql的sql优化器比较弱,选择执行计划貌似很随机. 案例 一.表结构说明mysql> show create table table_order\G***************** ...
- mysql的性能优化案例
在一次项目实现中,以前写了个程序,将在txt文件中的电话号码和对应的类型往数据库中插入,小数据量的情况下,用个数组遍历循环的方式,很容易解决,但是当数据量一下 但是,几十万个电话一次性插入,就变得耗时 ...
- 《Mysql - Count(*) 的优化》
一:Count(*) 的实现方式? - 要明确的是,在不同的 MySQL 引擎中,count(*) 有不同的实现方式. - MyISAM 引擎把一个表的总行数存在了磁盘上,因此执行 count(*) ...
- mysql优化案例
MySQL优化案例 Mysql5.1大表分区效率测试 Mysql5.1大表分区效率测试MySQL | add at 2009-03-27 12:29:31 by PConline | view:60, ...
- 记一次mysql多表查询(left jion)优化案例
一次mysql多表查询(left jion)优化案例 在新上线的供需模块中,发现某一个查询按钮点击后,出不来结果,找到该按钮对应sql手动执行,发现需要20-30秒才能出结果,所以服务端程序判断超时, ...
- MySQL参数优化案例
环境介绍 优化层级与指导思想 优化过程 最小化安装情况下的性能表现 优化innodb_buffer_pool_size 优化innodb_log_files_in_group&innodb_l ...
- MySQL数据库索引类型、MySQL索引的优化及MySQL索引案例
关于MySQL索引的好处,如果正确合理设计并且使用索引的MySQL是一辆兰博基尼的话,那么没有设计和使用索引的MySQL就是一个人力三轮车.对于没有索引的表,单表查询可能几十万数据就是瓶颈,而通常大型 ...
- Python 操作mysql数据库之 SQLAlchemy 案例详解
前言: 字段声明类型中,最右边的是数据库中对应的字段,我们依然可以使用,其左边的的 SQLAchemy 则是其自身封装的自定义类型. 本篇不会讲太多的理论知识,因为这个实用性更强,所以通篇全部都是 ...
- MySQL的索引单表优化案例分析
建表 建立本次优化案例中所需的数据库及数据表 CREATE DATABASE db0206; USE db0206; CREATE TABLE `db0206`.`article`( `id` INT ...
随机推荐
- Linux C语言头文件搜索路径
本文介绍在linux中头文件的搜索路径,也就是说你通过include指定的头文件,linux下的gcc编译器它是怎么找到它的呢.在此之前,先了解一个基本概念. 头文件是一种文本文件,使用文本编辑器将代 ...
- B1821 [JSOI2010]Group 部落划分 Group 二分答案&&并查集
这个题正解是最小生成树,但是...最大值最小?一看就是二分答案啊!不用多想,直接二分答案加暴力验证就行了. 题干: Description 聪聪研究发现,荒岛野人总是过着群居的生活,但是,并不是整个荒 ...
- MySQL:常见错误01
ylbtech-MySQL:常见错误01 1.返回顶部 1. [SQL]select * from product_product_tag aLEFT JOIN system_tag b on b.i ...
- Thinkpad E450c开启Intel virtual technology
1.重启系统,一直按F12,进入系统设置后,按tab进入App Menu选项卡,选择Setup按回车进入BIOS设置 2.移动到Security选项 3.移动到Virtualization,按ente ...
- selenium3 + python - gird分布式(转载)
本篇转自博客:上海-小T 转载链接:https://blog.csdn.net/real_tino/article/details/53467406 Selenium grid是用来分布式执行测试用例 ...
- python-day2 切片,格式化输出,函数
1.切片:取元素 格式;变量名[M:N:K] M 表示开始元素索引值, N 表示结束元素索引值(不包含索引值本身) K 表示步长,隔几个切一次 例子:a='hello python' p ...
- Grafana+Zabbix+Prometheus 监控系统
环境说明 软件 版本 操作系统 IP地址 Grafana 5.4.3-1 Centos7.5 192.168.18.231 Prometheus 2.6.1 Centos7.5 192.168.18. ...
- 【题解】【CodeForces712C】Memory and De-Evolution
[题目描述] 给定一个边长为xx的正三角形,现在每秒钟你可以改变其中一条边的长度(修改量整数),在改变过程中,每秒钟都需要保证改变后的三角形是合法的,且变成均为正整数. 现在需要最终把三角形改变成边长 ...
- Beta冲刺-星期五
这个作业属于哪个课程 <课程的链接> 这个作业要求在哪里 <作业要求的链接> 团队名称 Three cobblers 这个作业的目标 完成项目最后的冲刺 ...
- Microsoft SQL Server数据库学习(一)
数据库的分类: 1.关系型数据库: 数据库名称 类型 公司 平台 Access 小型数据库 微软 Windows Mysql 小型数据库 AB--sun--甲骨文 Windows/linux/mac ...