MySQL表行数查询最佳实践

　　日常应用运维工作中，Dev或者db本身都需要统计表的行数，以此作为应用或者维护的一个信息参考。也许很多人会忽略select count(*) from table_name类似的sql对数据库性能的影响，可当你在慢日志平台看到执行了数千次，每次执行4秒左右的查询，你还会无动于衷吗？作为一个有担当敢于挑战的dba，你们应该勇于说no，我觉得类似的需求不可避免但不应该是影响数据库性能的因素，如果连这个都摆不平公司还能指望你干什么。经过几番深思总结，我根据查询的需求，分为模糊查询和精确查询，可以通过下面的三种方式来择优选择。下面测试是线上一个日志表，表大小在6个G左右。

　　1、精确查询知晓表中数据行数，这个时候我们就要使用count（）函数来统计表中行数的大小了。在innodb存储引擎中count（*）函数是先从内存中读取表中的数据到内存缓冲区，然后全表扫描获得记录行数的。但是这种方式过于简单、直接暴力，对于小表查询比较合适，对于频繁的大表查询就不适用了。尤其是在生产中表很大，且表除了聚集索引（主键索引）外，没有其他非聚集索引（二级索引）的时候，无疑是一种巨大的灾难。

mysql> select count(*) from operation_log;

+----------+

| count(*) |

+----------+

| 21049180 |

+----------+

1 row in set (10.92 sec)

mysql> explain select count(*) from rule_ceshi.operation_log;

+----+-------------+---------------+-------+---------------+----------+---------+------+----------+-------------+

| id | select_type | table         | type  | possible_keys | key      | key_len | ref  | rows     | Extra       |

+----+-------------+---------------+-------+---------------+----------+---------+------+----------+-------------+

|  1 | SIMPLE      | operation_log | index | NULL          | user_key | 194     | NULL | 20660338 | Using index |

+----+-------------+---------------+-------+---------------+----------+---------+------+----------+-------------+

1 row in set (0.00 sec)

mysql> show index from rule_ceshi.operation_log;

+---------------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+

| Table         | Non_unique | Key_name | Seq_in_index | Column_name | Collation | Cardinality | Sub_part | Packed | Null | Index_type | Comment | Index_comment |

+---------------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+

| operation_log |          0 | PRIMARY  |            1 | id          | A         |    20660338 |     NULL | NULL   |      | BTREE      |         |               |

| operation_log |          1 | user_key |            1 | user_key    | A         |     2951476 |     NULL | NULL   |      | BTREE      |         |               |

+---------------+------------+----------+--------------+-------------+-----------+-------------+----------+--------+------+------------+---------+---------------+

2 rows in set (0.00 sec)

mysql> drop index user_key on rule_ceshi.operation_log;
Query OK, 0 rows affected (0.19 sec)
Records: 0  Duplicates: 0  Warnings: 0

mysql> select count(*) from rule_ceshi.operation_log; 
+----------+
| count(*) |
+----------+
| 21049180 |
+----------+
1 row in set (23.39 sec)

　　上面的测试结果表明，count（*）走聚集索引和非聚集索引都是索引全扫描，但是走非聚集索引比走聚集索引获取记录数更快，这是为什么呢？我们通常不是说走主键索引是最快，难道这个原则在这里不适用还是优化器出现bug。当我产生这个疑问的时候，也曾这样怀疑，经过几次度娘和翻墙后，排除错误答案，终于可以很遗憾的告诉你主键索引确实是最快的，只是主键索引查询是有前提条件的，至于什么条件烦请查看我下一篇关于count（*）怎么走索引，走那种索引分析。

　　2、上面的方式对单次查询，在足够配置的物理机上，显然我们还是可以接受的。然而很多次的类似sql出现，对数据库的性能也是一种不必要的损耗，因为这对业务发展并没有很深的意义。我们知道对于select count（*） from table_name这样的sql是没有办法通过索引优化的，那么只能通过改写sql进行优化了，这也是一个精通sql优化高手必备的技能。

　　如果你也想精确查询表中的行数，又想查询的时间能尽可能短，这个时候我们就要想到max（）和min（）函数了，通常我们统计最大值和最小值都是很快返回结果的。

 mysql> select ifnull(max(id),0)-ifnull(min(id),0)+1 as rows from rule_ceshi.operation_log;

 +----------+

 | rows     |

 +----------+

 | 21124162 |

 +----------+

 1 row in set (0.02 sec)

 mysql> explain select ifnull(max(id),0)-ifnull(min(id),0)+1 as rows from rule_ceshi.operation_log;

 +----+-------------+-------+------+---------------+------+---------+------+------+------------------------------+

 | id | select_type | table | type | possible_keys | key  | key_len | ref  | rows | Extra                        |

 +----+-------------+-------+------+---------------+------+---------+------+------+------------------------------+

 |  1 | SIMPLE      | NULL  | NULL | NULL          | NULL | NULL    | NULL | NULL | Select tables optimized away |

 +----+-------------+-------+------+---------------+------+---------+------+------+------------------------------+

 1 row in set (0.01 sec)

　　当然使用这种优化改写的前提是你的上产中表中有主键且是整数类型的，主键还需是连续的，也就是你的上产中没有进行过delete from table where xxx=xxx的删除行记录操作，否则这样统计还是不精准的。

　　3、我们知道MySQL自带一个统计信息，平时我们的show命令之类的都来源数据库中的统计表。如果我们的Dev告诉我们，只需要模糊查询知晓表中数据行数呢？这个时候，你就可以通过MySQL自带的information_schema.tables表的统计信息，初步判断表的数据行大小。

mysql> select table_schema,table_name,table_type,table_rows from information_schema.tables where table_schema='rule_ceshi' and table_name='operation_log';

+--------------+---------------+------------+------------+

| table_schema | table_name    | table_type | table_rows |

+--------------+---------------+------------+------------+

| rule_ceshi   | operation_log | BASE TABLE |   20660338 |

+--------------+---------------+------------+------------+

1 row in set (0.01 sec)

mysql> explain select table_schema,table_name,table_type,table_rows from information_schema.tables where table_schema='rule_ceshi' and table_name='operation_log';

+----+-------------+--------+------+---------------+-------------------------+---------+------+------+---------------------------------------------------+

| id | select_type | table  | type | possible_keys | key                     | key_len | ref  | rows | Extra                                             |

+----+-------------+--------+------+---------------+-------------------------+---------+------+------+---------------------------------------------------+

|  1 | SIMPLE      | tables | ALL  | NULL          | TABLE_SCHEMA,TABLE_NAME | NULL    | NULL | NULL | Using where; Open_full_table; Scanned 0 databases |

+----+-------------+--------+------+---------------+-------------------------+---------+------+------+---------------------------------------------------+

1 row in set (0.00 sec)

　　上面这种方式对于dba日常维护，判断一个表的行数大小很有作用，必需知晓。

MySQL表行数查询最佳实践的更多相关文章

MS SQL查询所有表行数，获取所有数据库名，表名，字段名
1.获取所有数据库名 --SELECT Name FROM Master..SysDatabases ORDER BY Name -- 2.获取所有表名: --SELECT Name NAMEtemp ...
MyBatis 用户表记录数查询
搭建MyBatis开发环境,实现用户表记录数查询 1.在MyEclipse中创建工程,导入MyBatis的jar包
SQL SERVER统计服务器所有的数据库（数据库文件）、表（表行数）、字段（各字段）等详细信息
原文:SQL SERVER统计服务器所有的数据库(数据库文件).表(表行数).字段(各字段)等详细信息 USE STAT GO SET NOCOUNT ON IF EXISTS(SELECT 1 FR ...
atitit.编辑表单的实现最佳实践dwr jq easyui
atitit.编辑表单的实现最佳实践dwr jq easyui 1. 提交表单 1 2. 表单验证 1 3. 数据保存使用meger方式取代save&update方式 1 3.1. Filte ...
单表行数超过 500 万行或者单表容量超过 2GB，才推荐进行分库分表。
https://github.com/alibaba/p3c/blob/master/阿里巴巴Java开发手册(详尽版).pdf 单表行数超过 500 万行或者单表容量超过 2GB,才推荐进行分库分表 ...
MySQL 统计行数的 count
MySQL count() 函数我们并不陌生,用来统计每张表的函数.但如果你的表越来越大,并且是 InnoDB 引擎的话,会发现计算的速度会越来越慢.在这篇文章里,会先介绍 count() 实现的原理 ...
Mysql表分区的选择与实践小结
在一些系统中有时某张表会出现百万或者千万的数据量,尽管其中使用了索引,查询速度也不一定会很快.这时候可能就需要通过分库,分表,分区来解决这些性能瓶颈. 一. 选择合适的解决方法 1. 分库分表. 分库 ...
一种快速统计SQL Server每个表行数的方法
转载自:http://www.cnblogs.com/kenyang/archive/2013/04/09/3011447.html 我们都知道用聚合函数count()可以统计表的行数.如果需要统计数 ...
SQL 从指定表筛选指定行信息获取表行数
1.获取指定表的行数 --获取表中数据行数 --select max([列名]) from 表名 2.筛选指定表的指定行数据(数据表分页获取) http://www.cnblogs.com/morni ...

随机推荐

H5新特性——--第三方绘图工具库 echarts(canvas)---SVG绘图
今天学习的内容 3.1:h5新特性---第三方绘图工具库 echarts(canvas) 百度 echarts;d3;two.js;.... 3.2:h5新特性---SVG绘图 3.2:h5新特性-- ...
Turtle库的建立——汉诺塔
Turtle库的建立——汉诺塔 1.首先是要用递归方法来完成这个汉诺塔法则 2.其次,就要编程好代码以及熟练掌握Turtle函数库一. 相关代码如下: import turtle class St ...
ORM创建多表以及多表的增删改查
一. 多表的创建 1. 一对一在哪个表中设置都行,但是添加数据的时候需要现在没有外键的表中添加数据 models.OneToOneField(to="表名",to_field=& ...
keras常见参数input_dim、input_length理解
在看keras文档embedding层的时候,不太理解其中的input_dim 和input_length 这两个参数,查阅了一下资料,记录下来. keras.layers.Embedding(inp ...
Git合并指定一系列commits到另一个分支
Git合并指定文件到另一个分支经常被问到如何从一个分支合并特定的文件到另一个分支.其实,只合并你需要的那些commits,不需要的commits就不合并进去了. 合并某个分支上的单个commit首先, ...
Forward团队-爬虫豆瓣top250项目-开发文档
项目地址:https://github.com/xyhcq/top250 我在本次项目中负责写爬虫中对数据分析的一部分,根据马壮分析过的html,我来进一步写代码获取数据,具体的功能及实现方法我已经写 ...
python opencv 处理文件、摄像头、图形化界面
转换成RGB import cv2 import numpy as ny img = ny.zeros( ( 3 , 3 ),ny.float32) img=cv2.cvtColor(img,cv2. ...
maven项目打包成war包发布到tomcat下...
分为两种情况: 1.当你的项目中没有前端页面时,直接右键项目--Export--选择web下的warFile--选择目录到tomcat安装目录下的webapps下即可访问. 2.当项目中有前端页面时 ...
ServiceStack.Redis记录
一.事务 (一)AcquireLock方法 1.说明:申请对一个Key加锁(期间其他对象不能访问). 2.带using的使用,或带过期时间参数,否则锁不会自动释放. using (RedisCache ...
Settings 参数记录
DOWNLOAD_FAIL_ON_DATALOSS : 参数:TRUE.FALSE 如果设置为 True : scrapy.Request 有一个 errback 参数, 当 Request 请求出错 ...

MySQL表行数查询最佳实践

MySQL表行数查询最佳实践的更多相关文章

随机推荐

热门专题