MySql的count统计结果

起因：最近在学习mysql的数据库，发现在innodb表中大数据量下count(*)的统计结果实在是太慢，所以想找个办法替代这种查询，下面分享一下我查找的过程。

实践：在给出具体的结论之前，我们先看看下面的现象。

一. 创建数据库

创建数据库的表语句如下：

create database IF NOT EXISTS MY_TEST default charset utf8 COLLATE utf8_general_ci;

二. 创建User表

创建User表的语句如下，UserId为主键id，在Id和k上分别建立索引，索引的名字分为了“index_id”和“index_k”。

create table USER (

UserId bigint(20) unsigned not null auto_increment,

Id int(10) unsigned not null default 0,

k int(10) unsigned not null default 0,

UserName varchar(120) not null default '',

PRIMARY KEY (UserId),

KEY index_Id (Id),

KEY index_k (k)

)Engine=InnoDB DEFAULT CHARSET=UTF8;

查看User上的索引，查询结果如下：

mysql> show index from user;

+-------+------------+----------+--------------+-------------+-----------+------

-------+----------+--------+------+------------+---------+

+-------+------------+----------+--------------+-------------+-----------+------

-------+----------+--------+------+------------+---------+

| user | 0 | PRIMARY | 1 | UserId | A | 4

| user | 1 | index_Id | 1 | Id | A | 4

| user | 1 | index_k | 1 | k | A | 4

+-------+------------+----------+--------------+-------------+-----------+------

-------+----------+--------+------+------------+---------+

3 rows in set (1.30 sec)

从上表中我们可以看到user表上有3个索引，分别为主键Primary索引、、二级索引index_Id和index_k。

三. 在User表上比较查询统计

1. 直接count(*)统计

mysql> explain select count(*) from user;

+----+-------------+-------+-------+---------------+----------+---------+------+---------+-------------+

+----+-------------+-------+-------+---------------+----------+---------+------+---------+-------------+

+----+-------------+-------+-------+---------------+----------+---------+------+---------+-------------+

1 row in set (0.04 sec)

mysql> select count(*) from user;

+----------+

| count(*) |

+----------+

| 4058181 |

+----------+

1 row in set (2.50 sec)

在这里使用select count(*) 的时候，默认走的索引是index_Id。虽然user表上有主键索引，但是分析引擎计算的结果需要走“index_Id”索引（有的时候走主键索引），“4041613”这个数字说明分析引擎认为能够提取到正确的结果之前需要扫描“4041613”行索引。Rows参数表明该查询所使用的索引的索引长度，index_Id的索引长度为“4”；

2. 主键字段做条件查询count(*)

这里我们查询所有Userid大于0的记录，我们来看看查询情况。

mysql> explain select count(*) from user where UserId>0;

+----+-------------+-------+-------+---------------+---------+---------+------+---------+--------------------------+

+----+-------------+-------+-------+---------------+---------+---------+------+---------+--------------------------+

+----+-------------+-------+-------+---------------+---------+---------+------+---------+--------------------------+

1 row in set (0.13 sec)

mysql> select count(*) from user where UserId>0;

+----------+

| count(*) |

+----------+

| 4058181 |

+----------+

1 row in set (15.39 sec)

当我们加上主键条件的时候，我们可以看到本次查询走的索引是“Primary”主键索引，我们可以看到此次请求需要15.39秒，比第一个查询2.50秒慢了很多。主键索引的长度为“8”。

3. 二级索引做条件查询count(*)

这里我们查询所有Id大于0的记录，我们来看下查询结果：

mysql> explain select count(*) from user where id>0;

+----+-------------+-------+-------+---------------+----------+---------+------+---------+--------------------------+

+----+-------------+-------+-------+---------------+----------+---------+------+---------+--------------------------+

+----+-------------+-------+-------+---------------+----------+---------+------+---------+--------------------------+

1 row in set (0.16 sec)

mysql> select count(*) from user where id>0;

+----------+

| count(*) |

+----------+

| 4058181 |

+----------+

1 row in set (2.94 sec)

（1）和（3）的查询时间都差不多，基本在2.5秒左右，因为这两个查询走的都是“index_Id”索引。但是（2）虽然走的主键索引，但是很慢，竟然用掉了15秒，index_Id的索引长度为4，主键索引的长度为8，是不是因为索引的长度影响了索引的查询效率？？先别下结论，我们再看下下面的例子。

四. 创建AnotherUser表

建立另外一张表，这张表与上一张表的区别是主键字段UserId和Id字段类型的调换过来了，主键UserId为int(10)，Id类型为bigint(20)。建表语句如下：

create table ANOTHERUSER (

UserId int(10) unsigned not null auto_increment,

Id bigint(20) unsigned not null default 0,

k int(10) unsigned not null default 0,

UserName varchar(120) not null default '',

PRIMARY KEY (UserId),

KEY index_Id (Id),

KEY index_k (k)

)Engine=InnoDB DEFAULT CHARSET=UTF8;

五. 在AnotherUser表上比较查询统计

anotherUser表与User表的字段个数完全相同，唯一不同点在于两个表的主键id的类型不同，另外名称为“Id”的字段的类型也不同，两个表的数据记录基本相同。

1. 直接count(*)统计

mysql> explain select count(*) from anotherUser;

+----+-------------+-------------+-------+---------------+---------+---------+------+---------+-------------+

+----+-------------+-------------+-------+---------------+---------+---------+------+---------+-------------+

+----+-------------+-------------+-------+---------------+---------+---------+------+---------+-------------+

1 row in set (0.80 sec)

mysql> select count(*) from anotheruser;

+----------+

| count(*) |

+----------+

| 4056400 |

+----------+

1 row in set (13.75 sec)

从上面的查询我们可以看到，count(*)在没有加任何条件的时候此次查询走的是主键索引，这个表的主键索引长度是4。优化器认为在提取到正确结果集之前大概需要扫描“4056379”行索引。

2. 主键字段做条件查询count(*)

我们来看下用主键UserId作为查询条件的情况，下面是查询的代码：

mysql> explain select count(*) from anotherUser where UserId>0;

+----+-------------+-------------+-------+---------------+---------+---------+------+---------+--------------------------+

+----+-------------+-------------+-------+---------------+---------+---------+------+---------+--------------------------+

+----+-------------+-------------+-------+---------------+---------+---------+------+---------+--------------------------+

1 row in set (0.04 sec)

mysql> select count(*) from anotherUser where UserId>0;

+----------+

| count(*) |

+----------+

| 4056400 |

+----------+

1 row in set (13.82 sec)

我们可以看到，虽然这里的主键索引的长度为4，但是查询时间基本还是在15秒左右。由此可以看出，index_Id索引查询时间比主键查询时间短并不是索引长度造成的。

3. 二级索引做条件查询count(*)

我们来测试下走Id索引，anotherUser的表Id字段是bigInt(20)。查询结果如下：

mysql> explain select count(*) from anotherUser where Id>0;

+----+-------------+-------------+-------+---------------+----------+---------+------+---------+--------------------------+

+----+-------------+-------------+-------+---------------+----------+---------+------+---------+--------------------------+

+----+-------------+-------------+-------+---------------+----------+---------+------+---------+--------------------------+

1 row in set (0.09 sec)

mysql> select count(*) from anotherUser where Id>0;

+----------+

| count(*) |

+----------+

| 4056400 |

+----------+

1 row in set (2.87 sec)

走二级索引index_Id只需要2.5秒左右，该索引的长度是8(比主键索引长度4大)，但是此次统计仍然要比使用主键来统计要快的多。这更加说明了两者的查询结果不同不是由两者的索引长度造成的。

六. 结论

1. 没有任何条件的查询不一定走的是主键索引，mysql优化器会使用认为是最小代价的索引

2. 在count(*)的时候，采用主键索引比二级索引要慢，而且慢的原因不是因为两者的索引的长度不同

3. Count(*)在没有查询条件的情况下，对innodb引擎的mysql会进行全表扫描，而myasm引擎的mysql无需进行全表扫描，因为myasm的引擎记录了每个表的多少记录。但是当有查询条件的时候，两者的查询效率一致。

4. 经过后来查询大量的资料，主键索引count(*)的时候之所以慢

l InnoDB引擎

[1] 数据文件和索引文件存储在一个文件中，主键索引默认直接指向数据存储位置。

[2] 二级索引存储指定字段的索引，实际的指向位置是主键索引。当我们通过二级索引统计数据的时候，无需扫描数据文件；而通过主键索引统计数据时，由于主键索引与数据文件存放在一起，所以每次都会扫描数据文件，所以主键索引统计没有二级索引效率高。

[3] 由于主键索引直接指向实际数据，所以当我们通过主键id查询数据时要比通过二级索引查询数据要快。

l MyAsm引擎

[1] 该引擎把每个表都分为几部分存储，比如用户表，包含user.frm，user.MYD和user.MYI。

[2] User.frm负责存储表结构

[3] User.MYD负责存储实际的数据记录，所有的用户记录都存储在这个文件中

[4] User.MYI负责存储用户表的所有索引，这里也包括主键索引。

5. MyAsm引擎不支持事务处理，没有仔细深入研究。两种引擎各有自己的使用场景，每个引擎的特点也不尽相同，感兴趣的你可以再仔细深入研究。

转自：http://blog.sina.com.cn/s/blog_77a75bdc0102wczx.html

MySql的count统计结果的更多相关文章

大家都在用MySQL count(*)统计总数，到底有什么问题？
在日常开发工作中,我经常会遇到需要统计总数的场景,比如:统计订单总数.统计用户总数等.一般我们会使用MySQL 的count函数进行统计,但是随着数据量逐渐增大,统计耗时也越来越长,最后竟然出现慢查询 ...
【mysql】 mybatis实现主从表 left join 1:n 一对多分页查询主表从表都有查询条件【mybatis】count 统计+JSON查询
mybatis实现主从表 left join 1:n 一对多分页查询主表从表都有查询条件+count 需求: ======================================= ...
MySQL中count函数使用方法详解
count函数是用来统计表中或数组中记录的一个函数,下面我来介绍在MySQL中count函数用法与性能比较吧. count(*) 它返回检索行的数目, 不论其是否包含 NULL值. SELECT ...
MySQL的COUNT()函数理解
MySQL的COUNT()函数理解标签(空格分隔): MySQL5.7 COUNT()函数探讨写在前面的话细心的朋友会在平时工作和学习中,可以看到MySQL的COUNT()函数有多种不同的参数 ...
NET MVC全局异常处理（一）【转载】网站遭遇DDoS攻击怎么办使用 HttpRequester 更方便的发起 HTTP 请求 C#文件流。 Url的Base64编码以及解码 C#计算字符串长度，汉字算两个字符 2019周笔记（2.18-2.23） Mysql语句中当前时间不能直接使用C#中的Date.Now传输 Mysql中Count函数的正确使用
NET MVC全局异常处理(一) 目录 .NET MVC全局异常处理 IIS配置静态错误页配置 .NET错误页配置程序设置全局异常配置 .NET MVC全局异常处理一直知道有.NET有相关 ...
MySQL按时间统计每个小时记录数
MySQL按时间统计每个小时记录数方案1: ? 1 2 3 4 5 6 7 SELECT @rownum := @rownum + 1 AS ID, CONCAT((CASE WH ...
聊一聊关于MySQL的count(*)
0.背景自从大家对于MySQL数据库的稳定性有了更高的追求后,经常有小伙伴有这样的疑问,对于count(*)这样的操作,有没有正确的姿势,或者有没有可以优化的地方? 但答案比较残酷,如果已经使用了正 ...
MySQL 中 count(*) 和 count(1)
一张有 100W 条数据的表 CREATE TABLE `user` ( `id` int(11) unsigned NOT NULL AUTO_INCREMENT, `username` var ...
MySQL之COUNT(*)性能到底如何？
GreatSQL社区原创内容未经授权不得随意使用,转载请联系小编并注明来源. GreatSQL是MySQL的国产分支版本,使用上与MySQL一致. 前言在实际开发过程中,统计一个表的数据量是经常遇到 ...

随机推荐

【Alpha版本】冲刺-Day3
队伍:606notconnected 会议时间:11月11日会议总结张斯巍(433) 今天安排:个人信息界面设计完成度:100% 明天计划:个人信息界面设计遇到的问题:ps掌握的还不够熟练,导 ...
zabbix 3.0快速安装简介（centos 6）
zabbix快速安装系统版本:centos 6 1.yum源配置和zabbix.msyql安装 rpm -ivh http://mirrors.aliyun.com/zabbix/zabbix/3. ...
A/D转换实验
实验效果:
css002 创建样式和样式表
创建样式和样式表一个样式表包含多个样式样式表的种类 1.内部样式表,存放在<head></head>之间.如: <head> <style> ( ...
curl方式创建elasticsearch的mapping
curl方式创建elasticsearch的mapping curl -XPUT 'http://192.168.1.105:9200/bank/item2/_mapping' -d '{ " ...
CentOS7安装Nginx并部署
服务器IP是192.168.36.136 1.直接yum install nginx即可 2.主配置文件是/etc/nginx/下的nginx.conf,另外一个是/etc/nginx/conf.d/ ...
C++中引用与指针的区别(详细介绍)
C++中引用与指针的区别(详细介绍) C++中的引用与指针的区别指向不同类型的指针的区别在于指针类型可以知道编译器解释某个特定地址(指针指向的地址)中的内存内容及大小,而void*指针则只表示一 ...
css input checkbox和radio样式美化
参考:https://segmentfault.com/a/1190000004553258 http://www.haorooms.com/post/css_mh_ck_radio 思路都一样的,先 ...
.net mvc web api 返回 json 内容，过滤值为null的属性
原文:http://blog.csdn.net/xxj_jing/article/details/49508557 版权声明:本文为博主原创文章,未经博主允许不得转载. .net mvc web ap ...
让Xcode的控制台支持LLDB类型的打印
这个技巧个人认为非常有用当Xcode在断点调试的时候,在控制台中输入 po self.view.frame 类似这样的命令会挂掉,不信可以亲自去试试(Xcode7 以后支持LLDB类型的打印) 那么 ...

MySql的count统计结果

MySql的count统计结果的更多相关文章

随机推荐

热门专题