统计每个库每个表的大小是数据治理的其中最简单的一个要求，本文将从抽样统计结果及精确统计结果两方面来统计MySQL的每个库每个表的数据量情况。

1、统计预估数据量

mysql数据字典库information_schema里记录了统计的预估数据量（innodb引擎表不准确，MyISAM引擎表准确）及数据大小、索引大小及表碎片的大小等信息。

如果想了解每个库及表的大概数据量级，可以直接查information_schema.tables进行统计即可。例如：

SELECT  table_schema,table_name,table_rows,data_length+index_length+ data_free data_size

 FROM information_schema.`TABLES` WHERE table_schema IN ('db1','db2')；

其中data_size单位为B

如上文所述，统计信息里的数据条数及size是根据部分数据抽样统计的值，与实际大小存在差异，且表越大，差异越明显，如果想知道每张表的实际情况，需用后续的方法。

2、统计实际数据量

想要统计每张表的实际大小就得去遍历每个表算出对的记录数，通过查看表空间大小（每个表独立表空间）查看每个表的size。通过以下步骤即可达到精确统计的目的。

创建路径

创建一个工作路径，保存脚本及临时文件等

mkdir -p  /usr/local/data_size

创建统计库及表

在需要统计的数据库实例上创建统计库

SQL>  create  database bak_db;

创建统计的存储过程

SQL> use bak_db;

SQL>CREATE  PROCEDURE `p_db_size`()

BEGIN

DECLARE v_id INT;

DECLARE v_maxid INT;

DECLARE v_tbname VARCHAR(50);

DECLARE  v_dbname VARCHAR(50);

DECLARE v_sql_upd VARCHAR(200);

SET v_id =(SELECT MIN(id) FROM bak_db.tb_size);

SET v_maxid =(SELECT MAX(id) FROM bak_db.tb_size);

WHILE v_id <=v_maxid

DO

SET v_tbname = (SELECT tbname FROM  bak_db.tb_size WHERE  id=v_id);

SET v_dbname = (SELECT dbname FROM  bak_db.tb_size WHERE  id=v_id);

SET  v_sql_upd = CONCAT('update bak_db.tb_size  set tb_rows=(select count(*) from  ',v_dbname,".",v_tbname,") where id=",v_id);

    SET  @v_sql_upd := v_sql_upd;

    PREPARE stmt FROM @v_sql_upd;

    EXECUTE stmt ;

    DEALLOCATE PREPARE stmt;

    SET v_id = v_id +1;

END WHILE;

    END;

创建脚本

vim       data.sh

/*  插入如下内容*/

#! /bin/bash

cd /usr/local/data_size

du -s  /data/mysql/mysql3306/data/db1/* |grep -v  ".frm" |grep -v ".opt" >/usr/local/data_size/data_size

du -s  /data/mysql/mysql3306/data/db2/* |grep -v  ".frm" |grep -v ".opt">>/usr/local/data_size/data_size

# 后面4步是拼接成sql

awk '{print "insert into bak_db.tb_size(size,tb_route)values("""$0}' /usr/local/data_size/data_size >/usr/local/data_size/data_size1

awk '{print $0";"}' /usr/local/data_size/data_size1 >/usr/local/data_size/data_size.sql

sed  -i "s#\t#,'#g"  /usr/local/data_size/data_size.sql

sed  -i "s#;#');#g"  /usr/local/data_size/data_size.sql

# 创建统计表

 /usr/local/mysql5.7/bin/mysql -uroot -p'Test#123456' -h 192.168.28.132 -e "drop table if exists bak_db.tb_size;CREATE TABLE IF NOT EXISTS bak_db.tb_size (  id INT(11) NOT NULL PRIMARY KEY  AUTO_INCREMENT ,size INT,tb_route VARCHAR(200),tbname VARCHAR(50),dbname VARCHAR(50),tb_rows INT(11));" 

# 导入数据

 /usr/local/mysql5.7/bin/mysql -uroot -p'Test#123456' -h 192.168.28.132 -e "use  bak_db;truncate table bak_db.tb_size;source /usr/local/data_size/data_size.sql;"

# 生成库名及表名，当然该步骤也可以从数据字段中获取

 /usr/local/mysql5.7/bin/mysql -uroot -p'Test#123456' -h 192.168.28.132 -e "use  bak_db;UPDATE  bak_db.tb_size  SET  tbname=REPLACE(SUBSTRING_INDEX(tb_route,'/',-1),'.ibd','');"

 /usr/local/mysql5.7/bin/mysql -uroot -p'Test#123456' -h 192.168.28.132 -e "UPDATE  bak_db.tb_size  SET  dbname=LEFT (SUBSTRING_INDEX(tb_route,'/',-2),INSTR(SUBSTRING_INDEX(tb_route,'/',-2),'/')-1);"

sleep 10              # 如果之前的步骤在主库金学习学习，则建议暂停一段时间 以免后面统计的时候无法获得表及内容，如果前面的步骤都在从库，则可以省略该步骤

echo 'start call  procedure'

# 调用存储过程 统计每个表的记录条数

/usr/local/mysql5.7/bin/mysql -uroot -p'Test#123456' -h 192.168.28.132 -e "use  bak_db;call bak_db.p_db_size();"

# 把表及数据导出

/usr/local/mysql5.7/bin/mysqldump -uroot -p'Test#123456' -h 192.168.28.132 --single-transaction bak_db tb_size >/usr/local/data_size/tb_size.sql

# 将表及结果导入主库（从库相当于删除在重建了一次）

/usr/local/mysql5.7/bin/mysql -uroot -p'Test#123456' -h 192.168.28.128 -e "use  bak_db;source /usr/local/data_size/tb_size.sql;"

结果如下：

可以看出精确值与统计信息里的值差异还是很大的，且表越大差异越明显。

TIPS：本文精确统计的脚本还有许多优化空间，写的比较仓促，大家可以按需自行调整，水平有限，欢迎斧正。如有问题，欢迎与我沟通。

想了解更多内容或参与技术交流可以关注微信公众号【数据库干货铺】或进技术交流群沟通。

MySQL统计库表大小的更多相关文章

MySQL查看库表的大小
MySQL数据库空间使用情况查询如果想知道MySQL数据库中每个表占用的空间.表记录的行数的话,可以打开MySQL的 information_schema 数据库.在该库中有一个 TABLES 表, ...
MySQL查看某库表大小及锁表情况
查询所有数据库占用磁盘空间大小的SQL语句: 语句如下: select TABLE_SCHEMA, concat(truncate(sum(data_length)/1024/1024,2),' MB ...
MySQL基本库表管理
基本管理指令 mysql登陆第一种 [root@wei ~]# mysql -u root -p 第二种(带参输入) [root@wei ~]# mysql -uroot -proot 注意:每个命 ...
mysql: 查看某库表大小
查询所有数据库占用磁盘空间大小的SQL语句: 语句如下 1 2 3 4 5 select TABLE_SCHEMA, concat(truncate(sum(data_length)/1024/102 ...
mysql查看某库表大小
查询所有数据库占用磁盘空间大小的SQL语句: 语句如下 select TABLE_SCHEMA, concat(truncate(sum(data_length)/1024/1024,2),' MB' ...
mysql统计库下所有表数据行数
一.执行下面sql select concat( 'select "', TABLE_name, '", count(*) from ', TABLE_SCHEMA, '.', T ...
mysql 之库, 表的简易操作
一. 库的操作 1.创建数据库创建数据库: create database 库名 charset utf8; charset uft8 可选项 1.2 数据库命名规范: 可以由字母.数字.下划 ...
MySQL之库表详细操作
一库操作 1.创建数据库 1.1 语法 CREATE DATABASE 数据库名 charset utf8; 1.2 数据库命名规则可以由字母.数字.下划线.@.#.＄区分大小写唯一性不能使 ...
MySQL的库表详细操作
MySQL数据库本节目录一库操作二表操作三行操作一库操作 1.创建数据库 1.1 语法 CREATE DATABASE 数据库名 charset utf8; 1.2 数据库命名规则 ...

随机推荐

Java实现蓝桥杯打印图形
标题:打印图形如下的程序会在控制台绘制分形图(就是整体与局部自相似的图形). 当n=1,2,3的时候,输出如下: 请仔细分析程序,并填写划线部分缺少的代码. n=1时: o ooo o n=2时: ...
Java实现蓝桥杯一步之遥
一步之遥从昏迷中醒来,小明发现自己被关在X星球的废矿车里. 矿车停在平直的废弃的轨道上. 他的面前是两个按钮,分别写着"F"和"B". 小明突然记起来,这两个 ...
java实现第六届蓝桥杯隔行变色
隔行变色隔行变色 Excel表的格子很多,为了避免把某行的数据和相邻行混淆,可以采用隔行变色的样式. 小明设计的样式为:第1行蓝色,第2行白色,第3行蓝色,第4行白色,- 现在小明想知道,从第21行 ...
Linux 用户管理命令-userdel和su
userdel [选项] 用户名,可以删除用户,常用选项 -r :删除用户的同时删除用户的家目录,一般都要用,例如:userdel -r xbb 新建用户和删除用户的本质也就是修改了 /etc/sha ...
为什么我觉得 Java 的 IO 很复杂？
初学者觉得复杂是很正常的,归根结底是因为没有理解JavaIO框架的设计思想: 可以沿着这条路想一想: 1,学IO流之前,我们写的程序,都是在内存里自己跟自己玩.比如,你声明个变量,创建个数组,创建个集 ...
Entity Framework Core遇到的问题汇总
1.add-migration : 无法将“add-migration”项识别为 cmdlet.函数.脚本文件或可运行程序的名称.请检查名称的拼写,如果包括路径,请确保路径正确,然后再试一次. 使用E ...
Python实现抖音关键词热度搜索小程序（附源码）
今天给大家带来一个抖音热词小程序,废话不多说,直接上代码 import requests import json import urllib.parse import time ''' python知 ...
k8s学习-资源清单
4.kubernetes使用 4.1.资源清单 api 文档.api 描述 4.1.2.说明必须存在的属性主要的对象额外的参数项例子 vim my-app.yml apiVersion: v1 ...
PMBOK 基础知识（1）
启动.结束过程项目管理计划第一章引论第2章项目运行环境第3章项目经理的角色第4章项目整合管理第5章项目范围管理第6章项目进度管理第7章项目成本管理第8章项目质量管理 ...
认识OSI七层模型
概述: OSI全名(Open System Interconnect),是指定的开放系统互连参考模型,为开放式互连信息系统提供了一种功能结构的框架.层次:从低到高的层级:物理层.数据链路层.网络层.传 ...

MySQL统计库表大小