MySQL information_schema表查询导致内存暴涨
case:下面的一条sql语句,导致mysql实例内存暴涨:
select * from tables where table_name not in(select table_name from partitions group by table_name having count(*)>1 );
mysql 5.5, 1w+的innodb表。
下面看下调查的结果:
1. sql的执行情况以及内存分配:
step1: 构造information_schema.tables临时表
1.1 构造临时表tables结构:
说明:func=create_schema_table; engine=heap
内存: tables是heap引擎的表,临时构造,使用堆内存;语句结束close_tmp_tables释放。
1.2 填充临时表tables数据:一共由三类表来填充tables的内存
1. memory引擎:
说明:information_schema下的表,创建临时table,
内存: 使用堆内存,填充完数据后 close_tmp_tables,释放内存。
2. mysiam引擎:
说明:information_schema下一部分表,是mysiam引擎的临时表。
内存: 使用堆内存,创建磁盘临时文件,close_tmp_tables,释放内存,删除临时文件。
3. innodb引擎和其它:
说明:使用正常的open_tables函数,创建table,table_share, handler对象。
内存: 使用堆内存
step2:构造information_schema.partition临时表
步骤和step1一样,但partition因为blob的原因,系统创建的时候,指定了mysiam引擎的临时表,而非内存heap临时表。
如下图:
2. 构造两张临时表的开销:
实例一共1w张表,加上系统表,大约10200张,为了构造这两个临时表:
a) 一共open了大约 10200*2 次,加上创建临时表,临时磁盘文件。
b) 而table_cache设置的400,所以opened_table基本没有复用,打开后马上关闭了。
两张并不存在的临时表,全部构造完成,以上为了构造临时表而open大量表所使用的堆内存,现在已经释放。
3. 下面可以执行sql
sql的执行计划是:
1 information_schema.tables
n nest loops information_schema.partitions
nest loop即:对于tables每一条记录要扫描一次patitions。
4. 关键的问题是:
执行计划调用如下函数栈:
mysql_select
JOIN::exec
do_select
sub_select
evaluate_join_record
Item_subselect::exec
subselect_single_select_engine::exec
JOIN::exec
在JOIN::exec有以下的判断:
if (table_list->schema_table_state && is_subselect)
{
table_list->table->file->extra(HA_EXTRA_NO_CACHE);
table_list->table->file->extra(HA_EXTRA_RESET_STATE);
table_list->table->file->ha_delete_all_rows();
free_io_cache(table_list->table);
filesort_free_buffers(table_list->table,);
table_list->table->null_row= ;
}
else
table_list->table->file->stats.records= ;
if (do_fill_table(thd, table_list, tab))
{
即: subselect子查询如果是schema_table, 并且在执行状态中, 需要全部删除 partition里的数据,每次nest loop都重新do_fill_table。
执行的结果就是:
a) 为了构造两个临时表,open了10200*2次表,
b) 又为了每次nest loop,删除并构造了10200次partition表,一共open了10200*10200次表。
table_cache可以完全无视了。
但为什么会占用大量的内存?
在整个构造的过程中:
1. 堆内存 : 在open所有表后,往临时表填充完数据,就free了,不用等语句结束。
2. 线程内存: 为了构造字段,table list这些,内存都是从thd->mem_root线程中分配的,需要等语句结束才释放。
如下,每次子查询执行一次,thd->mem_root增加的memory block;
gdb) p *(this->thd->mem_root)
$ = { min_malloc = , block_size = , block_num = 748, first_block_usage = , Breakpoint , JOIN::exec (this=0x7f9a2c01f508) at sql/sql_select.cc:
(gdb) p *(this->thd->mem_root)
$ = { min_malloc = , block_size = , block_num = 758, first_block_usage = , Breakpoint , JOIN::exec (this=0x7f9a2c01f508) at sql/sql_select.cc:
(gdb) p *(this->thd->mem_root)
$ = {f min_malloc = , block_size = , block_num = 767, first_block_usage = ,
所以:这个sql,因为open太多表,执行时间过长, 而thd内存因为语句没有结束,无法释放,内存一直往上涨, 等语句结束,thd->mem_root的内存全部通过free释放掉。
MySQL information_schema表查询导致内存暴涨的更多相关文章
- MySQL多表查询合并结果union all,内连接查询
MySQL多表查询合并结果和内连接查询 1.使用union和union all合并两个查询结果:select 字段名 from tablename1 union select 字段名 from tab ...
- 记一次mysql多表查询(left jion)优化案例
一次mysql多表查询(left jion)优化案例 在新上线的供需模块中,发现某一个查询按钮点击后,出不来结果,找到该按钮对应sql手动执行,发现需要20-30秒才能出结果,所以服务端程序判断超时, ...
- MySQL多表查询之外键、表连接、子查询、索引
MySQL多表查询之外键.表连接.子查询.索引 一.外键: 1.什么是外键 2.外键语法 3.外键的条件 4.添加外键 5.删除外键 1.什么是外键: 主键:是唯一标识一条记录,不能有重复的,不允许为 ...
- Mysql 单表查询 子查询 关联查询
数据准备: ## 学院表create table department( d_id int primary key auto_increment, d_name varchar(20) not nul ...
- (转)Mysql 多表查询详解
MySQL 多表查询详解 一.前言 二.示例 三.注意事项 一.前言 上篇讲到mysql中关键字执行的顺序,只涉及了一张表:实际应用大部分情况下,查询语句都会涉及到多张表格 : 1.1 多表连接有 ...
- MySQL多表查询回顾
----------------------siwuxie095 MySQL 多表查询回顾 以客户和联系人为例(一对多) 1.内连接 /*内连接写法一*/ select * from t_custom ...
- python 3 mysql 单表查询
python 3 mysql 单表查询 1.准备表 company.employee 员工id id int 姓名 emp_name varchar 性别 sex enum 年龄 age int 入职 ...
- python3 mysql 多表查询
python3 mysql 多表查询 一.准备表 创建二张表: company.employee company.department #建表 create table department( id ...
- [自带避雷针]DropShadowEffect导致内存暴涨
原文:[自带避雷针]DropShadowEffect导致内存暴涨 [自带避雷针]DropShadowEffect导致内存暴涨 周银辉 从学习WPF开始, 就知道"位图效果"不是什 ...
随机推荐
- C#多线程同步
在编写多线程程序时无可避免会碰到线程的同步问题.什么是线程的同步呢? 举个例子:假如在一个公司里面有一个变量记录某人T的工资count=100,有两个主管A和B(即工作线程)在早一些时候拿了这个变量的 ...
- CSS FIXED porn javhd
CSS position property - W3Schools W3Schools › cssref › pr_class_position Definition and Usage. The p ...
- time 函数
1.Python Time 2.C++ Time Example: #include <iostream> #include <chrono> //C++的`计时`库 #inc ...
- UVA - 297 Quadtrees (四分树)
题意:求两棵四分树合并之后黑色像素的个数. 分析:边建树边统计. #include<cstdio> #include<cstring> #include<cstdlib& ...
- mysql show processlist 显示mysql查询进程
1.进入mysql/bin目录下输入mysqladmin processlist; 2.启动mysql,输入show processlist; 如果有 SUPER 权限,则可以看到全部的线程,否则,只 ...
- 排序算法THREE:归并排序MergeSort
/** *归并排序思路:分治法思想 O(nlogn) * 把数组一分为二,二分为四 * 四和为二,二和为一 * */ /** * 归并排序主方法 *@params 待排序的数组 *@params 初始 ...
- MongoDB的timezone问题
MongoDB是以UTC格式来存储所有时间的,查询的时候也是返回UTC时间,不提供在数据库连接级别的timezone支持,这就带来一个问题:无法使用groupby对日期进行聚合,因为你所在的timez ...
- 修改centos环境变量
1.vim /etc/profile 2.PATH=$PATH:/usr/local/php/bin;export PATH 3.source /etc/profile
- VC6.0生成的exe文件图标
以下是我网上收到的方法 我都试过 成功不了 具体说下我遇到的问题 VC6.0生成的exe文件图标是用Icon下几个图标中value值最小的,顺序为IDR_MAINFRAME.IDR_ICONTETYP ...
- windows下常用快捷键
windows下常用快捷键: 显示桌面: win徽标+D 打开资源管理器: win徽标+E 打开任务管理器: Ctrl+Alt+delete 任务切换: Alt+Tab 应用程序中窗口之间的切换: C ...