1. 环境

Mysql 主从

Mysql版本:5.1.49-log

系统:Red Hat Enterprise Linux Server release 5.4  64bit

2. 表面现象

数据库操作变慢,如用主键作为条件查询,有时也会超过1秒;

主库IO使用率一直在90%以上(平常io比较低20%以内),dirty 页占总数的90%左右,脏页刷不完;持续了几个小时~

3. 从系统上看

主库的iostat 的使用率一直在90%以上,Mysql data 所在目录的大小一直没变;主库的 ib_logfile 20分钟切换一次(主库上面的innodb log写得还是比较频繁),而从库的 ib_logfile 4小时切换一次。

4. 从mysql上看

在主库 Buffer pool hit rate 993 / 1000  innodb 的命中率一直维持在99%左右;

Innodb_buffer_pool_pages_dirty 的大小一直在增长,dirty 页占总数的90%左右,脏页刷不完。但这些脏页不像是正常操作产生的,因为主库上的读写操作都不大。并且从库上的同步没有延时,而且从库的dirty页也很少。

5. 从监控mysql报表上看

从监控到的mysql的读写,跟往常没什么区别;

而innodb 的 Data_free 从开始(100MB以内)

所有innodb的数据+索引的大小为:47.2GB

到恢复正常时data_free的大小为:32.3GB

所有innodb的数据+索引的大小为:45GB

可见在在innodb 数据+索引基本上没减少的情况下,data_free 变成32GB,这32GB来自undo的释放?为什么一下子释放这么多undo?

6. 再看看出现问题前的操作

原来3306实例下,有多个数据库,在出现问题前,刚好将一个数据库(频繁更新)迁移至其他服务器。迁移数据库 跟 这个问题 是巧合 or 触发?

7. 问题的原因

Undo 的释放?查看show engine innodb status中的:History list length (History list length是指在回滚空间中的未清除事务数。随着事务的提交,它的值会增加;随着清除线程的运行,它的值会减小)

发现History list length 的值很大,再查回以前的crt的log中的 History list length ,最近这个值一直在增长,一直增长到:78883366 (竟然有这么多的事务数未清除)

再看看出问题的时候,History list length 的变化情况(从crt log 中过滤出来,还好平时记录了操作的crt log;这回用上了):

# grep "History list length" app190.log

History list length 78883366

History list length 73091889

History list length 70069534

History list length 66194783

History list length 62209735

History list length 49672090

History list length 31489057

History list length 30877319

History list length 33

到恢复正常时,History list length 维持在100以内。

8. 查找History list length值太大的原因

为什么History list length一直未清理,innodb 在什么时候清理这些事务数?

看看innodb master thread的操作(参考:mysql技术内幕innodb存储引擎)

每10秒的操作包括:

刷新100个脏页到磁盘(可能)  注:后面的版本用 innodb_io_capacity 调整

合并至多5个插入缓冲(总是)

将日志缓冲刷新到磁盘(总是)

删除无用的undo页(总是)

刷新100个或者10个脏页到磁盘(总是)

产生一个检查点(总是)

Background loop 在没有用户活动(数据库空闲时)或者数据库关闭时,就会切换到这个循环,包括以下操作:

删除无用的undo页(总是)

合并20个插入缓冲(总是)

调回到主循环(总是)

不断刷新100个页,直到符合条件(可能,跳转到flush loop中完成)

由上可见,每10秒会删除无用的undo页,但为什么 History list length 还是这么大?

导致History list length值太大的原因,是跟迁移走的数据库(频繁更新)有关;这个数据库的应用,是采用连接池来连接mysql,并且mysql中使用的隔离级别是默认的:REPEATABLE-READ。在这个级别下,保证了多次读的结果一样(跟MVCC有关)。

而这个业务对于失败的事务不做任何操作,导致可能存在这个事务一直没commit,为了保持隔离级别REPEATABLE-READ 的特性,在undo中一直保留了这个事务以后的版本号,也就导致未清理的事务数越来越大,History list length 值也就越大。

可见,出现主库IO使用率一直在90%以上,是因为mysql 在清理undo 中的事务数。但有什么方法可以避免History list length 的值太大?

9. 避免History list length 值太大

1. 更改业务程序中的逻辑,比如对失败事务做相关的操作;

2. 在对业务没影响的情况下,可用隔离级别:read committed,在这个事务隔离级别下,只有事务commit,就会去清理undo中的事务(每10秒)。

由于对程序的更改没这么快,而且开发确认业务在 read committed 下也没影响,所以将业务的隔离级别更改为read committed :

在mysql 中执行:set global transaction isolation level read committed; 重启业务,重连数据库后生效,更改之后History list length 基本上保持在100以内。

 show global variables like '%iso%';
set global transaction isolation level read committed; pager grep "History list";
show innodb status;
nopager;

参考:

http://blog.chinaunix.net/uid-21879027-id-3348358.html

Mysql History list length 值太大引起的问题的更多相关文章

  1. double的值太大,以及补0

    当double的值太大的时候,比如1000000000 用DecimalFormat: double d = 1.0E7; System.out.println(new DecimalFormat(& ...

  2. ZTree id值太大,ZTree没有生成树,ZTree的id值过大

     ZTree id值太大,ZTree没有生成树,ZTree的id值过大 >>>>>>>>>>>>>>>> ...

  3. exception 值太大

      CreateTime--2018年2月5日09:45:01 Author:Marydon 异常: Cause: java.sql.SQLException: ORA-12899: 列 " ...

  4. oracle 11g 导入表时 提示 ***值太大错误

    导入数据库时,总是提示**值太大,实际值是**的错误. 具体忘了错误代码是什么了 ——! 经查询,这个是由于字符集设置的不是gbk的,导致导入时遇到中文字符出现的问题, 解决方法: 如果可以的话就把数 ...

  5. Oralce导入数据库出现某一列的值太大

    这是由于导出的文件所运行的Oracle,和导入所运行的Oracle机器字符集不相同导致的,在UTF-8中有的汉字占三个字节, 并不是所有的都占两个字节,

  6. Mysql文件太大导入失败解决办法总结

    Mysql文件太大导入失败解决办法总结 在使用phpmyadmin导入数据库的时候可能会碰到由于数据库文件太大而无法导入的问题! 英文提示如下:File exceeds the maximum all ...

  7. [转]MySql ibdata1文件太大如何缩小

    From : http://blog.chinaunix.net/uid-24373487-id-4223322.html 原文地址:MySql ibdata1文件太大如何缩小 作者:emailwht ...

  8. 【原创】Innodb中mysql如何快速删除2T的大表

    小漫画 来,先来看小漫画陶冶一下情操 OK,这里就说了.假设,你有一个表erp,如果你直接进行下面的命令 drop table erp 这个时候所有的mysql的相关进程都会停止,直到drop结束,m ...

  9. Innodb中MySQL如何快速删除2T的大表

    转自:http://database.51cto.com/art/201808/582324.htm OK,这里就说了.假设,你有一个表erp,如果你直接进行下面的命令: drop table erp ...

随机推荐

  1. Python学习之魔法方法

    Python中会看到前后都加双下划线的函数名,例如 __init__(self),这类写法在Python中具有特殊的含义.如果对象使用了这类方法中的某一个,那么这个方法将会在特殊的情况下被执行,然而几 ...

  2. poj2230 欧拉回路

    http://poj.org/problem?id=2230 Description Bessie's been appointed the new watch-cow for the farm. E ...

  3. Android开发——View动画、帧动画和属性动画详解

    0. 前言   Android动画是面试的时候经常被问到的话题.我们都知道Android动画分为三类:View动画.帧动画和属性动画. 先对这三种动画做一个概述: View动画是一种渐进式动画,通过图 ...

  4. linux 操作之一 如何在linux将本地数据*.sql文件导入到linux 云服务器上的mysql数据库

    liunx 版本ubuntu 16.4 mysql 版本  5.6 1)准备*.sql文件 (* 是准备导入的sql文件的名字) 2)liunx 远程客户端  SecureCRT 7.0 alt+p ...

  5. Python全栈面试题

    Mr.Seven   博客园 首页 新随笔 联系 订阅 管理 随笔-132  文章-153  评论-516  不吹不擂,你想要的Python面试都在这里了[315+道题]   写在前面 近日恰逢学生毕 ...

  6. js复制粘贴事件

    一.相应的事件 copy: 在发生复制操作时触发. beforecut: 在发生剪切操作 前 触发. cut: 在 发生 剪切 操作 时 触发. beforepaste: 在 发生 粘贴 操作 前 触 ...

  7. iOS笔记058 - IOS之多线程

    IOS开发中多线程 主线程 一个iOS程序运行后,默认会开启1条线程,称为"主线程"或"UI线程" 作用 显示和刷新界面 处理UI事件(点击.滚动.拖拽等) 注 ...

  8. flask中static_folder与static_url_path的区别与联系

    # -*- coding:utf-8 -*- from flask import Flask, url_for app1 = Flask(__name__, static_folder='mystat ...

  9. python终极篇 --- django 初识

    1. 下载: 命令行: pip install django==1.11.15 pip install -i 源 django==1.11.15 pycharm settings 解释器 点+号 输入 ...

  10. Python——数据类型之set

    本篇主要内容 • set集合的特点 • set集合的建立 • set集合的17个内置函数 • set集合的数学运算符号 1.set集合类型的特点. 1.无序 2.不同元素 3.元素必须不可变.(数字, ...