innodb 自增列重复值问题

1 innodb 自增列出现重复值的问题

先从问题入手，重现下这个bug

use test;

drop table t1;

create table t1(id int auto_increment, a int, primary key (id)) engine=innodb;

insert into t1 values (1,2);insert into t1 values (null,2);

insert into t1 values (null,2);

select * from t1;

+----+------+

| id | a |

+----+------+

| 1 | 2 |

| 2 | 2 |

| 3 | 2 |

+----+------+

delete from t1 where id=2;

delete from t1 where id=3;

select * from t1;

+----+------+

| id | a |

+----+------+

| 1 | 2 |

+----+------+

这里我们关闭mysql，再启动mysql,然后再插入一条数据

insert into t1 values (null,2);

select * FROM T1;

+----+------+

| id | a |

+----+------+

| 1 | 2 |

+----+------+

| 2 | 2 |

+----+------+

我们看到插入了（2,2），而如果我没有重启，插入同样数据我们得到的应该是（4,2)；

上面的测试反映了mysql重启后，innodb存储引擎的表自增id可能出现重复利用的情况。

自增id重复利用在某些场景下回出现问题。依然用上面的例子，假设t1有个历史表t1_history用来存t1表的历史数据，那么mysqld重启前,ti_history中可能已经有了（2,2）这条数据，而重启后我们又插入了（2，2），当新插入的(2,2)迁移到历史表时，会违反主键约束。

2 innodb 自增列出现重复值的原因

mysql> show create table t1\G;

*************************** 1. row ***************************

Table: t1

Create Table: CREATE TABLE `t1` (

`id` int(11) NOT NULL AUTO_INCREMENT,

`a` int(11) DEFAULT NULL,

PRIMARY KEY (`id`)

) ENGINE=innodb AUTO_INCREMENT=4 DEFAULT CHARSET=utf8

1 row in set (0.00 sec)

建表时可以指定 AUTO_INCREMENT值，不指定时默认为1.这个值表示当前自增列的起始值大小，如果新插入的数据没有指定自增列的值，那么自增列的值即为这个起始值。

对于innodb表，这个值是存在内存中（dict_table_struct.autoinc）。那么又问，为什么我们每次插入新的值后， show create table t1看到AUTO_INCREMENT值是跟随变化的。其实show create table t1是直接从dict_table_struct.autoinc取得的（ha_innobase::update_create_info）。

知道了AUTO_INCREMENT是实时存储内存中的。那么，mysqld 重启后，从哪里得到AUTO_INCREMENT呢? 内存值肯定是丢失了，.实际上mysql采用执行类似select max(id)+1 from t1;方法来得到AUTO_INCREMENT。而这种方法就会造成自增id重复的原因。

3 myisam也有这个问题吗

myisam是没有这个问题的。myisam表.frm文件也存AUTO_INCREMENT值，同innodb一样，这个值也不是实时的。myisam会将这个值实时存储在.MYI文件中（mi_state_info_write）。mysqld重起后会从.MYI中读取AUTO_INCREMENT值（mi_state_info_read)。因此，myisam表重启是不会出现自增id重复的问题。

4 innodb 自增列出现重复问题修复

myisam选择将AUTO_INCREMENT实时存储在.MYI文件头部中。实际上.MYI头部还会实时存其他信息，也就是说写AUTO_INCREMENT只是个顺带的操作。其性能损耗可以忽略。InnoDB 表如果要解决这个问题，有两种方法。1）将auto_increment最大值持久到frm文件中。2）将 auto_increment最大值持久到聚集索引根页trx_id所在的位置。第一种方法直接写文件性能消耗较大，这是一额外的操作，而不是以个顺带的操作。如是我们采用第二种方案。为什么选择存储在聚集索引根页页头trx_id。页头trx_id中存存储trx_id,只对二级索引页和insert buf 页头有效（MVCC).而聚集索引根页页头trx_id这个值是没有使用的，始终保持初始值0.正好这个位置8个字节可存放自增值的值。我们每次更新AUTO_INCREMENT值时，同时将这个值修改到聚集索引根页页头trx_id的位置。这个写操作跟真正的数据写操作一样，遵守write-ahead log原则，只不过这里只需要redo log ,而不需要undo log。因为我们不需要回滚AUTO_INCREMENT的变化（即回滚后自增列值会保留，即使insert 回滚了，auto_increment值不会回滚）

因此，AUTO_INCREMENT值存储在聚集索引根页trx_id所在的位置，实际上是对内存根页的修改和多了一条redo log（量很小）,而这个redo log 的写入也是异步的，可以说是原有事务log的一个顺带操作。因此AUTO_INCREMENT值存储在聚集索引根页这个性能损耗是极小的。

5 修复后的性能对比

我们新增了全局参数innodb_autoinc_persistent 取值on/off； on 表示将AUTO_INCREMENT值实时存储在聚集索引根页。off则采用原有方式只存储在内存。

./bin/sysbench --test=sysbench/tests/db/insert.lua --mysql-port=4001 --mysql-user=root \--mysql-table-engine=innodb --mysql-db=sbtest --oltp-table-size=0 --oltp-tables-count=1 \--num-threads=100 --mysql-socket=/u01/zy/sysbench/build5/run/mysql.sock  --max-time=7200 --max-requests run

set global innodb_autoinc_persistent=off;

tps: 22199 rt:2.25ms

set global innodb_autoinc_persistent=on;

tps: 22003 rt:2.27ms

可以看出性能损耗在%1以下。

6 改进

新增参数innodb_autoinc_persistent_interval 用于控制持久化auto_increment值的频率。例如：innodb_autoinc_persistent_interval=100，auto_incrememt_increment=1时，即每100次insert会控制持久化一次auto_increment值。每次持久的值为：当前值+innodb_autoinc_persistent_interval.

测试结果如下

innodb_autoinc_persistent=OFF

innodb_autoinc_persistent=ON

innodb_autoinc_persistent_interval=1

innodb_autoinc_persistent=ON

innodb_autoinc_persistent_interval=10

innodb_autoinc_persistent=ON

innodb_autoinc_persistent_interval=100

TPS

22199

22003

22069

22209

RT(ms)

2.25

2.27

2.26

2.25

注意：如果我们使用需要开启innodb_autoinc_persistent，应该在参数文件中指定，

innodb_autoinc_persistent= on

 如果这样指定set global innodb_autoinc_persistent=on;重启后将不会从聚集索引根页读取auto_increment最大值.

两个疑问：

1 对于innodb和 myisam 存储引擎，.frm中的AUTO_INCREMENT是多余的。其他存储引擎没有研究，不知道有没有用处。

2 innodb表，重启通过select max(id)+1 from t1得到AUTO_INCREMENT值，如果id上有索引那么这个语句使用索引查找就很快。那么，这个可以解释mysql 为什么要求自增列必须包含在索引中的原因。如果没有指定索引，则报如下错误，

ERROR 1075 (42000): Incorrect table definition; there can be only one auto column and it must be defined as a key

而myisam表竟然也有这个要求，感觉是多余的。

附：

innodb_autoinc_lock_mode 这个参数主要解决自增列主备复制问题的，用于控制自增列值连续性的。与本文无关，详细可以参考这里

innodb 自增列重复值问题的更多相关文章

SQLSERVER 自增列，值突然增大1000
SQLSERVER 自增列,值突然增大1000https://blog.csdn.net/lichxi1002/article/details/40074247
sql server 自增列，值突然增大1000的情况
sql server 自增列,值突然增大1000的情况解决方法: 1 打开配置管理器2左面点击sql服务3右面右键点击SQL Server(MSSQLSERVER) 4点击启动参数5 在参数 ...
关于前一篇innodb自增列自己的一点补充
上篇文章是我转载的,忘记注明了出处,在这里深感歉意.但是上篇文章中关于自增列预留ID的计算我当时怎么弄明白,后来自己想了想终于想通了,在这里详细解释一下. 我们以一次性插入10行为例,表格如下: 插 ...
SQL 重置自增列的值批量处理
Declare @IdentityTable sysname, @IdentityColumn sysname, @TotalRows int, @i int, @Iden int, @Sql var ...
sql server 修改表自增列的值
Create PROCEDURE [dbo].[SP_UpdateIdentityId] ( ) , @beforeId INT , @afterId INT ) AS BEGIN IF @befor ...
SQLServer如何在批量插入后，获取批量插入的自增列的值
解决方法如下: Use the OUTPUT functionality to grab all the INSERTED Id back into a table. 使用output 功能获取所有插 ...
mysql自增列导致主键重复问题分析。。。
前几天开发童鞋反馈一个利用load data infile命令导入数据主键冲突的问题,分析后确定这个问题可能是mysql的一个bug,这里提出来给大家分享下.以免以后有童鞋遇到类似问题百思不得其解,难 ...
MySQL -- Innodb是如何处理自增列的
对于那些向带有自增列的表中插入行的语句,Innodb提供一种可配置的锁定机制,这种锁定机制可以显著提高SQL语句的可伸缩性和性能. Innodb中为了使用自增机制,自增列必须是索引的部份,从而可以使用 ...
(转)mysql自增列导致主键重复问题分析
mysql自增列导致主键重复问题分析... 原文:http://www.cnblogs.com/cchust/p/3914935.html 前几天开发童鞋反馈一个利用load data infile ...

随机推荐

SQL Server表分区
什么是表分区一般情况下,我们建立数据库表时,表数据都存放在一个文件里. 但是如果是分区表的话,表数据就会按照你指定的规则分放到不同的文件里,把一个大的数据文件拆分为多个小文件,还可以把这些小文件放在 ...
谈谈一些有趣的CSS题目（十二）-- 你该知道的字体 font-family
开本系列,谈谈一些有趣的 CSS 题目,题目类型天马行空,想到什么说什么,不仅为了拓宽一下解决问题的思路,更涉及一些容易忽视的 CSS 细节. 解题不考虑兼容性,题目天马行空,想到什么说什么,如果解题 ...
菜鸟Python学习笔记第一天：关于一些函数库的使用
2017年1月3日星期二大一学习一门新的计算机语言真的很难,有时候连函数拼写出错查错都能查半天,没办法,谁让我英语太渣. 关于计算机语言的学习我想还是从C语言学习开始为好,Python有很多语言的 ...
TODO：即将开发的第一个小程序
TODO:即将开发的第一个小程序微信小程序是一种全新的连接用户与服务的方式,它可以在微信内被便捷地获取和传播,同时具有出色的使用体验.个人理解小程序是寄宿在微信平台上的一个前端框架,具有跨平台功能, ...
ASP.NET MVC5+EF6+EasyUI 后台管理系统（66）-MVC WebApi 用户验证 (2)
系列目录前言: 回顾上一节,我们利用webapi简单的登录并进行了同域访问与跨域访问来获得Token,您可以跳转到上一节下载代码来一起动手. 继续上一篇的文章,我们接下来演示利用拿到的Token来访 ...
Hawk 4.6 并行化
并行化 Hawk支持单机并行化,也就是使用多线程获取数据.它可以控制目前所有任务的数量,为了不给网站造成过大的压力,仅当任务池中的任务数量小于一定值后,才会插入新的任务. 你可以在数据清洗的执行面板 ...
套用JQuery EasyUI列表显示数据、分页、查询
声明,本博客从csdn搬到cnblogs博客园了,以前的csdn不再更新,朋友们可以到这儿来找我的文章,更多的文章会发表,谢谢关注! 有时候闲的无聊,看到extjs那么肥大,真想把自己的项目改了,最近 ...
springmvc SSM 多数据源 shiro redis 后台框架整合
A集成代码生成器 [正反双向(单表.主表.明细表.树形表,开发利器)+快速构建表单下载地址 ; freemaker模版技术 ,0个代码不用写,生成完整的一个模块,带页面.建表sql脚本,处理类 ...
【JS基础】正则表达式
正则表达式的() [] {}有不同的意思. () 是为了提取匹配的字符串.表达式中有几个()就有几个相应的匹配字符串. (\s*)表示连续空格的字符串. []是定义匹配的字符范围.比如 [a-zA-Z ...
iOS开发判断当前APP版本和升级
从iOS8系统开始,用户可以在设置里面设置在WiFi环境下,自动更新安装的App.此功能大大方便了用户,但是一些用户没有开启此项功能,因此还是需要在程序里面提示用户的方法一:在服务器接口约定对应的数 ...

innodb 自增列重复值问题

innodb 自增列重复值问题的更多相关文章

随机推荐

热门专题