0、导读

用mysqldump备份数据时，加上 -w 条件选项过滤部分数据，发现导出结果比实际少了40万，什么情况？

本文约1500字，阅读时间约5分钟。

1、问题

我的朋友小文前几天遇到一个怪事，他用mysqldump备份数据时，加上了 -w 选项过滤部分数据，发现导出的数据比实际上少了40万。

要进行备份表DDL见下：

CREATE TABLE `oldbiao` (

`aaaid` int(11) NOT NULL,

`bbbid` int(11) NOT NULL,

`cccid` int(11) NOT NULL,

`time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP,

`dddid` int(11) DEFAULT NULL,

KEY `index01` (`ccccid`),

KEY `index02` (`dddid`,`time`)

) ENGINE=InnoDB DEFAULT CHARSET=utf8;

顺便吐槽下，这个表DDL设计的真是low啊。没主键，允许NULL。

mysqldump备份指令增加的 -w/--where 选项是：

-w "time>‘2016-08-01 00:00:00'"

加上这个参数的作用是：只备份 2016-8-1 之后的所有数据，相当于执行了下面这样的SQL命令：

SELECT SQL_NO_CACHE * FROM t WHERE time>‘2016-08-01 00:00:00'

然后把导出的SQL文件恢复后，再随机抽查下数据看看是否有遗漏的。不查不知道，一查吓一跳，发现 2016-12-12 下午的数据是缺失的。经过仔细核查，发现比原数据大概少了40万条记录。

百思不得其解的小文请我帮忙排查问题。

2、排查

既然是少了一部分数据，那就要先定位到底是丢失了的是哪部分数据。

那么，如何定位呢？

搞数据库的人，应该都知道折半查找法，这是计算机科学里比较基础的概念之一。我们就利用这种方法来快速定位。

经过排查，发现是缺少的数据有个特点，根据时间排序，发现最早的数据是 2016-8-1 8点的，而我们上面设定的条件则是 2016-8-1 0点开始的所有数据，整整差了8个小时。

看到8小时这个特点，我想你应该大概想到什么原因了吧。对，没错，就是因为时区的因素导致的。

经过排查，发现是因为原先写数据时，是以 0时区 时间写入的，但执行mysqldump备份时则使用的是本地 东8区 的时间，所以就有了8小时的差距。

2、解决

知道了问题所在，方法就简单了。有两个方法：

1、修改mysqldump中的where条件时间值，减去8个小时。建议采用该方法。

mysqldump ... -w "time>‘2016-07-31 16:00:00'"

2、修改MySQL全局时区，从 0时区改成东8区，并且mysqldump加上 --skip-tz-utc 选项。这种方法需要修改MySQL的全局时区，可能会导致更多的业务问题，因此强烈不建议使用。

mysqldump ... --skip-tz-utc -w "time>‘2016-08-01 08:00:00'"

问题暂且按下，我们先来看下时区因素怎么影响查询结果的。

先看下系统本地时间：

[yejr@imsyql]$ date -R

Wed, 21 Dec 2016 14:04:51 +0800

测试表DDL：

CREATE TABLE `t1` (

`id` int(10) unsigned NOT NULL AUTO_INCREMENT,

...

`c1` timestamp NULL DEFAULT NULL,

PRIMARY KEY (`id`)

) ENGINE=InnoDB;

查看MySQL的时区设置：
图1

然后写入一条数据：
图2

第一次备份，用本地时间条件去过滤：

mysqldump -w "dt >= '2016-12-21 14:00:00'"

这种情况下，显然是没有结果的。
图3

第二次备份，用本地时间减去8小时再去过滤：

mysqldump -w "dt >= '2016-12-21 06:00:00'"

这种就可以备份出数据了。
图4

此外，我们注意到mysqldump的 --tz-utc 选项，它是和时区设定有关系的：

--tz-utc

SET TIME_ZONE='+00:00' at top of dump to allow dumping of TIMESTAMP data when a server has data in different time zones or data is being moved between servers with different time zones.

(Defaults to on; use --skip-tz-utc to disable.)

这个选项的作用，就是以 0时区备份数据，把所有时间都转换成 0时区的数据。比如本来是在东8区(+08:00) 的时间 14:00:00，转换成 0时区后，会变成 06:00:00，原来是西8区(-08:00) 的时间14:00:00，则转换成 22:00:00。这个选项是默认启用的。

在上面第一次备份时没有数据，就是因为MySQL里本身存储的就是 0时区的数据，mysqldump也设定了转换成 0时区，我们传递进去的参数却是东8区的时间，因此没有数据。

3、总结

本来只想简单写一下的，结果啰里啰嗦写了好多。

其实我们只需要注意一点，服务器在哪里，就是用哪里的时区，也就是 SYSTEM 时区，在做SQL查询以及mysqldump备份数据时，也使用服务器上的时间，而不使用我们本地时间。
图5

老叶茶馆镇店之宝，扫码识别或访问 http://yejinrong.com 直达

赞赏

人赞赏

            </div><div><div></div></div>

    </div>

</article>

【转帖】纳尼，mysqldump导出的数据居然少了40万？的更多相关文章

mysqldump导出部分数据的方法：加入--where参数
mysqldump导出部分数据的方法: 加入--where参数 mysqldump -u用户名 -p密码数据库名表名 --where="筛选条件" > 导出文件路径 my ...
Mysql 用命令行导出导入数据方法
方法一: 导出参考:https://www.cnblogs.com/activiti/p/6700044.html 用mysqldump可以导出整个数据库里的表和数据,不单单是只导出某个表的数据命令 ...
MYSQL使用mysqldump导出某个表的部分数据
命令格式如下: mysqldump -u用户名 -p密码数据库名表名 --where="筛选条件" > 导出文件路径例子: 从meteo数据库的sdata表中导出sen ...
mysql使用mysqldump导出数据出错
mysqldump -hlocalhost -uroot -p123456 student_info jssypk > c:/databackup.sql 导出表结构 mysqldump - ...
MySQL数据库使用mysqldump导出数据详解
mysqldump是mysql用于转存储数据库的实用程序.它主要产生一个SQL脚本,其中包含从头重新创建数据库所必需的命令CREATE TABLE INSERT等.接下来通过本文给大家介绍MySQL数 ...
mysql第一天【mysqldump导出数据和mysql导入数据】
1.使用mysqldump导出数据到本地sql文件在mysql>bin下执行: 例如: mysqldump -hrm-2ze8mpi5i65429l1qvo.mysql.rds.aliyunc ...
MySQL mysqldump 导入/导出结构&数据&存储过程&函数&事件&触发器
———————————————-库操作———————————————-1.①导出一个库结构 mysqldump -d dbname -u root -p > xxx.sql ②导出多个库结构 m ...
mysql使用navicat和mysqldump导出数据
1.navicat 方式一:选中表,右键转储:(含有表结构和数据) 方式二:选择右上角工具,点击数据传输,在这个页面右侧选择数据库,左侧选择文件. 点击下一步,选择导出的表名和各种函数什么的,然后点击 ...
mysqldump导出数据
如果导出的数据是乱码,需要制定--default-character-set= mysqldump -h wn-fala-v2-cluster.cluster-cczg3tb617nn.eu-cent ...
mysqldump进行复制数据导出导入时的问题
在执行数据导入到从库时,若使用mysqldump命令进行数据导出,应当一次性将需要同步的库导出. mysqldump -uroot -p --single-transaction --database ...

随机推荐

super只能用在构造方法里面吗？
super关键字并不仅限于在构造方法中使用.在Java中,super关键字有两个主要的用途: 在子类的构造方法中调用父类的构造方法.这是super的一个常见用法,通常是在子类的构造方法的第一行使用,用 ...
在winform blazor hybrid中绘图
前几天跟大家介绍了在winform中使用blazor hybrid,而且还说配上blazor的ui可以让我们的winform程序设计的更加好看,接下来我想以一个在winform blazor hybr ...
Altas&Ranger快速入门
Altas&Ranger快速入门一.元数据企业内部远行多种类型的数据库,有关系型数据库.非关系型数据库.图数据库.时序数据库等,常见有mysql.redis.Mongodb.oracle. ...
实时媒体AI，打破内容创作天花板，加速视频创新
摘要:互联网视频经过几代发展,用户体验快速升级,对创新玩法.互动性要求越来越高.那如何解决这些问题? 媒体AI,是行业共识.华为云提供云原生实时媒体AI能力,联合伙伴打造AI算法开放生态市场,加速视频 ...
企业新道路怎么走？火山引擎AB测试助力决策选择
更多技术交流.求职机会,欢迎关注字节跳动数据平台微信公众号,回复[1]进入官方交流群乐刻是一家创立8年的企业,除了消费者熟悉的乐刻健身房可办月卡.24小时营业等,其还有比外界了解更多元的业务.目 ...
PPT 商务PPT怎么做
商务报告:公司专属PPT模板怎么做? 通过LOGO 提取主色调搜集相关元素通过LOGO 提取主色调搜集相关元素下载图片使用建立版面
如何利用CCXT交易数字货币合约
更多精彩内容,欢迎关注公众号:数量技术宅,也可添加技术宅个人微信号:sljsz01,与我交流. 对于币圈量化老司机来说,相信或多或少都有接触过ccxt这个接口,ccxt为我们提供了多交易所统一的标准格 ...
stm32f103 rt-thread fal easyflash移植过程
需求:使用Stm32F103片内Flash进行数据存储硬件平台:Stm32F103C8t6(由于Stm32F103C8t6的Flash标注为64k实际为128K,64KFlash在使用rt-thre ...
遇到 Request header is too large，你是如何解决的？
看到群里有小伙伴问,这个异常要怎么解决: java.lang.IllegalArgumentException: Request header is too large 异常原因根据Exceptio ...
【3rd Party】nlohmann json 基础用法
参考链接:Here 什么是nlohman json ? nlohman json GitHub - nlohmann/json: JSON for Modern C++ 是一个为现代C++(C++11 ...

【转帖】纳尼，mysqldump导出的数据居然少了40万？