influxdb 备份与恢复

环境:

influxdb v1.6.0
使用influx自动的控制台进行

I. 备份

备份命令

influxd backup

    [ -database <db_name> ]  --> 指定需要备份的数据库名

    [ -portable ]            --> 表示在线备份

    [ -host <host:port> ]    --> influxdb服务所在的机器，端口号默认为8088

    [ -retention <rp_name> ] | [ -shard <shard_ID> -retention <rp_name> ]  --> 备份的保留策略，注意shard是挂在rp下的；我们需要备份的就是shard中的数据

    [ -start <timestamp> [ -end <timestamp> ] | -since <timestamp> ]   --> 备份指定时间段的数据

    <path-to-backup>   --> 备份文件的输出地址

1. 实例演示

首先创建一个数据库 yhhblog，里面包含两个measurement，对应的数据如下

> show databases

name: databases

name

----

_internal

yhhblog

> use yhhblog

Using database yhhblog

> show measurements

name: measurements

name

----

netLoad

serviceLoad

> select * from netLoad

name: netLoad

time                host      netIn netOut service

----                ----      ----- ------ -------

1532658769048100401 127.0.0.1 13m   521K   app.service.about

> select * from serviceLoad

name: serviceLoad

time                cpu   host      load mem   qps  rt   service

----                ---   ----      ---- ---   ---  --   -------

1532658713805369067 45.23 127.0.0.2 1.21 4145m 1341 1312 app.service.about

1532658718726259226 45.23 127.0.0.1 1.21 4145m 1341 1312 app.service.about

a. 备份所有的数据库

将influxdb中的所有的数据库都备份下来，不加任何的参数

influxd backup -portable /tmp/data/total

b. 备份指定数据库

如果只想要备份上面的yhhblog数据库, 添加 -database 参数指定即可

# influxd backup -portable -database yhhblog /tmp/data/yhhblog

2018/07/27 10:38:15 backing up metastore to /tmp/data/yhhblog/meta.00

2018/07/27 10:38:15 backing up db=yhhblog

2018/07/27 10:38:15 backing up db=yhhblog rp=autogen shard=10 to /tmp/data/yhhblog/yhhblog.autogen.00010.00 since 0001-01-01T00:00:00Z

2018/07/27 10:38:15 backup complete:

2018/07/27 10:38:15 	/tmp/data/yhhblog/20180727T023815Z.meta

2018/07/27 10:38:15 	/tmp/data/yhhblog/20180727T023815Z.s10.tar.gz

2018/07/27 10:38:15 	/tmp/data/yhhblog/20180727T023815Z.manifest

c. 备份数据库中指定时间段的数据

对上面的数据，只备份部分时间满足要求的数据，可以添加start/end参数

# influxd backup -portable -database yhhblog -start 2018-07-27T2:31:57Z -end 2018-07-27T2:32:59Z  /tmp/data/yhhblog_per

2018/07/27 10:42:14 backing up metastore to /tmp/data/yhhblog_per/meta.00

2018/07/27 10:42:14 backing up db=yhhblog

2018/07/27 10:42:14 backing up db=yhhblog rp=autogen shard=10 to /tmp/data/yhhblog_per/yhhblog.autogen.00010.00 with boundaries start=2018-07-27T02:31:57Z, end=2018-07-27T02:32:59Z

2018/07/27 10:42:14 backup complete:

2018/07/27 10:42:14 	/tmp/data/yhhblog_per/20180727T024214Z.meta

2018/07/27 10:42:14 	/tmp/data/yhhblog_per/20180727T024214Z.s10.tar.gz

2018/07/27 10:42:14 	/tmp/data/yhhblog_per/20180727T024214Z.manifest

现在备份ok了，问题就是如何确认备份的问题有没有问题呢，备份后的数据如何恢复呢？

II. 恢复

命令如下

influxd restore

    [ -db <db_name> ]       --> 待恢复的数据库(备份中的数据库名)

    -portable | -online

    [ -host <host:port> ]    --> influxdb 的服务器

    [ -newdb <newdb_name> ]  --> 恢复到influxdb中的数据库名

    [ -rp <rp_name> ]        --> 备份中的保留策略

    [ -newrp <newrp_name> ]  --> 恢复的保留策略

    [ -shard <shard_ID> ]

    <path-to-backup-files>

首先拿简单的方式来演示恢复策略，并查看下上面的备份数据是否有问题

1. 恢复到不存在的database

下面演示下将前面的导出的备份，恢复到一个新的数据库 yhhblog_bk上，执行命令如下

influxd restore -portable -db yhhblog -newdb yhhblog_bk yhhblog_per

顺带验证下上面备份的数据是否有问题，注意到我们恢复的是时间片段的数据备份，因此恢复的数据，应该会排除掉不再上面日期内的数据

> show databases

name: databases

name

----

_internal

yhhblog

yhhblog_bk

> use yhhblog_bk

Using database yhhblog_bk

> show measurements

name: measurements

name

----

netLoad

serviceLoad

> select * from netLoad

name: netLoad

time                host      netIn netOut service

----                ----      ----- ------ -------

1532658769048100401 127.0.0.1 13m   521K   app.service.about

> select * from serviceLoad

name: serviceLoad

time                cpu   host      load mem   qps  rt   service

----                ---   ----      ---- ---   ---  --   -------

1532658718726259226 45.23 127.0.0.1 1.21 4145m 1341 1312 app.service.about

注意看前面serviceLoad里面只有一条数据, 即表明我们按照时间进行备份没啥问题

2. 恢复到存在的DB

看官网恢复的文档中，如果想将备份恢复到一个已经存在的database中时，并不是上面那么简单的就可以了，这里采用的一个策略是西安备份到一个临时的db中；然后将临时DB中的数据写入已存在的db中

具体的演示步骤如下（注意本小结的执行可以直接依赖前面恢复的备份数据库中）

将备份恢复到已经存在的数据库 yhhblogNew 中

# 首先是将备份恢复到一个不存在的数据库 yhhblog_bk 中

influxd restore -portable -db yhhblog -newdb yhhblog_bk yhhblog_per

进入 influx 控制台，执行拷贝和删除临时数据库

# 准备 yhhblogNew 数据库

> create database yhhblogNew

# 将临时数据库中的数据导入已存在的数据库中

> use yhhblog_bk

> SELECT * INTO yhhblogNew..:MEASUREMENT FROM /.*/ GROUP BY *

> drop yhhblog_bk

3. 保留策略已存在时，恢复

influxd restore -portable -db yhhblog -newdb yhhblog_tmp -rp autogen -newrp autogen_tmp  yhhblog

进入influx控制台，执行拷贝

> user yhhblog_tmp

> SELECT * INTO yhhblogNew.autogen.:MEASUREMENT FROM /yhhblog_tmp.autogen_tmp.*/ GROUP BY *

> drop database yhhblog_tmp

4. 其他

官方还写了其他两种恢复方式，一个被废弃，一个离线的会导致数据丢失，也不推荐使用，而现在大部分的博文中备份和恢复都是这种过时的方案，不太友好，这里不详细叙述

III. 其他

1. 一灰灰Blog： https://liuyueyi.github.io/hexblog

一灰灰的个人博客，记录所有学习和工作中的博文，欢迎大家前去逛逛

2. 声明

尽信书则不如，已上内容，纯属一家之言，因个人能力有限，难免有疏漏和错误之处，如发现bug或者有更好的建议，欢迎批评指正，不吝感激

微博地址: 小灰灰Blog
QQ：一灰灰/3302797840

3. 扫描关注

小灰灰Blog&公众号

知识星球

180727-时序数据库InfluxDB之备份和恢复策略的更多相关文章

InfluxDB数据备份和恢复方法，支持本地和远程备份
本文属于<InfluxDB系列教程>文章系列,该系列共包括以下 17 部分: InfluxDB学习之InfluxDB的基本概念 InfluxDB学习之InfluxDB的基本操作 Influ ...
时序数据库InfluxDB安装及使用
时序数据库InfluxDB安装及使用 1 安装配置安装 wget https://dl.influxdata.com/influxdb/releases/influxdb-1.3.1.x86_64. ...
分布式时序数据库InfluxDB
我们内部的监控系统用到分布式时序数据库InfluxDB http://www.ttlsa.com/monitor-safe/monitor/distributed-time-series-databa ...
时序数据库InfluxDB
在系统服务部署过后,线上运行服务的稳定性是系统好坏的重要体现,监控系统状态至关重要,经过调研了解,时序数据库influxDB在此方面表现优异. influxDB介绍时间序列数据是以时间字段为每行数据 ...
时序数据库InfluxDB（I）- 搭建与采集信息demo操作
搭建环境:vmware workstation pro15.5.0, ubuntu18.04.3 实践时间:2019.10.12-10.27 (一)时序数据库InfluxDB准备 (1)安装曾出现问 ...
[Go] 时序数据库influxdb的安装
日志类的数据时候存储在时序数据库中,下面就是时序数据库influxdb的安装 curl -sL https://repos.influxdata.com/influxdb.key | apt-key ...
数据库通过sql备份脚本恢复时，报错误The user specified as a definer ('root'@'%') does not exist
数据库通过sql备份脚本恢复时,报错误The user specified as a definer ('root'@'%') does not exist 当出现这个错误,意思是某个数据库对象的定义 ...
Spring Boot中使用时序数据库InfluxDB
除了最常用的关系数据库和缓存之外,之前我们已经介绍了在Spring Boot中如何配置和使用MongoDB.LDAP这些存储的案例.接下来,我们继续介绍另一种特殊的数据库:时序数据库InfluxDB在 ...
简析时序数据库 InfluxDB
时序数据基础时序数据特点时序数据TimeSeries是一连串随时间推移而发生变化的相关事件. 以下图的 CPU 监控数据为例,同个 IP 的相关监控数据组成了一条时序数据,不相关数据则分布在不同的 ...

随机推荐

lwip IP address handling 关于 IP 地址的操作 API接口
lwip 2.0.3 IP address handling /** * @file * IP address API (common IPv4 and IPv6) */ 1.u32_t ipadd ...
webapi 异常处理
参考:https://docs.microsoft.com/zh-cn/aspnet/web-api/overview/error-handling/exception-handling ①HttpR ...
CentOS7开发环境搭建
BIOS开启VT支持查询笔记本进入BIOS的按键,启动BIOS的虚拟化设置假设安装360卫士,那么请永久关闭Intel-VT核晶防护引擎 CentOS DNS配置 Linux 下设置DNS位置有3 ...
wordpress安装(ubuntu+nginx+php+mariadb)
一. 环境 ubuntu12.04.4 nginx 1.6.0 mariadb 10.0 更新系统补丁 sudo apt-get update sudo apt-get dist-upgrade ...
Oracle插入（insert into）
Oracle插入(insert into) 转载:http://www.oraclejsq.com/article/010100199.html Oracle对表数据的插入是使用insert命令来执行 ...
iOS 越狱后 SSH 不能连接
10.3 越狱之后,装上 OpenSSH, 但是发现连接不上,一直卡着不动,端口是通的,但是就是一直卡着.解决方法是在 Cydia 添加源 http://apt.cydiaba.cn,搜索 Dropb ...
js的组合函数
1.组合函数即由若干个函数组合成一个新的函数,同时完成数据的传递 1>最简单版本这种方法实现的组合函数,需要我们指定函数的执行顺序 /**第一种方法 */ function add(a, b) ...
T+固定资产二维码管理(生成，打印)
先来几句生硬的开场白. 不知不觉中,二维码慢慢的取代了传统的条码.原因之一就是二维码更加的时尚,原因之二便是二维码可以存储更多的信息.......... 企业的固定资产,直接贴个二维码,然后用手机扫 ...
面试：HashSet怎么判断重复
HashSet是基于HashMap实现的,元素的值存储在key上,value的值所有元素都一样,都是这个 private static final Object PRESENT = new Objec ...
WOT干货大放送：大数据架构发展趋势及探索实践分享
WOT大数据处理技术分会场,PingCAP CTO黄东旭.易观智库CTO郭炜.Mob开发者服务平台技术副总监林荣波.宜信技术研发中心高级架构师王东及商助科技(99Click)顾问总监郑泉五位讲师, ...

180727-时序数据库InfluxDB之备份和恢复策略