前言:

无论使用哪种存储软件,定期的备份数据都是重中之重,在使用ElasticSearch的时候,随着数据日益积累,存放es数据的磁盘空间也捉襟见肘,

此时对于业务功能使用不到的索引数据,又不能直接删除,将它迁移到线下数据盘存储就变得十分必要。

下面就记录一下在docker中部署的单节点以月份索引的es数据的备份和迁移过程。

一:docker安装ES

1:docker的安装:Docker-常用基建的安装与部署

2:下载es镜像:

docker pull elasticsearch:5.6.8

3:elasticsearch.yml 配置:

http.host: 0.0.0.0

# Uncomment the following lines for a production cluster deployment
#transport.host: 0.0.0.0
#discovery.zen.minimum_master_nodes: 1
cluster.name: "elasticsearch"
http.cors.enabled: true
http.cors.allow-origin: "*"
path.repo: ["/usr/share/elasticsearch/backup"]

4:创建es容器

docker run -d --name es -p 9200:9200 -p 9300:9300
  --net docker_default --ip 172.18.0.40
  --memory-swappiness=0
  -v /root/data/docker/es/data:/usr/share/elasticsearch/data
  -v /root/data/docker/es/conf/elasticsearch.yml:/usr/share/elasticsearch/config/elasticsearch.yml
  -v /root/data/docker/es/logs:/user/share/elasticsearch/logs
  -v /root/data/docker/es/backup:/usr/share/elasticsearch/backup
  -e "discovery.type=single-node"
  --restart=always elasticsearch:5.6.8

上面三步简单的创建完一个可用的es容器,接下来就用它来测试es的快照功能。

二:快照索引

snapshot API 是ES备份、迁移数据的重要手段。它支持增量备份,支持多种类型的仓库存储。

ES的备份过程是"智能"的。你对一个索引的第一个快照会是这个索引的完整拷贝,但是所有后续的快照会保留的是已存快照和新数据之间的差异。

随着你不时的对相同索引进行快照,备份也在增量的添加和删除。这意味着后续备份会相当快速,因为它们只传输很小的数据量。

备份路径通过配置: path.repo: ["/usr/share/elasticsearch/backup"] ,注意该路径是es容器内部的,

所以我们在创建es容器时,可以通过 -v /宿主机目录:/容器目录,将宿主机目录挂载到容器内部。

1:创建一个备份仓库:my_backup

curl -XPUT 127.0.0.1:9200/_snapshot/my_backup -d '{
"type": "fs",
"settings": {
"location": "/usr/share/elasticsearch/backup/my_backup"
}
}'

共享文件系统支持的配置如下图:

如果报错:[my_backup] failed to create repository, 执行:chmod 777 /root/data/docker/es/backup

2:开始备份指定索引(close状态的索引不可以执行快照),以 nova-202102 为例:

curl -XPUT 127.0.0.1:9200/_snapshot/my_backup/nova-202102?wait_for_completion=true -d '{
"indices": "nova-202102"
}'

如果索引文件较大,可以去掉wait_for_completion=true,该命令会后台执行备份。

如果备份是后台执行的,下面命令可以查询备份的状态 
curl -XGET 127.0.0.1:9200/_snapshot/my_backup/nova-202102/_status

状态值有:
INITIALIZING 分片在检查集群状态看看自己是否可以被快照。这个一般是非常快的。
STARTED 数据正在被传输到仓库。
FINALIZING 数据传输完成;分片现在在发送快照元数据。
DONE 快照完成!
FAILED 快照处理的时候碰到了错误,这个分片/索引/快照不可能完成了。检查你的日志获取更多信息。

# 取消正在备份的索引
curl -XDELETE 127.0.0.1:9200/_snapshot/my_backup/nova-202102
3:查询已经备份完成的索引
curl -XGET 127.0.0.1:9200/_snapshot/my_backup/nova-202102

三:快照恢复

要恢复一个快照,该索引必须是关闭状态或者已经被删除。

curl -XPOST 127.0.0.1:9200/_snapshot/my_backup/nova-202102/_restore

监控快照恢复状态

curl -XGET 127.0.0.1:9200/restored_nova-202102/_recovery

恢复过程是基于ES标准恢复机制的,因此标准的恢复监控服务可以用来监视恢复的状态。

当执行集群恢复操作时通常会进入Red状态,这是因为恢复操作是从索引的主分片开始的,在此期间主分片状态变为不可用,因此集群状态表现为Red。

一旦ES主分片恢复完成,整个集群的状态将被转换成Yellow,并且开始创建所需数量的副分片。一旦创建了所有必需的副分片,集群转换到Green状态。

四:参考文献

1:Elasticsearch: 权威指南

2:Elasticsearch源码解析与优化实战

你的ES数据备份了吗?的更多相关文章

  1. ES数据备份到HDFS

    1.准备好HDFS(这里我是本机测试) 2.es 安装repository-hdfs插件 (如es为多节点需在每个节点都安装插件) elasticsearch-plugin install repos ...

  2. elasticsearch 数据备份

    ES数据备份找了一些方法,发现elasticdump 这个工具不错 elasticdump --input=http://192.168.0.92:9200/hs2840 --output ./hs2 ...

  3. ELK数据迁移,ES快照备份迁移

    通过curl命令或者kibana快照备份,恢复的方式进行数据迁移 环境介绍 之前创建的ELK 因为VPC环境的问题,需要对ELK从新部署,但是还需要保留现有的数据,于是便有了这篇文档. 10.0.20 ...

  4. elasticsearch数据备份与sshfs建立共享文件

    1.背景: 最近公司为了适应业务的发展,利用elasticsearch搜索引擎搭建了两个节点.为了防止数据丢失的特殊情况,需要定时做数据备份,而由于elasticsearch为两个节点分别在不同的服务 ...

  5. elasticsearch数据备份还原

    elasticsearch数据备份还原 1.在浏览器中运行http://XXX.XXX.XXX.XXX:9200/_flush,确保索引数据能保存到硬盘中. 2.原数据的备份.主要是elasticse ...

  6. es snapshot备份到hdfs及从hdfs恢复snapshot

    snapshot可以将es整个集群,具体索引数据备份到磁盘,hdfs等.需要时,可以从磁盘,hdfs恢复数据到es. 具体参考: https://elasticsearch.cn/article/61 ...

  7. ElasticSearch 集群 & 数据备份 & 优化

    ElasticSearch 集群相关概念 ES 集群颜色状态 ①. - 红色:数据都不完整 ②. - 黄色:数据完整,但是副本有问题 ③. - 绿色:数据和副本全都没有问题 ES 集群节点类型 ①. ...

  8. 实际使用Elasticdump工具对Elasticsearch集群进行数据备份和数据还原

    文/朱季谦 目录 一.Elasticdump工具介绍 二.Elasticdump工具安装 三.Elasticdump工具使用 最近在开发当中做了一些涉及到Elasticsearch映射结构及数据导出导 ...

  9. 数据备份的OSS接口

    最近在做一个新的项目,从RDS备份到OSS,进行数据备份以及后续的还原.这边对阿里云的OSS数据上传接口进行说明,先做下笔记先简单介绍下OSS: ①Object 在OSS中,用户操作的基本数据单元是O ...

随机推荐

  1. 14 Nginx访问日志自动按天切割

    #!/bin/bash export PATH=/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/root/bin LOG_DIR=/usr/loc ...

  2. 阿里P7大佬带你解密Sentinel

    概述 在接连写了两篇关于限流的文章(<面试补习>- 你来说说什么是限流?, 限流神器Sentinel,不了解一下吗?)后,总感觉还差最后一点内容来闭环整个限流相关的内容,这两天在翻查相关文 ...

  3. idea debug无法启动 Error running 'Tomcat8': Unable to open debugger port (127.0.0.1:50168): java.net.SocketException "socket closed

    在日志里显示在 event log 里的 Error running 'server_web': Address localhost:1099 is already in use 显示1099单口已被 ...

  4. MySQL主从异常恢复

    说明 MySQL主从出现不同步的情况时,或者要添加新的从库时,可以使用以下方法进行操作回复主从. 停止业务应用 停止所有连接到主从库上的应用,在恢复主从期间禁止任何增删改等操作,否则恢复失败 停止主从 ...

  5. Linux | Linux常用指令学习笔记

    @ 目录 前言 1. Linux目录结构: 2. 运行级别: init.systemctl 3. vim相关快捷键: 4. 开关机相关命令: shutdowm.halt.reboot.sync.log ...

  6. Nginx配置中的log_format用法梳理 (转)

      nginx服务器日志相关指令主要有两条,一条是log_format,用来设置日志格式,另外一条是access_log,用来指定日志文件的存放路径.格式和缓存大小,一般在nginx的配置文件中日记配 ...

  7. 《TCP/IP详解 卷1:协议》第4章 ARP:地址解析协议

    4.1 引言 本章我们要讨论的问题是只对TCP/IP协议簇有意义的IP地址.数据链路如以太网或令牌环网都有自己的寻址机制(常常为48 bit地址),这是使用数据链路的任何网络层都必须遵从的.一个网络如 ...

  8. JMeter之BeanShell常用内置对象

    一.什么是Bean Shell BeanShell是一种完全符合Java语法规范的脚本语言,并且又拥有自己的一些语法和方法; BeanShell是一种松散类型的脚本语言(这点和JS类似); BeanS ...

  9. 机器学习Sklearn系列:(四)朴素贝叶斯

    3--朴素贝叶斯 原理 朴素贝叶斯本质上就是通过贝叶斯公式来对得到类别概率,但区别于通常的贝叶斯公式,朴素贝叶斯有一个默认条件,就是特征之间条件独立. 条件概率公式: \[P(B|A) = \frac ...

  10. Spring MVC中的M V C

    M→Model 模型 V→View 视图 C→Controller 控制器 也就是说一次交互由生到死(请求到相应) 需要经过 这三个层级 来完成 那么为什么这么设计 这么设计又有什么好处 我是这么认为 ...