es数据恢复杂记】的更多相关文章

kill -9或者断电等原因异常,es在重启后,会通过translog来进行数据恢复. 默认的恢复速度是较慢的,可以设置indices.recovery.current_streams:10增大恢复的线程数,还可以设置indices.recovery的其他参数加快恢复的速度. 但是某些情况下,如lucene文件格式错误等,重启es后无法通过自身恢复,可以考虑如下的方式. 1.主分片是正常的,副本分片有错误,且无法通过复制机制恢复.可以考虑删除有问题的分片,集群会通过复制的方式恢复. 2.主分片和…
摘自:https://www.easyice.cn/archives/231 elasticsearch indices.recovery 流程分析与速度优化 目录 [隐藏] 主分片恢复流程 副本分片恢复流程 recovery 慢的原因分析 synced flush 机制 副分片如何做到和主分片一致的 提升 recovery 速度的建议 使用 _forcemerge 集群 FullRestart 的建议操作过程 一些用于查看 recovery 状态的命令 问题 参考: 基于版本:5.5.3 re…
Elasticsearch运维经验总结 2018年12月10日 16:38:41 运小白 阅读数 3811   版本说明:5.6.4(要严格注意ES及其插件.第三方工具的版本匹配关系) 系统负载:(日志集群,日均写入10TB,保留7天) 1,出于高可用的考虑,同一个分区的多个副本不会被分配到同一台机器 如下截图所示,Index:queries,设置20副本,5分片.这个集群当前有14个可用数据节点,queries的0分区在这14个数据节点上均有且仅有一个副本,剩余​​的7个副本显示UNASSIG…
文章转载自:https://mp.weixin.qq.com/s/_0RlojDsE30CeDSyLNP44w 1.问题引出 ES中文社区中,有如下问题: 问题1:存储数据,data目录从一个机器直接移到一台新的机器是否可以直接使用? 问题2:es升级时,data目录如果在外部路径,从低版本升级到高版本时,data目录是否直接可以使用? 问题3:将一个旧的es数据(400多G)迁移到新的es中的时候直接将旧es的data目录下indices文件拷贝到新es的data下(大概花了一个晚上),这种做…
郑昀 基于胡耀华和王超的设计文档 最后更新于2014/12/3 关键词:ElasticSearch.Lucene.solr.搜索.facet.高可用.可伸缩.mongodb.SearchHub.商品中心 本文档适用人员:研发和运维 提纲: 曾经的基于MongoDB的筛选+排序解决方案 MongoDB方案的缺陷 看中了搜索引擎的facet特性 看中了ES的简洁 看中了ES的天生分布式设计 窝窝的ES方案 ES的几次事故和教训 ES自身存在的问题   首先要感谢王超和胡耀华两位研发经理以严谨治学的研…
es有很多特性,分布式.副本集.负载均衡.容灾等. 我们先搭建一个很简单的分布式集群(伪),在同一机器上配置三个es,配置分别如下: cluster.name: foxCluster node.name: "fox" cluster.name: foxCluster node.name: "fox2" transport.tcp.port: 9302 http.port: 9202 cluster.name: foxCluster node.name: "…
cluster代表一个集群,集群中有多个节点,其中有一个为主节点,这个主节点是可以通过选举产生的,主从节点是对于集群内部来说的.es的一个概念就是去中心化,字面上理解就是无中心节点,这是对于集群外部来说的,因为从外部来看es集群,在逻辑上是个整体,你与任何一个节点的通信和与整个es集群通信是等价的.shards代表索引分片,es可以把一个完整的索引分成多个分片,这样的好处是可以把一个大的索引拆分成多个,分布到不同的节点上.构成分布式搜索.分片的数量只能在索引创建前指定,并且索引创建后不能更改.r…
elasticsearch的config文件夹里面有两个配置文件:elasticsearch.yml和logging.yml,第一个是es的基本配置文件,第二个是日志配置文件,es也是使用log4j来记录日志的,所以logging.yml里的设置按普通log4j配置文件来设置就行了.下面主要讲解下elasticsearch.yml这个文件中可配置的东西. cluster.name: elasticsearch配置es的集群名称,默认是elasticsearch,es会自动发现在同一网段下的es,…
目录 1 Lucene操作document的流程 1.1 添加document的流程 1.2 删除document的流程 2 优化写入流程 - 实现近实时搜索 2.1 流程的改进思路 2.2 设置refresh的间隔 3 优化写入流程 - 实现持久化变更 3.1 文档持久化到磁盘的流程 3.2 基于translog和commit point的数据恢复 4 优化写入流程 - 实现海量segment文件的归并 4.1 存在的问题 4.2 merge操作的流程 4.3 优化merge的配置项 4.4…
目录 1 elasticsearch.yml(ES服务配置) 1.1 Cluster集群配置 1.2 Node节点配置 1.3 Paths路径配置 1.4 Memory内存配置 1.5 Network网络配置 1.6 Discovery节点发现配置 1.7 Gateway网关配置 1.8 Various其他配置 2 jvm.options(JVM参数配置) 3 log4j2.properties(日志配置) 1 elasticsearch.yml(ES服务配置) 文件位置: ${ES_HOME}…