ElasticSearch之Merge

Elasticsearch的shard，即对应Lucene的index。

Lucene的index由多个segment组成。

segment是index保存数据的最小单位，不支持修改。

Elasticsearch在运行过程中，启动后台任务，周期性检测并将占用空间小的segment自动合并至大一些的segment，避免存在过多的segment对象，同时在合并过程中，会剔除掉已删除的记录。

合并操作的过程可能消耗较多的资源，比如CPU和I/O，因此在合并操作运行的过程中，Elasticsearch会自动调整合并操作的吞吐量，优先保证其它业务的正常运行。

Elasticsearch提供了ConcurrentMergeScheduler作为合并操作的调度器，管理合并操作的产生和运行。

ConcurrentMergeScheduler在新的线程中提交合并操作，同时控制合并操作的并发数。当合并操作占用的线程的数量达到index.merge.scheduler.max_thread_count，ConcurrentMergeScheduler将后续待执行的合并操作放至队列中，避免合并操作占用过多的资源，影响其它操作。

相关参数

index.merge.scheduler.max_thread_count

在一个shard上执行merge操作时允许使用的线程的数量。

默认值为Math.max(1, Math.min(4, node.processors / 2))。

修改参数的取值，执行命令如下：

curl -X PUT "https://localhost:9200/_settings?pretty" -H 'Content-Type: application/json' -d'

{

    "index.merge.scheduler.max_thread_count": 2

}

' --cacert $ES_HOME/config/certs/http_ca.crt -u "elastic:ohCxPH=QBE+s5=*lo7F9"

假如当前没有创建index，则报错信息如下：

{

  "error" : {

    "root_cause" : [

      {

        "type" : "index_not_found_exception",

        "reason" : "no such index [[]]",

        "index_uuid" : "_na_",

        "index" : "[]"

      }

    ],

    "type" : "index_not_found_exception",

    "reason" : "no such index [[]]",

    "index_uuid" : "_na_",

    "index" : "[]"

  },

  "status" : 404

}

假如当前已有创建好的index，执行结果的样例，如下：

{

  "acknowledged" : true

}

相关资料

ElasticSearch之Merge的更多相关文章

elasticsearch index 之merge
merge是lucene的底层机制,merge过程会将index中的segment进行合并,生成更大的segment,提高搜索效率.segment是lucene索引的一种存储结构,每个segment都 ...
段合并 segments merge 被删除的文档的删除时间
2.5 段合并每个索引分为多个“写一次,读多次”的段 write once and read many times segments 建立索引时,一个段写入磁盘以后就不能更新:被删除的文档的信息存 ...
记一次Elasticsearch OOM的优化过程——基于segments force merge 和 store type 转为 niofs
首选,说明笔者的机器环境(不结合环境谈解决方案都是耍流氓): cpu 32核,内存128G,非固态硬盘: RAID0 (4T * 6),单节点,数据量在700G到1800G,索引15亿~21亿.敖丙大 ...
Elasticsearch Java 虚拟机配置详解
Elasticsearch对Java虚拟机进行了预先的配置.通常情况下,因为这些配置的选择还是很谨慎的,所以你不需要太关心,并且你能立刻使用ElasticSearch. 但是,当你监视ElasticS ...
ElasticSearch详解与优化设计
简介概念安装部署 ES安装数据索引索引优化内存优化 1简介 ElasticSearch(简称ES)是一个分布式.Restful的搜索及分析服务器,设计用于分布式计算:能够达到实时搜索,稳定, ...
Elasticsearch 的坑爹事——记录一次mapping field修改过程
Elasticsearch 的坑爹事本文记录一次Elasticsearch mapping field修改过程团队使用Elasticsearch做日志的分类检索分析服务,使用了类似如下的_mapp ...
elasticsearch运维实战之2 - 系统性能调优
elasticsearch性能调优集群规划独立的master节点,不存储数据, 数量不少于2 数据节点(Data Node) 查询节点(Query Node),起到负载均衡的作用 Linux系统参 ...
(转)ElasticSearch学习
ElasticSearch是一个基于Lucene构建的开源,分布式,RESTful搜索引擎.设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便.支持通过HTTP使用JSON进行数据索引 ...
ElasticSearch已经配置好ik分词和mmseg分词(转)
ElasticSearch是一个基于Lucene构建的开源,分布式,RESTful搜索引擎.设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便.支持通过HTTP使用JSON进行数据索引 ...
elasticsearch基础
elastic使用lucene建立索引的步骤中,需要文件系统缓存需要同步到磁盘上.(多个segment->commit文件来维护) 当建立历史数据时,并不要求太高的实时性时,可以减小(默认1s) ...

随机推荐

小知识：调整OCI实例的时区
之前在随笔中<Linux (RHEL)修改时区> 介绍了时区修改方法. 默认OCI实例中,时区是GMT,在国内用看着这个时区就是很别扭的事情,于是修改时区,实测无需配置 /etc/sysc ...
LVGL双向链表学习笔记
LVGL双向链表学习笔记 1.LVGL链表数据类型分析对于LVGL双向链表的使用,我们需要关注lv_ll.h和lv_ll.c两个文件,其中lv_ll.h里面包含了链表结构类型定义,以及相关API的声 ...
【算法】游戏中的学习，使用c#面向对象特性控制游戏角色移动
最近,小悦的生活像是一首繁忙的交响曲,每天忙得团团转,虽然她的日程安排得满满当当,但她并未感到充实.相反,她很少有时间陪伴家人,这让她感到有些遗憾.在周五的午后,小悦的哥哥突然打来电话,他的声音里充满 ...
漫谈C#的定时执行程序
1.写法1 task的lambda表达式 #region 写法1 task的lambda表达式 //static void Main() //{ // // 创建并启动两个任务 // Task tas ...
VSCode使用JavaScript刷LeetCode配置教程（亲试可以！）
账号秘密都对,但是缺登录不成功的问题诀窍可能是: 在属性设置中把LeetCode版本改成cn.点击LeetCode配置,修改Endpoint配置项,改成leetcode-cn,再次尝试登陆即可. 大 ...
React生命周期函数（迭代合并：react 16.3）
本文分两部分,上面的是react16.3,下部分是老版本 react 16.3生命周期更新解析 ------ 老react版本生命周期 1.组件生命周期的执行次数只执行一次: constructor ...
OpenJDK里的AsmTools简介
前言转自:http://hengyunabc.github.io/openjdk-asmtools/ https://wiki.openjdk.java.net/display/CodeTools/ ...
idea debug jboss 应用遇到到问题记录
idea run Jboss是没有问题的,能启动Jboss成功:但是debug Jboss时,报ERROR: Cannot load this JVM TI agent twice, check yo ...
MongoDB-SQL语法
MongoDB-SQL语法可视化软件:Navicat 1. MongoDB-查询 db.getCollection('表名').find({}); db.getCollection('表名').fi ...
L2-034 口罩发放
重点在阅读理解能力身份证号必须是18位数字,话说平时咱们身份证也可以带个X啥的啊. 合法状态就是只要身份证合格就行,一开始我还想是它犯病,然后申请了口罩才算一个合法记录. 后边输出状态为1的人,一定 ...

ElasticSearch之Merge

ElasticSearch之Merge的更多相关文章

随机推荐

热门专题