Segments

执行效果

  • 命令  在 sense 里边执行  GET /abcd/_segments  前边的是索引名称,后边是请求 段信息
  • 说明  索引是面向分片的,是由于索引是由一个或多个分片(以及它的副本)构成,每个分片就是一个物理上的Lucene索引
  • 返回

名词解释

  • 已提交索引段:指那些已经执行了提交命令的段,意味着已经提交到磁盘持久化并且是只读的;
  • 可查询索引段:可供查询使用的索引段;
  • 索引的代:告诉我们索引有多“老”,起初创建的索引段的代为0,接着是1,依次继续;
  • 被标记为已删除的索引数:这些文档会在索引段合并的过程中被删除;

Cache

分类

  • 过滤器缓存
  • 字段数据缓存

哪些场景会使用到缓存

  • 父子索引
  • 切面
  • 基于索引字段的高效排序

过滤器缓存

索引级过滤器缓存

index.cache.filter.type:类型 resident,soft,weak或node(默认值)

index.cache.filter.max_size:存储到缓存中的最大纪录数,默认为-1,应用于指定索引的某个分片的某个索引段上;

index.cache.filter.expire:指定过滤器缓存中记录的过期时间,默认为-1,60m代表60分钟;

节点级别过滤器缓存

应用于给定节点的所有分片,可以利用下边的参数设置缓存的大小:

indices.cache.filter.size:可以使用百分数 1% 占用当前最大堆内存的百分比,也可以设置数字 如 1024mb

移除策略:LRU

字段数据缓存

说明

字段数据缓存在我们涉及到 切面计算 或 基于字段数据排序使用

做法:加载相关字段的全部数据到内存中。

配置

index.fielddata.cache.type:同上

index.fielddata.cache.size:同上

index.fielddata.cache.expire:同上

过滤

上边的索引尤其是字段索引都是es的默认机制,将 切面计算的字段和排序的字段做的默认的fielddata索引,

现在我们选择性的将一些字段数据缓存做一个定制化

这样做的好处是:将一些低频词项甚至是错误的词从字段缓存中删除,降低字段缓存的总量;

基于词频和正则表达式过滤

只加载那些词频高于指定最小值且低于指定最大值的词项,词项的范围是针对索引段的。

 {
...
properties:{
"field":{
"type":"string",
"index":"not_anlyzed",
"fielddata":{
"filter":{
"frequency":{
"min":0.01, 词项出现频率大于1%
"max":0.4, 词项出现频率小于40%
"min_segment_size":100 该索引段至少要有100个文档
},
“regex”:"^#.*" 词项必须以#开头
}
}
}
}
} 只有符合以上过滤条件的 词项 才会被缓存

清除缓存

  • 清除全部缓存      _cache/clear
  • 清除指定缓存      index/_cache/clear
  • 清除指定类型缓存     index/_cache/clear?filter=true&field_data=false&bloom=true   清除索引的filter缓存和bloom缓存,保留fielddata字段数据缓存
  • 清除指定字段缓存     index/_cache/clear?fields=title,price  清除字段为field和price的全部缓存

问题

  1. filtercache是如何存储和获取的?
  2. fielddatacache是如何存储和获取的?
  3. segments的创建和merge机制是怎样的?

segments&cache的更多相关文章

  1. Erlang 虚拟机内的内存管理(Lukas Larsson演讲听写稿)

    Erlang核心开发者Lukas Larsson在2014年3月份Erlang Factory上的一个演讲详细介绍了Erlang内存体系的原理以及调优案例: http://www.erlang-fac ...

  2. Java中的注解是如何工作的?--annotation学习一

    自Java5.0版本引入注解之后,它就成为了Java平台中非常重要的一部分.开发过程中,我们也时常在应用代码中会看到诸如@Override,@Deprecated这样的注解.这篇文章中,我将向大家讲述 ...

  3. Elasticsearch 通关教程(七): Elasticsearch 的性能优化

    硬件选择 Elasticsearch(后文简称 ES)的基础是 Lucene,所有的索引和文档数据是存储在本地的磁盘中,具体的路径可在 ES 的配置文件../config/elasticsearch. ...

  4. BUFFER CACHE之主要的等待事件

    原因:资源紧张,等待其释放. 原因的原因:1. lgwr和DBWn进程写太慢:2. Buffer和latch不可用 原因的原因的原因:全表扫描.library cache latches数太多等. 视 ...

  5. Linux内存中的Cache真的能被回收么?

    在Linux系统中,我们经常用free命令来查看系统内存的使用状态.在一个RHEL6的系统上,free命令的显示内容大概是这样一个状态: [root@tencent64 ~]# free       ...

  6. guava cache使用和源码分析

    guava cache的优点和使用场景,用来判断业务中是否适合使用此缓存 介绍常用的方法,并给出示例,作为使用的参考 深入解读源码. guava简介 guava cache是一个本地缓存.有以下优点: ...

  7. nginx cache的玩法

      一.简介 Nginx版本从0.7.48开始,支持了类似Squid的缓存功能.这个缓存是把URL及相关组合当做Key,用Md5算法对Key进行哈希,得到硬盘上对应的哈希目录路径,从而将缓存内容保存在 ...

  8. 【转载】row cache lock

    转自:http://blog.itpub.net/26736162/viewspace-2139754/   定位的办法: --查询row cache lock等待 select event,p1   ...

  9. Google guava cache源码解析1--构建缓存器(3)

    此文已由作者赵计刚授权网易云社区发布. 欢迎访问网易云社区,了解更多网易技术产品运营经验. 下面介绍在LocalCache(CacheBuilder, CacheLoader)中调用的一些方法: Ca ...

随机推荐

  1. C# ~ 从 委托事件 到 观察者模式 - Observer

    委托和事件的部分基础知识可参见 C#/.NET 基础学习 之 [委托-事件] 部分: 参考 [1]. 初识事件 到 自定义事件: [2]. 从类型不安全的委托 到 类型安全的事件: [3]. 函数指针 ...

  2. HTTP文件断点续传的原理

    前几天一个同事跑过来找我说,我们在广告素材视频这块想做断点续传,就是这次某个视频缓存到一半,下次不用重头开始,可以在原来停留得位置开始继续下载.以提供更好的用户体验. 同时说需要我们支持吐素材地址的业 ...

  3. 浅谈web网站架构演变过程

    前言 我们以javaweb为例,来搭建一个简单的电商系统,看看这个系统可以如何一步步演变.   该系统具备的功能:   用户模块:用户注册和管理 商品模块:商品展示和管理 交易模块:创建交易和管理 阶 ...

  4. JS进阶之原型

    之前有在自己的文章中谈到对象,而说到对象我们就不可避免的要扯到原型,并且原型也是我们必须得理解到位的一个点,那接下来我们就来聊一聊js的原型吧. JS中一切皆为对象,那么原型也是一种对象.所以它有对象 ...

  5. 速战速决 (5) - PHP: 动态地创建属性和方法, 对象的复制, 对象的比较, 加载指定的文件, 自动加载类文件, 命名空间

    [源码下载] 速战速决 (5) - PHP: 动态地创建属性和方法, 对象的复制, 对象的比较, 加载指定的文件, 自动加载类文件, 命名空间 作者:webabcd 介绍速战速决 之 PHP 动态地创 ...

  6. swift变量和函数

    func getNums()->(Int,Int){ //swift函数可以返回多个变量 ,) } let (a,b) = getNums() //let是常量,一旦赋值后不可改变, var是变 ...

  7. Java并发编程:Thread类的使用

    Java并发编程:Thread类的使用 在前面2篇文章分别讲到了线程和进程的由来.以及如何在Java中怎么创建线程和进程.今天我们来学习一下Thread类,在学习Thread类之前,先介绍与线程相关知 ...

  8. MongoDB基础入门001--安装

    关于mongodb的好处,优点之类的这里就不说了,唯一要讲的一点就是mongodb中有三元素:数据库,集合,文档,其中"集合" 就是对应关系数据库中的"表",& ...

  9. Spring(一)

    一. spring是什么? 我们知道struts 是 web 框架 (jsp/action/actionfrom).hibernate 是 orm框架,处于持久层. spring 是容器框架,用于配置 ...

  10. js 循环li添加点击事件 (闭包的应用)

    var aLi = document.querySelectorAll('.article-tab li');  for (var i = 0; i <= aLi.length; i++) {  ...