elastic优化

通过定义keyword 的 "null_value" :"NULL",使得搜索是不用单独使用exists查询。统一用terms查询就能查询到想要的结果
利用constantScore和filter查询，跳过算分的步骤，提高性能
设置"index" :false 对于不用作为查询条件的字段，增加写的性能
设置"enable":false，对于不需要检索，排序和聚合的字段
设置 "norms":false，对于不需要算分的字段
设置"doc_values" :false 对于不用排序和聚合的字段，增加写的性能
设置聚合的keyword字段，"eager_global_ordinals": true,能够将写入的文档添加到缓存中，增加聚合搜索的性能
为索引增加"_meta"信息，用于识别mapping 的版本，便于管理mapping
查看分片的大小信息，如果每个分片大于20GB，需要扩充主分片数量
单个节点数据控制在2TB以内，最大不超过5TB
- 每个节点每GB堆内存，建议最多20个分片，每个分片控制数据在20-40GB内
- 8GB内存，数据量控制在8*20GB*30G = 4.8TB
- 根据分片确定节点内存大小：给每个字段预留1kb堆空间
分片数 * 所有字段数 * 1kb + 0.5GB（开销空间：索引、搜索、聚合）= 最终单节点ES堆空间大小
对于搜索类的项目，内存和存储数据比例1：16
有复杂的查询和聚合，建议设置coordinating节点
为避免分片分布不均的问题，要提前监控磁盘空间，提前清理数据或增加节点(70%)
使用es自动生成文档的ID，提高refresh interval的时间，默认为1s
控制分词的级别，使用index_options控制。docs、freqs、positions、offsets

elastic优化的更多相关文章

分布式搜索引擎Elasticsearch性能优化与配置
1.内存优化在bin/elasticsearch.in.sh中进行配置修改配置项为尽量大的内存: ES_MIN_MEM=8g ES_MAX_MEM=8g 两者最好改成一样的,否则容易引发长时间GC ...
携程App的网络性能优化实践
首先介绍一下携程App的网络服务架构.由于携程业务众多,开发资源导致无法全部使用Native来实现业务逻辑,因此有相当一部分频道基于Hybrid实现.网络通讯属于基础&业务框架层中基础设施的一 ...
亿级规模的Elasticsearch优化实战
Elasticsearch 的基本信息大致如图所示,这里就不具体介绍了. 本次分享主要包含两个方面的实战经验:索引性能和查询性能. 一. 索引性能(Index Performance) 首先要考虑的是 ...
Heka–>Elasticsearch 索引数据过程的优化
Heka 的参数配置跟Elasticsearch的参数没有关系,Heka只负责按照配置发送数据,所以索引的优化主要在 Elaticsearch端来完成. 下面是Elasticsearch的一些相关概念 ...
elasticsearch 性能优化
#系统默认的最大打开文件数的限制 vi /etc/security/limits.conf * - nproc 50240 * - ...
ES 18 - (底层原理) Elasticsearch写入索引数据的过程以及优化写入过程
目录 1 Lucene操作document的流程 1.1 添加document的流程 1.2 删除document的流程 2 优化写入流程 - 实现近实时搜索 2.1 流程的改进思路 2.2 设置re ...
ES 集群上，业务单点如何优化升级？
摘要: 原创出处 https://www.bysocket.com 「公众号:泥瓦匠BYSocket 」欢迎关注和转载,保留摘要,谢谢! ES 基础 ES 集群 ES 集群上业务优化一.ES 基础 ...
Elastic Stack-Elasticsearch使用介绍(五)
一.前言前4篇将Elasticsearch用法的API和原理方面东西介绍了一下,相信大家对Elasticsearch有了一定的认知,接下我们主要从索引的建立到后期的一些优化做一些介绍: 二. ...
ElasticSearch CPU和内存占用高的优化记录
公司最近使用ElasticSearch作为数据报表汇总引擎.上线三个月累计数据800万,但是今天突然大面积出现查询超时,上服务器查看服务运行情况,发现cpu使用率高达300% mem 使用率也到了90 ...
ES优化
1.内存优化在bin/elasticsearch.in.sh中进行配置修改配置项为尽量大的内存: 1 2 ES_MIN_MEM=8g ES_MAX_MEM=8g 两者最好改成一样的,否则容易引发长 ...

随机推荐

dedebiz发布文章自动提交到百度搜索的方法
修改程序文件依次打开/admin/article_add.php和article_edit.php 找到ClearMyAddon($id, $title); 在其上面加入 //自动提交到百度 els ...
Solution -「SP 106」BINSTIRL
Description Link. 求 $\begin{Bmatrix}n \\ m\end{Bmatrix}\bmod2$ Solution 求 \[\begin{aligned} \begin ...
Redis系列之——Redis-Cluster
文章目录一 Redis Cluser介绍背景 1.1问题 1.2 解决二数据分布(分布式数据库) 2.1 存在问题 2.2 分区方式 2.2.1 顺序分区 2.2.2 哈希分区 2.2.2 .1 ...
.Net7自定义GC垃圾回收器
1.前言 CLR和GC高度耦合,.Net7里面分离CLR和GC,则比较容易实现这件事情.本篇来看下,自定义一个GC垃圾回收器. 2.概述这里首先演示下自定义GC垃圾回收后的效果. 1.下载Custo ...
Welcome to the Android Open Source Project!
Android is an open-source software stack for a wide range of mobile devices and a corresponding open ...
CF276C
题目简化和分析: 属于一种贪心思维,我们想如果要使得和最大,那么就必须保证最大的数乘的次数越多越好,并且排序没有限制,快速累加每个位置出现的次数,所以应该使用线段树差分. 然后排序最大乘最大累加. S ...
题解 hdu 1269 迷宫城堡
找点图论练习题写,发现hdu又寄了,那就发到blog里吧. 思路:tarjan缩点判断DAG中点数是否为1.若是,则该图为强连通图. //produced by miya555 //stupid mi ...
docker入门加实战—部署Java和前端项目
docker入门加实战-部署Java和前端项目部署之前,先删除nginx,和自己创建的dd两个容器: docker rm -f nginx dd 部署Java项目作为演示,我们的Java项目比较简 ...
Quartus 入门
转载请标明出处:https://www.cnblogs.com/leedsgarden/p/17790320.html 本文介绍的是Quartus的免费版,可以满足基本的教学需要如果你用的是Xili ...
04-23: dataclasses使用方法
vehicle_seeds: List[int] = dataclasses.field(default_factory=list) dataclasses 模块提供了一种简洁的方式来定义Python ...

elastic优化

elastic优化的更多相关文章

随机推荐

热门专题