【分布式搜索引擎】Elasticsearch如何部署以及优化查询性能

一、Elasticsearch生产集群如何部署

（1）es生产集群部署5台机器，若每台机器是6核64G的，那么集群总内存是320G

（2）假如我们es集群的日增量数据大概是2000万条，每天日增量数据大概是500MB，每月增量数据大概是6亿，15G。若系统已经运行了几个月，那么es集群里数据总量大概是100G左右。

（3）建有5个索引（这个结合自己业务来，看看自己有哪些数据可以放es的），每个索引的数据量大概是20G，所以这个数据量之内，每个索引可以分配8个shard，比默认的5个shard多了3个shard

二、Elasticsearch如何优化查询性能

1）Elasticsearch查询慢的原因

　　当我们往es里写的数据时，实际上都写到磁盘文件里去了，磁盘文件里的数据操作系统会自动将里面的数据缓存到os cache中。

　　那么当我们的数据量特别大的时候，比如上面的部署场景，5台机器总内存是320G，但是我们存储了3200G的数据，那么最多就十分之一的数据能存入内存。那么大部分查询肯定很慢。

　　走磁盘一般肯定上秒，搜索性能绝对是秒级别的，1秒，5秒，10秒。但是如果是走filesystem cache，是走纯内存的，那么一般来说性能比走磁盘要高一个数量级，基本上就是毫秒级的，从几毫秒到几百毫秒不等

2）如何优化呢？

　　es的搜索引擎严重依赖于底层的filesystem cache，你如果给filesystem cache更多的内存，尽量让内存可以容纳所有的indx segment file索引数据文件，那么你搜索的时候就基本都是走内存的，性能会非常高。
　　还是拿上面的部署场景举例，5台机器总内存是320G，假如分配给JVM或其他的总内存占100G，那么我们还有220G内存可以用来缓存Elasticsearch查询数据。若我们能够保证往Elasticsearch中存储的数据不超过220G，也就是保证所有数据都能走缓存，那么查询效率肯定很高。
　　如果我们的存储数据要超过220G了，怎么办？通过加机器吧。。。

【分布式搜索引擎】Elasticsearch如何部署以及优化查询性能的更多相关文章

分布式搜索引擎Elasticsearch在CentOS7中的安装
1. 概述随着企业业务量的不断增大,业务数据随之增加,传统的基于关系型数据库的搜索已经不能满足需要. 在关系型数据库中搜索,只能支持简单的关键字搜索,做不到分词和统计的功能,而且当单表数据量到达上百 ...
Redis 优化查询性能
一次使用 Redis 优化查询性能的实践应用背景有一个应用需要上传一组ID到服务器来查询这些ID所对应的数据,数据库中存储的数据量是7千万,每次上传的ID数量一般都是几百至上千数量级别. 以前 ...
一次使用 Redis 优化查询性能的实践
因为我的个人网站 restran.net 已经启用,博客园的内容已经不再更新.请访问我的个人网站获取这篇文章的最新内容,一次使用 Redis 优化查询性能的实践应用背景有一个应用需要上传一组ID到 ...
分布式搜索引擎Elasticsearch的架构分析
一.写在前面 ES(Elasticsearch下文统一称为ES)越来越多的企业在业务场景是使用ES存储自己的非结构化数据,例如电商业务实现商品站内搜索,数据指标分析,日志分析等,ES作为传统关系型数据 ...
使用Spring Ehcache二级缓存优化查询性能
最近在对系统进行优化的时候,发现有些查询查询效率比较慢,耗时比较长, 通过压测发现,主要耗费的性能消耗在查询数据库,查询redis 数据库:连接池有限,且单个查询不能消耗大量的连接池,占用大量IO ...
最新IP数据库存储优化查询性能优化每秒解析上千万
高性能IP数据库格式详解每秒解析1000多万ip qqzeng-ip-ultimate.dat 3.0版编码:UTF8 字节序:Little-Endian 返回规范字段(如:亚洲|中国| ...
分布式搜索引擎Elasticsearch性能优化与配置
1.内存优化在bin/elasticsearch.in.sh中进行配置修改配置项为尽量大的内存: ES_MIN_MEM=8g ES_MAX_MEM=8g 两者最好改成一样的,否则容易引发长时间GC ...
分布式搜索引擎Elasticsearch的查询与过滤
一.写入先来一个简单的官方例子,插入的参数为-XPUT,插入一条记录. curl -XPUT 'http://localhost:9200/test/users/1' -d '{ "use ...
002_分布式搜索引擎Elasticsearch的查询与过滤
一.写入先来一个简单的官方例子,插入的参数为-XPUT,插入一条记录. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 curl -XPUT 'http:/ ...

随机推荐

spring 总结
控制反转(Inversion of Control) 依赖注入(Dependency Injection) 一.控制反转 1.控制:传统的方式是由程序创建的,写死的, spring 是由spring管 ...
linux学习：【第3篇】远程连接及软件安装
狂神声明 : 文章均为自己的学习笔记 , 转载一定注明出处 ; 编辑不易 , 防君子不防小人~共勉 ! linux学习:[第3篇]远程连接及软件安装远程连接 xshell , xftp软件官网 : ...
MAC OSX 开启/禁用SafeSleep功能
如果想要禁用,我们需要在终端中输入下面的命令: 然后定位到/private/var/vm/删除已经存在的sleepimage文件 cd /private/var/vm/ 使用下面的命令删除该文件 su ...
使用hashlib进行文件校验
import hashlib import os path = r'D:\CentOS 64 位' def file_md5(path): """ 文件校验 :param ...
sql 范式:1NF、2NF、3NF、BCNF（函数依赖）
第一范式(1NF) 每个属性都是不可分的基本数据项.(必须有主键,列不可分) eg:非第一范式的表:(列可再分) 学院名称高级职称人数教授副教授信电学院 3 34 管理学院 5 23 外语学院 ...
vue-cli脚手架
cnpm i vue-cli -g //npm 安装报错,原因不明,可能是我改过东西的原因,但是cnpm可以安装命令行进入要新建的vue的目录执行 C:\Users\76912\Videos\v ...
python基础(12)-包的导入&异常处理
包的导入几种导入方式 import 包名 import time time.time() import 包名,包名 import time,sys time.time() sys.path from ...
iptables精通
前提基础: 当主机收到一个数据包后,数据包先在内核空间中处理,若发现目的地址是自身,则传到用户空间中交给对应的应用程序处理,若发现目的不是自身,则会将包丢弃或进行转发. iptables实现防火墙功能 ...
NOIP2009（codevs1173）最优贸易
题目大意:给你一张有n个点m条边的有向图,每个点有一个权值,求一条1到n的路径,使得这条路径上存在两个点且他们的权值差最大. 思路:用dis[i]]记录从1到i的路径中所能得到两点间权值差的最大值,然 ...
2017.11.10 重读C++ Primer
第二章变量和变量类型 1. C++ 算数类型 bool 布尔最小尺寸未定义 char 字符 8位 wchar_t ...

【分布式搜索引擎】Elasticsearch如何部署以及优化查询性能

【分布式搜索引擎】Elasticsearch如何部署以及优化查询性能的更多相关文章

随机推荐

热门专题