Elasticsearch之配置详解
Cluster
集群名称,默认为elasticsearch:
cluster.name: elasticsearch设置一个节点的并发数量,有两种情况,一种是在初始复苏过程中:
cluster.routing.allocation.node_initial_primaries_recoveries: 4
另一种是在添加、删除节点及调整时:cluster.routing.allocation.node_concurrent_recoveries: 2
Node
- 节点名称,es启动时会自动创建节点名称,但你也可进行配置:
node.name: elasticsearch-01 是否允许作为主节点,默认值为true:
node.master: true是否存储数据,即存储索引片段,默认值为true:
node.data: true注意:
master和data同时配置会产生一些奇异的效果:- 当master为false,而data为true时,会对该节点产生严重负荷;
- 当master为true,而data为false时,该节点作为一个协调者;
- 当master为false,data也为false时,该节点就变成了一个负载均衡器。
你可以通过连接http://localhost:9200/_cluster/health或者http://localhost:9200/_cluster/nodes,或者使用插件http://github.com/lukas-vlcek/bigdesk或http://mobz.github.com/elasticsearch-head来查看集群状态。
节点自定义属性,可用于后期集群进行碎片分配时的过滤:
node.rack: rack-01
Index
- 设置一个索引的碎片数量,默认值为5:
index.number_of_shards: 5 - 设置一个索引可被复制的数量,默认值为1:
index.number_of_replicas: 1
当你不需要分布式时,可进行如下设置:
index.number_of_shards: 1
index.number_of_replicas: 0
- 1
- 2
上述两个属性的设置直接影响集群中索引和搜索操作的执行,假设有足够的机器来持有碎片和副本,那么可以按如下规则设置这两个值:
- 拥有更多的碎片可以提升索引执行能力,并允许通过机器分发一个大型的索引;
- 拥有更多的副本能够提升搜索执行能力以及集群能力,但副本增多会降低插入和删除操作的效率。- 对于一个索引来说,number_of_shards一旦设置将不能修改,而number_of_replicas可以使用索引更新设置API在任何时候被增加或者减少;
ElasticSearch关注加载均衡、迁移、从节点聚集结果等等,可以尝试多种设计来完成这些功能,可以连接http://localhost:9200/A/_status来检测索引的状态。
Paths
- 配置文件所在的位置,即elasticsearch.yml和logging.yml所在的位置:
path.conf: /path/to/conf - 分配给当前节点的索引数据所在的位置:
path.data: /path/to/data
可以可选择的包含一个以上的位置,使得数据在文件级别跨越位置,这样在创建时就有更多的自由路径,如:
path.data: /path/to/data1,/path/to/data2 - 临时文件位置:
path.work: /path/to/work - 日志文件所在位置:
path.logs: /path/to/logs - 插件安装位置:
path.plugins: /path/to/plugins - 插件托管位置,若列表中的某一个插件未安装,则节点无法启动:
plugin.mandatory: mapper-attachments,lang-groovy
Memory
- JVM开始交换时,ElasticSearch表现并不好:你需要保障JVM不进行交换,可以将bootstrap.mlockall设置为true禁止交换:
bootstrap.mlockall: true请确保ES_MIN_MEM和ES_MAX_MEM的值是一样的,并且能够为ElasticSearch分配足够的内在,并为系统操作保留足够的内存。
Network
- 默认情况下,ElasticSearch使用0.0.0.0地址,并为http传输开启9200-9300端口,为节点到节点的通信开启9300-9400端口,也可以自行设置IP地址:
network.bind_host: 192.168.0.1 - publish_host设置其他节点连接此节点的地址,如果不设置的话,则自动获取,publish_host的地址必须为真实地址:
network.publish_host: 192.168.0.1 - bind_host和publish_host可以一起设置:
network.host: 192.168.0.1 - 可以定制该节点与其他节点交互的端口:
transport.tcp.port: 9300 - 节点间交互时,可以设置是否压缩,转为为不压缩:
transport.tcp.compress: true - 可以为Http传输监听定制端口:
http.port: 9200 - 设置内容的最大长度:
http.max_content_length: 100mb - 禁止HTTP:
http.enabled: false
GateWay
- 网关允许在所有集群重启后持有集群状态,集群状态的变更都会被保存下来,当第一次启用集群时,可以从网关中读取到状态,默认网关类型(也是推荐的)是local:
gateway.type: local - 允许在N个节点启动后恢复过程:
gateway.recover_after_nodes: 1 - 设置初始化恢复过程的超时时间:
gateway.recover_after_time: 5m - 设置该集群中可存在的节点上限:
gateway.expected_nodes: 2
Indices
- 设置复苏时的吞吐量,默认情况下是无限的:
indices.recovery.max_size_per_sec: 0 - 设置从对等节点恢复片段时打开的流的数量上限:
indices.recovery.concurrent_streams: 5
Discovery
- 设置一个集群中主节点的数量,当多于三个节点时,该值可在2-4之间:
discovery.zen.minimum_master_nodes: 1 - 设置ping其他节点时的超时时间,网络比较慢时可将该值设大:
discovery.zen.ping.timeout: 3s
上有更多关于discovery的设置。
- 禁止当前节点发现多个集群节点,默认值为true:
discovery.zen.ping.multicast.enabled: false - 设置新节点被启动时能够发现的主节点列表(主要用于不同网段机器连接):
discovery.zen.ping.unicast.hosts: ["host1", "host2:port", "host3[portX-portY]"]
Various
- 在一个系统上禁用启动多个节点:
node.max_local_storage_nodes: 1 - 在删除索引时,是否需要明确指定名称,该值为false时,将可以通过正则或_all进行所以 删除:
action.destructive_requires_name: true
Elasticsearch之配置详解的更多相关文章
- elasticsearch 安装配置详解
一.安装 简单的安装与启动于前文ElasticSearch初探(一)已有讲述,这里不再重复说明. 二.启动 1.自带脚本启动 1)bin/elasticsearch,不太任何参数,默认在前端启动 2) ...
- (转)Elasticsearch 5 Ik+pinyin分词配置详解
今天以这篇文章结束同城旅游网的面试,正好面试官也问到站内检索,可以尝试一下这篇文章介绍的方法.Elasticsearch 5 Ik+pinyin分词配置详解
- 日志分析工具ELK配置详解
日志分析工具ELK配置详解 一.ELK介绍 1.1 elasticsearch 1.1.1 elasticsearch介绍 ElasticSearch是一个基于Lucene的搜索服务器.它提供了一个分 ...
- elasticsearch-.yml(中文配置详解)
此elasticsearch-.yml配置文件,是在$ES_HOME/config/下 elasticsearch-.yml(中文配置详解) # ======================== El ...
- Elasticsearch SQL用法详解
Elasticsearch SQL用法详解 mp.weixin.qq.com 本文详细介绍了不同版本中Elasticsearch SQL的使用方法,总结了实际中常用的方法和操作,并给出了几个具体例子 ...
- Log4j配置详解(转)
一.Log4j简介 Log4j有三个主要的组件:Loggers(记录器),Appenders (输出源)和Layouts(布局).这里可简单理解为日志类别,日志要输出的地方和日志以何种形式输出.综合使 ...
- logback 常用配置详解<appender>
logback 常用配置详解 <appender> <appender>: <appender>是<configuration>的子节点,是负责写日志的 ...
- [转]阿里巴巴数据库连接池 druid配置详解
一.背景 java程序很大一部分要操作数据库,为了提高性能操作数据库的时候,又不得不使用数据库连接池.数据库连接池有很多选择,c3p.dhcp.proxool等,druid作为一名后起之秀,凭借其出色 ...
- libCURL开源库在VS2010环境下编译安装,配置详解
libCURL开源库在VS2010环境下编译安装,配置详解 转自:http://my.oschina.net/u/1420791/blog/198247 http://blog.csdn.net/su ...
随机推荐
- Linux的notifier机制的应用
在linux内核系统中,各个模块.子系统之间是相互独立的.Linux内核可以通过通知链机制来获取由其它模块或子系统产生的它感兴趣的某些事件. notifier_block结构体在include/lin ...
- Linux shell编写端口扫描脚本
Linux shell编写端口扫描脚本 需求: 扫描特定主机 扫描特定主机的特定端口 扫描特定网段 扫描特定网段中哪些主机开放了特定的端口 源码如下: #/bin/bash #该脚本用于对特定目标主机 ...
- Django中间件的使用
Django中间件的使用 中间件(middleware) 中间件应用于request与服务端之间和服务端与response之间,客户端发起请求到服务端接收可以通过中间件,服务端返回响应与客户端接收响应 ...
- 数据挖掘---Numpy的学习
什么是Numpy NumPy系统是Python的一种开源的数值计算扩展.这种工具可用来存储和处理大型矩阵(任意维度的数据处理),比Python自身的嵌套列表(nested list structure ...
- February 12th, 2018 Week 7th Monday
One man's fault is another man's lesson. 前车之覆,后车之鉴. We make mistakes every day, large or small, fail ...
- Mac轻量级服务器http-server
刚想跑个Vue页面,发现我本地没有应用服务器(Tomcat/IIS...) 于是想下载了Tomcat,才发现我没有装JDK,而Mac的JDK下得好久,都下不下来,想想算了. 于是在网上找个轻量级的服务 ...
- tomcat session 共享
1. nginx+tomcat7+memcached 安装JDK7sudo apt-get install java7-jdk 安装tomcat7Tomcat7下载地址http://mirror.bj ...
- js模块化规范—CMD规范
CMD规范说明 专门用于浏览器端, 模块的加载是异步的 ,模块使用时才会加载执行,github地址 CMD基本语法 定义暴露模块 //定义有依赖的模块 define(function(require, ...
- Django-rest-framework 接口实现 rest_framework 中有已经定义好的 工具类 mixins generics viewsets
rest_framework.mixins 请求业务 的 5 种实现 mixin(混合类):不能单独使用,和其它类搭配起来使用(利用了Python支持多继承) rest_framework.mix ...
- MySql Undo Redo
Undo LogUndo Log 是为了实现事务的原子性,在MySQL数据库InnoDB存储引擎中,还用Undo Log来实现多版本并发控制(简称:MVCC). - 事务的原子性(Atomicity) ...