本文简要介绍ES5版本集群部署时的要点。 更多相关信息请参阅官网。

部分配置未在生产环境体现。 生产中2个集群20台centOS,总数据15TB,90亿条。 实时写入5000条/s, 最大7万/s。

环境准备:

1. vi /etc/sysctl.conf 加入: 
        vm.max_map_count=262144

执行 sysctl -p  使配置生效

2. vi /etc/security/limits.d/20-nproc.conf  #打开进程数
        * soft nproc 65536

3. vi /etc/security/limits.conf #打开文件数
        * soft nofile 65536
        * hard nofile 65536
        * - memlock unlimited

ES配置:

  1. 设置至少1台纯Master, 2台混合Data/Master。 合计3台master的集群。  所有的bulk请求仅post到master中。
  2. 设置约50%的内存给ES, 如Xms=Xmx=24G
  3. 对master,由于bulk请求涉及频繁gc, 设置为如下的G1GC。

    -XX:+UseG1GC

  4. 将所有master 的ip地址更新到discovery file插件配置中。

    node.attr.rack: crm-master-01
    node.name: golden-master01
    network.publish_host: 10.27.1.1

    cluster.name : goldeneye
    network.host: 0.0.0.0
    http.port: 9200
    transport.tcp.port: 9300

    path:
        data:
            - /home/data1
            - /home/data2

    bootstrap.memory_lock: true
    discovery.zen.minimum_master_nodes: 2
    action.destructive_requires_name: true
    script.max_compilations_per_minute: 120
    indices.query.bool.max_clause_count: 4096

    ##===================MASTER NODE =========================
    node.master: true
    node.data: false
    node.ingest: true
    discovery.zen.ping_timeout: 10s

    xpack.monitoring.history.duration: 1d
    xpack.graph.enabled: false
    xpack.watcher.enabled: false
    #xpack.security.enabled: false
    xpack.security.dls_fls.enabled: false
    xpack.security.transport.filter.enabled: false

    ##===================DATA NODE =========================
    node.master: false 
    node.data: true 
    node.ingest: false

    http.enabled: false

    xpack.security.enabled: true
    xpack.monitoring.enabled: true
    xpack.graph.enabled: false
    xpack.watcher.enabled: false

集群settings

curl -XPUT localhost:9200/_cluster/settings -d '

{
    "transient": {
        "cluster": {
                "routing": {
                        "rebalance": {
                                "enable": "none"         #初始导入前,禁用shard移动
                        },
                "allocation": {
                        "node_concurrent_incoming_recoveries": "6",  #初始导入后,将replica设为1时, 加速replica复制速度。默认为2
                        "node_concurrent_outgoing_recoveries": "6"
                }
            }
    },
    "indices": {
        "recovery": {
                "max_bytes_per_sec": "500mb"                    #初始导入后,将replica设为1时, 加速replica复制速度,默认为40m
                },
        "store": {
                "throttle": {
                        "type": "merge",
                        "max_bytes_per_sec": "500m"           #数据导入时,及_forcemerge?max_num_segments=3时加速
                        }
                }
        }
    }
}

'

创建库Template

curl -XPUT localhost:9200/_template/crm_v5 -d '

{
        "template": "crm*",
        "aliases": {
                "crm_v5.0": {}
        },
        "settings": {
        "index": {
                "number_of_shards": "1",
                "number_of_replicas": "1",        #初始化导入时设置 0, 
               "refresh_interval": "10s",            #初始化导入时设置 -1
               "translog.durability":"async",      #大量写入场景

"translog.flush_threshold_size":"1024m"     #默认512m
               "max_result_window": "5000000",
               "max_rescore_window":"20000",
               "unassigned.node_left.delayed_timeout": "10m",
               "search.slowlog.threshold.query.warn":"30s", 
               "indexing.slowlog.threshold.index.warn": "10s" 
               }
        },
        "mappings": {
                   "customer": {
                         "_all": { "enabled": false },   #内存优化
                        "properties": {

字段使用尽量短的类型:能short就不要使用int,能half 就不要使用float。

如long,integer,short, byte

float, half_float

"end_time": {
                            "type": "date",
                            "format": "strict_date_optional_time||epoch_millis"  #两种格式2016-0-01T00:00:00 +08:00
                        }

启动全量导入作业

更新template的 number_of_replicas=0,refresh_interval=-1

全量导入完成

1. 确认已导入的库大小, 对大于30GB的库,重新设置shard个数number_of_shards,使每个shard约为30GB。  使用 _reindex 和_alias 接口配合完成。

2. 合并每个shard的segment数目 , 增强search速度。

curl -XPOST /crm*/_forcemerge?max_num_segments=3

3. 启动副本备份。 number_of_replicas=1

curl -XPUT 'localhost:9200/crm*/_settings' -d ' { "index" : { "number_of_replicas" : 1 } }'

运维期间

A: 移动Index所属节点

curl -XPUT localhost:9200/_cluster/reroute   迁移节点数据

{
    "commands" : [ {
        "move" :
       {
              "index" : "crm-0720", "shard" : 0,
              "from_node" : "data02", "to_node" : "data03"
       }
     }]
}

如果关闭一个节点,则执行reroute前, 还必须禁用系统自动的shard分配

curl -XPUT localhost:9200/_cluster/settings -d '{  "transient" : {  "cluster.routing.allocation.enable" : "none"  }  }' #默认为all

PUT /_cluster/settings
{
         "persistent" : {
             "cluster.routing.allocation.enable":"none",
             "cluster.routing.rebalance.enable":"replicas",
             "action.destructive_requires_name":true
         }
}

当前文件夹内查找关键字,显示所在文件,所在行,行内容:
grep -nHIrF KeyWord ./

ElasticSearch5集群部署指南的更多相关文章

  1. Apache Kafka 集群部署指南

    公众号关注 「开源Linux」 回复「学习」,有我为您特别筛选的学习资料~ Kafka基础 消息系统的作用 应该大部分小伙伴都清楚,用机油装箱举个例子. 所以消息系统就是如上图我们所说的仓库,能在中间 ...

  2. Kafka集群部署指南

    一.前言 1.Kafka简介 Kafka是一个开源的分布式消息引擎/消息中间件,同时Kafka也是一个流处理平台.Kakfa支持以发布/订阅的方式在应用间传递消息,同时并基于消息功能添加了Kafka ...

  3. Hadoop记录-Apache hadoop+spark集群部署

    Hadoop+Spark集群部署指南 (多节点文件分发.集群操作建议salt/ansible) 1.集群规划节点名称 主机名 IP地址 操作系统Master centos1 192.168.0.1 C ...

  4. [转]OpenShift 集群搭建指南

    转自:http://www.cnblogs.com/zhangning/p/7251810.html OpenShift 集群搭建指南 v1.0 搭建Hyper-v虚拟机或物理机 配置物理机静态IP, ...

  5. Elasticsearch学习总结 (Centos7下Elasticsearch集群部署记录)

    一.  ElasticSearch简单介绍 ElasticSearch是一个基于Lucene的搜索服务器.它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口.Elasticse ...

  6. Gitlab CI 集成 Kubernetes 集群部署 Spring Boot 项目

    在上一篇博客中,我们成功将 Gitlab CI 部署到了 Docker 中去,成功创建了 Gitlab CI Pipline 来执行 CI/CD 任务.那么这篇文章我们更进一步,将它集成到 K8s 集 ...

  7. ELK5.2+kafka+zookeeper+filebeat集群部署

    架构图 考虑到日志系统的可扩展性以及目前的资源(部分功能复用),整个ELK架构如下: 架构解读 : (整个架构从左到右,总共分为5层) 第一层.数据采集层 最左边的是业务服务器集群,上面安装了file ...

  8. openstack高可用集群21-生产环境高可用openstack集群部署记录

    第一篇 集群概述 keepalived + haproxy +Rabbitmq集群+MariaDB Galera高可用集群   部署openstack时使用单个控制节点是非常危险的,这样就意味着单个节 ...

  9. Quartz.net持久化与集群部署开发详解

    序言 我前边有几篇文章有介绍过quartz的基本使用语法与类库.但是他的执行计划都是被写在本地的xml文件中.无法做集群部署,我让它看起来脆弱不堪,那是我的罪过. 但是quart.net是经过许多大项 ...

随机推荐

  1. Java 之final,static小结

    一.final 1.final变量: 当你在类中定义变量时,在其前面加上final关键字,那便是说,这个变量一旦被初始化便不可改变,这里不可改变的意思对基本类型来说是其值不可变,而对于对象变量来说其引 ...

  2. java 单元测试 注入

    ApplicationContext appContext = new ClassPathXmlApplicationContext("appContext.xml"); MySQ ...

  3. JQuery实现超链接鼠标提示效果

    一.第一种方法用Jquery<p><a href="http://www.nowamagic.net/" class="tooltip" ti ...

  4. laravel项目安装debugbar

    在github上有laravel项目的debugbar,可以查看项目的页面引用.变量.数据库使用.内存和反应时间等,貌似是一个还不错的小工具,效果如下: 安装地址:https://github.com ...

  5. display属性及inline-block值(可用来布局)

    display:block就是将元素显示为块级元素. block元素的特点是: 总是在新行上开始: 高度,行高以及顶和底边距都可控制: 宽度缺省是它的容器的100%,除非设定一个宽度 <div& ...

  6. AnsiString用法(转)

    源:AnsiString用法 //Ansistring 转 char void __fastcall TForm1::Button1Click(TObject *Sender) { AnsiStrin ...

  7. 一个苹果证书怎么多次使用——导出p12文件

    http://blog.csdn.net/jjiss318/article/details/41812243 原文:http://my.oschina.net/u/1245365/blog/19636 ...

  8. 火狐上的一个post提交工具(主要用于测试接口时候)

    添加的过程 安装完后,就可以在下图上,看到一个poster 点击poster就可以看到下图 图中红线圈好的,是必须要填写的 Url是访问路径 Name是参数名称 Value是参数值 需要注意一点的是: ...

  9. iOS获取设备唯一标识的各种方法?IDFA、IDFV、UDID分别是什么含义?

    一.UDID (Unique Device Identifier) UDID的全称是Unique Device Identifier,顾名思义,它就是苹果IOS设备的唯一识别码,它由40个字符的字母和 ...

  10. IOS软件国际化(本地化Localizable)

    IOS软件国际化(本地化Localizable) iPhone是支持语言最多的手机,它支持各国语言及中国少数名族如蒙古等语言,这也是好多少数名族都用苹果的原因.在这一点上我们自主品牌还是要多学习学习. ...