1,Mac上安装(指定java8)

brew cask install java8

vim .base_profile
文件内容:
JAVA_HOME=/Library/Java/JavaVirtualMachines/jdk1..0_162.jdk/Contents/Home
PATH=$JAVA_HOME/bin:$PATH
CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar source .base_profile
echo .base_profile
brew install elasticsearch 安装中文分词插件(根据当前es版本):
elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.1.2/elasticsearch-analysis-ik-6.1.2.zip

2,优化配置

#服务器优化:更改索引片断数量
ulimit -n #配置文集优化配置
自身配置文件:elasticsearch.yml
修改bootstrap.mlockall: true,禁止内存交换 jvm配置文件(GC):jvm.options
-Xms1g 初始分配内存1g 总内存的50%但不能超过32G
-Xmx1g 最大使用内存1g mac中配置文件路径:
/usr/local/etc/elasticsearch

3,Elasticsearch索引配置

使用mappings新建index
curl -X PUT 'localhost:9200/kline_test' -H 'Content-Type: application/json' -d '
{
"settings": {
"number_of_shards": ,#分片数
"number_of_replicas" :#副本数:未批量导入数据时建议不要进行副本
},
"mappings": {
"kline_data": {
"properties": {
"code": {
"type": "text", #数据类型
},
"name": {
"type": "text","analyzer": "ik_max_word",#使用可以对文本进行最大数量的分词
"search_analyzer": "ik_max_word"
},
"market": {
"type": "byte",
},
"time": {
"type": "date" ,
    "format": "yyyy-MM-dd HH:mm:ss||yyyy-MM-dd||epoch_millis",#指定数据的查询格式
},
"mongo_id": {
      "type": "text",
      "index": False #不对该字段进行索引,既无法作为查询条件
      }
}
}
}
}' 

※特别提示:在6.1版本之后doc的字段属性:

  1,index的配置参数变更为True 或 False 而非之前的:not_analyzed和no

  2,include_in_all参数取消,使用copy_to来自定义_all查询

  3,详细参数说明见 http://www.cnblogs.com/dxf813/p/8447467.html

4,谨慎分片

  当在ElasticSearch集群中配置好索引后, 在集群运行中你是无法调整分片设置。 如需要调整分片数量, 也只能新建索引并导入数据后通过更换别名aliases
  对数据进行重新索引,虽然会比较耗时, 但至少能保证不会停机
 
  每个分片都是有额外的成本的:
    • 每个分片本质上就是一个Lucene索引, 因此会消耗相应的文件句柄, 内存和CPU资源
    • 每个搜索请求会调度到索引的每个分片中. 如果分片分散在不同的节点倒是问题不大.,但当分片开始竞争相同的硬件资源时, 性能便会逐步下降
    • ES使用词频统计来计算相关性,当然这些统计也会分配到各个分片上,如果在大量分片上只维护了很少的数据, 则将导致最终的文档相关性较差
  分片数量的确定:
    原则:每个分片最好不超过30G,尽量不多过多分片
    计算数量:在确定之初最好能估算出日后数据的总量,然后再进行分片(例如:未来数据可能是300G,那就至少需要10-11个分片)
    ※为保证查询质量,建议还是分片数量不要过大;网上有的人说分片不能超过20有的不能超过100
    ※个人认为需根据实际情况来进行优化,如果数据量再大且在增加额外的节点(ES会自动完成分片在不同节点上的分布平衡)后效率仍然没有改善,可新建另一个索引,然后通过程序中间件进行访问控制
    ※另外通过中间件可以进行特定数据存入指定分片(参数:_shards:0,1,2),从而达到特定数据的集中存储,提高查询效率
 
  节点数量确定(初期):
    节点数量<=分片数量*(副本数量+1)
 
5,使用optimize优化
  -随着时间的推移,ElasicSearch中每个shard的数据也会越来越多,索引越来越大,而生成的segment(在每个shard中,每个索引文件实际是由多个sgment文件组成)也会越来越多。
  而segment越多的话,则查询的性能越差,所以通过调用optimize命令,将多个segment合并成更少数量的segment(最少为一个),从而来提高查询性能。
    • curl -XPOST http://localhost:9200/shb01/_optimize?max_num_segments=1
  -在es中删除一个文档后不会立即从硬盘中删除只会标记这个文档被删除,lucene会产生一个.del文件,而在检索过程中这个文件还会参与检索只不过在最后会被过滤掉,
  这样其实也会影响效率,我们可以定期删除这些文件,同合并索引片断一样可以通过curl
    • curl -XPOST http://localhost:9200/_optimize?only_expunge_deletes=true

Mac安装6.1.2版本Elasticsearch及优化配置实践的更多相关文章

  1. 2018.4.26 Mac安装Redis5.0.3版本服务器

    Mac安装Redis服务器 安装 1.到官网下载 选择稳定版本 打开官网:https://redis.io/ 2.下载完成后,打开命令行工具,执行解压命令 tar zxvf redis-5.0.3.t ...

  2. mac安装mysql的两种方法(含配置)

    1.使用安装包安装mysql 双击打开安装文件 双击pkg文件安装 一路向下,记得保存最后弹出框中的密码(它是你mysql root账号的密码) 正常情况下,安装成功. 此时只是安装成功,但还需要额外 ...

  3. Mac 安装IDEA 2018.3 版本

    注:本文转自https://blog.csdn.net/qq_41735004/article/details/86670039 写文文的目的是,怕博主删掉然后找不到所以就写一份 1.下载idea和破 ...

  4. Nginx 1.10.1 版本nginx.conf优化配置及详细注释

    Nginx 1.10.1 的nginx.conf文件,是调优后的,可以拿来用,有一些设置无效,我备注上了,不知道是不是版本的问题,回头查一下再更正. #普通配置 #==性能配置 #运行用户 user ...

  5. Mac安装python3.x+pycharm+elasticsearch+常见报错处理(1)

    ---恢复内容开始--- mac安装python有两种方式:此处叙述官网安装下载. mac 自带python2.x版本,python2和3之间的差距还是有的.下面简单叙述我安装python3.7的过程 ...

  6. Mac 安装activate-power-mode atom

    Mac 安装activate-power-mode atom 标签: atommac 2015-12-02 14:53 308人阅读 评论(0) 收藏 举报  分类: git(2)  版权声明:本文为 ...

  7. mac 安装jdk1.5

    前期准备 Java安装包 JDK 1.5:Java for Mac OS X 10.5 Update 10(From: Apple) 辅助工具 Pacifist:用于提取*.dmg安装包中的文件(点我 ...

  8. mac平台多个php版本快速切换

    mac平台多个php版本快速切换 要求所有php版本都是由brew安装 使用brew安装php多版本方法 # brew install php56 # brew install php70 安装切换工 ...

  9. Mac安装GitLab CE记录

    0 REF REF1 原始的GitLab Documentation REF2 Installation-guide-for-GitLab-on-OS-X REF3 如何在Mac 终端升级ruby版本 ...

随机推荐

  1. Qt QLabel QTextBrowser 实现网址链接

    勾选属性: 并且编辑网址链接: QLabel--点击text属性的...:  QTextBrowser--双击控件

  2. ubuntu装好jupyter启动失败问题

    ::/jupyter/nbserver-.json: [Errno ] Permission denied: '/run/user/1000/jupyter/nbserver-35390.json' ...

  3. office2007每次打开都要配置文件,怎么取消配置

    有时候 Office2007打开文档,每次都提示需要安装.配置,配置完成之后,下次打开又需要配置点击取消就不能打开.非常的烦.ffice2007下载后为什么每次打开总需要置?office2007每次打 ...

  4. 【转】Windons+jenkins,构建java程序,提示C:\Windows\TEMP\jenkins5037773887088486383.bat Access is denied

    坑1: !!!前提:已设置本机电脑的账号密码, 解决方法:搜索程序services.msc-- 找到Jenkins-- 右键“属性”--登录--此账户--输入本机的账号密码--保存-- 停止Jenki ...

  5. python 开发练习之 监控

    本节内容 为什么要做监控? 常用监控系统设计讨论 监控系统架构设计 监控表结构设计 为什么要做监控? –熟悉IT监控系统的设计原理 –开发一个简版的类Zabbix监控系统 –掌握自动化开发项目的程序设 ...

  6. maven 项目连接mysql8.0版本时的注意事项

    MySQL 8.0 正式版 8.0.11 已发布,官方表示 MySQL 8 要比 MySQL 5.7 快 2 倍,还带来了大量的改进和更快的性能! 以前的maven项目,要注意依赖的注入 查看pom. ...

  7. Thanks David's Share

    2019.4.12 Today, we got the invitation letter from US, when we discuss the journey, i saw perfect sh ...

  8. 随手记一 2018/04/23 session和cookie的区别

    1.cookie存放在客户端的浏览器上,session存放在服务器上 2.cookie安全性不高,可以通过分析存放在本地的cookie并且进行cookie欺骗 3.session会在一定时间内保存在服 ...

  9. iOS项目之使用开关控制日志输出的功能

    最近一直在做sdk的项目,用户提出了一个需求,需要屏蔽sdk内部的日志输出.由于sdk内部的日志是为了调试,如果屏蔽了肯定不方便,所以研究了一下日志输出开关的功能. 在这里介绍两种实现方案:一种方案是 ...

  10. VMware centos7 如何配置静态ip并且可上网

    注:此贴使用NAT方式配置上网模式. 1.设置虚拟机的网络适配器为NAT模式: 2.修改VMware的“虚拟网络编辑器”: 打开后选择NAT模式,勾选,然后点击NAT设置: NAT默认设置了188网段 ...