Elasticsearch 搜索引擎

简介：

Elasticsearch 是一个实时的分布式搜索和分析引擎。它可以帮助你用前所未有的速度去处理大规模数据、它可以用于全文搜索，结构化搜索以及分析。

分布式实时文件存储，并将每一个字段都编入索引，使其可以被搜索。

实时分析的分布式搜索引擎。

可以扩展到上百台服务器，处理PB级别的结构化或非结构化数据。

下载地址：https://download.elastic.co/elasticsearch/release/org/elasticsearch/distribution/tar/elasticsearch/2.4.0/elasticsearch-2.4.0.tar.gz

一、安装 Elasticsearch

shell > yum -y install java                 # 需要 java 环境

shell > java -version

openjdk version "1.8.0_101"

OpenJDK Runtime Environment (build 1.8.0_101-b13)

OpenJDK -Bit Server VM (build 25.101-b13, mixed mode)

shell > useradd elast                       # 用于启动 elasticsearch

shell > cd /usr/local/src

shell > wget https://download.elastic.co/elasticsearch/release/org/elasticsearch/distribution/tar/elasticsearch/2.4.0/elasticsearch-2.4.0.tar.gz

shell > tar zxf elasticsearch-2.4..tar.gz

shell > mv elasticsearch-2.4. ../elasticsearch-2.4.

shell > chown -R elast.elast /usr/local/elasticsearch

二、配置 Elasticsearch

shell > vim /usr/local/elasticsearch/conf/elasticsearch.yml

cluster.name: es                              # 集群名称

node.name: node-                             # 节点名称，默认第一个启动的节点为集群 Master

path.data: /data/esearch/data                 # 索引存放路径

path.logs: /data/esearch/logs                 # 日志

network.host: 192.168.1.32                    # 监听地址

http.port:                                # 端口

shell > mkdir /data/esearch/data

shell > mkdir /data/esearch/logs

shell > chown -R elast.elast /data/esearch/data

shell > chown -R elast.elast /data/esearch/logs

shell > vim /usr/local/elasticsearch/bin/elasticsearch.in.sh

if [ "x$ES_MIN_MEM" = "x" ]; then

    ES_MIN_MEM=256m

fi

if [ "x$ES_MAX_MEM" = "x" ]; then

    ES_MAX_MEM=2g

fi

# 设置一下允许 elasticsearch 使用的最大/最小内存

三、启动 Elasticsearch

shell > su - elast -c "/usr/local/elasticsearch-2.4.0/bin/elasticsearch -d"           # 以 elast 用户身份启动，否则报错

shell > echo 'su - elast -c "/usr/local/elasticsearch-2.4.0/bin/elasticsearch -d"' >> /etc/rc.local      # 加入开机启动

shell > killall java  # 因为我的服务器上只跑一个 java 程序，就是 elasticsearch ，所以我这样关闭

shell > netstat -lnpt | grep java

tcp               :::                     :::*                        LISTEN      /java

tcp               :::                     :::*                        LISTEN      /java

shell > tree /data/esearch/  # 数据(索引)目录、日志目录

/data/esearch/

├── data

│   └── my-esearch

│       └── nodes

│           └──

│               ├── node.lock

│               └── _state

│                   └── global-.st

└── logs

    ├── my-esearch_deprecation.log

    ├── my-esearch_index_indexing_slowlog.log

    ├── my-esearch_index_search_slowlog.log

    └── my-esearch.log

shell >ps aux | grep java

elast       3.7  6.6   ?      Sl   :   : /usr/bin/java -Xms256m -Xmx2g -Djava.awt.headless=true\

-XX:+UseParNewGC -XX:+UseConcMarkSweepGC -XX:CMSInitiatingOccupancyFraction= -XX:+UseCMSInitiatingOccupancyOnly\

-XX:+HeapDumpOnOutOfMemoryError -XX:+DisableExplicitGC -Dfile.encoding=UTF- -Djna.nosys=true -Des.path.home=/usr/local/elasticsearch-2.4.\

-cp /usr/local/elasticsearch-2.4./lib/elasticsearch-2.4..jar:/usr/local/elasticsearch-2.4./lib/* org.elasticsearch.bootstrap.Elasticsearch start -d

# 可以看到启动参数中有前面内存的设定 -Xms256m -Xmx2g

四、测试 Elasticsearch

shell > curl -X GET localhost:                     # 返回 elasticsearch 基本信息，节点名称、版本信息等

{

  "name" : "node-1",

  "cluster_name" : "es",

  "version" : {

    "number" : "2.4.0",

    "build_hash" : "ce9f0c7394dee074091dd1bc4e9469251181fc55",

    "build_timestamp" : "2016-08-29T09:14:17Z",

    "build_snapshot" : false,

    "lucene_version" : "5.5.2"

  },

  "tagline" : "You Know, for Search"

}

shell > curl -X GET localhost:/_cat                # 支持的各指令

=^.^=

/_cat/allocation

/_cat/shards

/_cat/shards/{index}

/_cat/master

/_cat/nodes

/_cat/indices

/_cat/indices/{index}

/_cat/segments

/_cat/segments/{index}

/_cat/count

/_cat/count/{index}

/_cat/recovery

/_cat/recovery/{index}

/_cat/health

/_cat/pending_tasks

/_cat/aliases

/_cat/aliases/{alias}

/_cat/thread_pool

/_cat/plugins

/_cat/fielddata

/_cat/fielddata/{fields}

/_cat/nodeattrs

/_cat/repositories

/_cat/snapshots/{repository}

shell > curl -X GET 127.0.0.1:/_cat/master?v       # 查看 Master 信息，加 ?v 可以显示表头

id                     host         ip           node

7EkYmW84S8aELlXvieV5uw 192.168.1.32 192.168.1.32 node- 

shell > curl -X GET localhost:/_cat/nodes?v        # 集群节点信息

host         ip           heap.percent ram.percent load node.role master name

192.168.1.32 192.168.1.32                       0.12 d         *      node-

五、Elasticsearch 插件安装

shell > /usr/local/elasticsearch/bin/plugin list       # 查看 Elasticsearch 安装了哪些插件，结果一个也没有

Installed plugins in /usr/local/elasticsearch/plugins:

    - No plugin detected

1、head 集群管理插件

shell > /usr/local/elasticsearch/bin/plugin install mobz/elasticsearch-head          # 安装一个插件，用于集群管理

# 一些插件地址：

# https://github.com/mobz/elasticsearch-head              # 可直接安装

# https://github.com/medcl/elasticsearch-analysis-ik      # 需要自己打包 mvn package

shell > /usr/local/elasticsearch/bin/plugin list          # 再次查看

Installed plugins in /usr/local/elasticsearch/plugins:

    - head

## http://192.168.1.32:9200/_plugin/head  浏览器访问 head 集群管理插件

2、中文分词插件

# 这里先留空一个知识点：maven 的安装跟怎么给中文分词器编译打包。

shell > cd /usr/local/src/

shell > wget https://github.com/medcl/elasticsearch-analysis-ik/archive/master.zip  # 下载中文分词插件

shell > unzip elasticsearch-analysis-ik-master.zip

shell > cd elasticsearch-analysis-ik-master

shell > mvn package                                       # 将分词器源码编译成 jar 包，过程有点长 ( 打包失败的，可以加我 QQ：25152069 ，我有打好的包 )

shell > cp target/releases/elasticsearch-analysis-ik-1.10..zip /usr/local/elasticsearch-2.4./plugins/ik/  # ik 目录不存在就创建一下

shell > cd /usr/local/elasticsearch-2.4./plugins/ik

shell > unzip elasticsearch-analysis-ik-1.10..zip

shell > killall java

shell > su - elast -c "/usr/local/elasticsearch-2.4.0/bin/elasticsearch"

shell > /usr/local/elasticsearch-2.4./bin/plugin list    # 再次查看插件已经安装成功

Installed plugins in /usr/local/elasticsearch-2.4./plugins:

    - head

    - ik

六、配置 Elasticsearch 集群

1、node1 ( 默认的 Master )

shell > grep -vP '^#|^$' /usr/local/elasticsearch-2.4./config/elasticsearch.yml

cluster.name: es                                    # 集群名称必须一致，且同一局域网内可以自动组成集群

node.name: node-                                   # 节点名称唯一

path.data: /data/esearch/data

path.logs: /data/esearch/logs

network.host: 192.168.1.32

http.port:

discovery.zen.ping.unicast.hosts: ["192.168.1.33"]  # 指定谁可以成为 Master

2、node2 ( 默认的 node )

shell > grep -vP '^#|^$' /usr/local/elasticsearch-2.4./config/elasticsearch.yml

cluster.name: es

node.name: node-                                   # 节点名称唯一

path.data: /data/esearch/data

path.logs: /data/esearch/logs

network.host: 192.168.1.33

http.port:

discovery.zen.ping.unicast.hosts: ["192.168.1.32"]  # 指定谁可以成为 Master

## 注意：

> 如果不指定谁可以成为 Master ，那么默认两个节点都是 Master ，无法构成集群。新加入的节点不设置该参数，无法加入到现有集群。

> 如果被指定的节点设置了 node.master: false ，那么该节点无法成为 Master ，如果只有两个节点，当 Master 挂掉，那么集群失败。

> 防火墙：开启 TCP 9200 ：为了使用web浏览集群状态等，TCP 9300 ：用于节点直接通信。

3、查看集群状态

shell > curl -X GET 192.168.1.32:/_cat/master?v  # 查看谁是 Master

id                     host         ip           node

9RVF5M9lRDuvhzKNF5VjXA 192.168.1.32 192.168.1.32 node- 

shell > curl -X GET 192.168.1.32:/_cat/nodes?v   # 查看各节点状态，* 代表该节点是 Master ，m 代表该节点可以成为 Master ，- 代表该节点不可以成为 Master

host         ip           heap.percent ram.percent load node.role master name

192.168.1.33 192.168.1.33                       0.36 d         m      node-

192.168.1.32 192.168.1.32                       0.49 d         *      node-

# End

Elasticsearch 搜索引擎的更多相关文章

elasticsearch搜索引擎环境的搭建
elasticsearch 搜索引擎解决了什么问题:在我们数据量很大时,我们使用模糊查询会使索引列的索引消失,这样使用elasticsearch来提高查询效率. 存在什么问题:有时我们查询的词,el ...
第三百七十一节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)用Django实现我的搜索以及热门搜索
第三百七十一节,Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)用Django实现我的搜索以及热门我的搜素简单实现原理我们可以用js来实现,首先用js获取到 ...
第三百七十节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)用Django实现搜索结果分页
第三百七十节,Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)用Django实现搜索结果分页逻辑处理函数计算搜索耗时在开始搜索前:start_time ...
第三百六十九节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)用Django实现搜索功能
第三百六十九节,Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)用Django实现搜索功能 Django实现搜索功能 1.在Django配置搜索结果页的路由映 ...
第三百六十八节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)用Django实现搜索的自动补全功能
第三百六十八节,Python分布式爬虫打造搜索引擎Scrapy精讲—用Django实现搜索的自动补全功能 elasticsearch(搜索引擎)提供了自动补全接口官方说明:https://www.e ...
第三百六十七节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)scrapy写入数据到elasticsearch中
第三百六十七节,Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)scrapy写入数据到elasticsearch中前面我们讲到的elasticsearch( ...
第三百六十六节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的bool组合查询
第三百六十六节,Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的bool组合查询 bool查询说明 filter:[],字段的过滤,不参与打分must:[] ...
第三百六十五节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的基本查询
第三百六十五节,Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的基本查询 1.elasticsearch(搜索引擎)的查询 elasticsearch是功能 ...
第三百六十四节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的mapping映射管理
第三百六十四节,Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的mapping映射管理 1.映射(mapping)介绍映射:创建索引的时候,可以预先定义字 ...
第三百六十三节，Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的mget和bulk批量操作
第三百六十三节,Python分布式爬虫打造搜索引擎Scrapy精讲—elasticsearch(搜索引擎)的mget和bulk批量操作注意:前面讲到的各种操作都是一次http请求操作一条数据,如果想 ...

随机推荐

IntelliJ-IDEA中mybatis三剑客
一.mybatis-generator的使用作用:根据数据库自动生成pojo.dao和xml文件. 1.引入mybatis-generator pom.xml中引入配置:
BZOJ2154 Crash的数字表格【莫比乌斯反演】
BZOJ2154 Crash的数字表格 Description 今天的数学课上,Crash小朋友学习了最小公倍数(Least Common Multiple).对于两个正整数a和b,LCM(a, b) ...
Excel VBA to Interact with Other Applications
转载自:https://analysistabs.com/excel-vba/interact-with-other-applications/ Interact with PowerPoint fr ...
Maven系列（一）之初识Maven
Maven是个啥? Maven主要服务于基于Java平台的项目构建.依赖管理和项目信息管理,并且Maven是跨平台的,这意味着无论是在Windows上,还是在Linux或者Mac上,都可以使用同样的命 ...
Makefile常用知识点
格式目标:最终要去生成的文件, 定格写,后面是冒号(冒号后面是依赖) 依赖:用来生成目标的源材料命令:加工的方法,命令前面一定是Tab, make的过程就是使用命令将依赖加工成目标的过程工作原理 ...
python: delete the duplicates in a list
下面有几种做法, 其中3之简洁令人惊讶. 1, >>> t = [1, 2, 3, 1, 2, 5, 6, 7, 8] >>> t [1, 2, 3, 1, 2, ...
scrapy docker 基本部署使用
1. 简单项目 pip install scrapy scrapy startproject appdemo 2. 项目代码 a. 项目代码结构 ├── Dockerfile ├── READ ...
(高级篇)jQuery学习之jQuery Ajax用法详解
jQuery Ajax在web应用开发中很常用,它主要包括有ajax,get,post,load,getscript等等这几种常用无刷新操作方法,下面我来给各位同学介绍介绍. 我们先从最简单的方法看起 ...
angularJS控制器之间的相互通信方式、$broadcast、$emit、$on
在项目中,我们可能会很经常性的利用到控制器之间的相互通信,在angular中的控制器之间的相互通信有以下几种方式: 1)通过本地数据的存储localstorage,sessionstorage, 2) ...
Unit05： JavaScript对象概述、常用内置对象一、常用内置对象二、常用内置对象三
Unit05: JavaScript对象概述 . 常用内置对象一 . 常用内置对象二 . 常用内置对象三常用内置对象使用演示: <!DOCTYPE html> <html> ...

Elasticsearch 搜索引擎

Elasticsearch 搜索引擎的更多相关文章

随机推荐

热门专题