我们所常见的电商搜索如京东,搜索页面都会提供各种各样的筛选条件,比如品牌、尺寸、适用季节、价格区间等,同时提供排序,比如价格排序,信誉排序,销量排序等,方便了用户去找到自己心里理想的商品。

站内搜索对于一个网站几乎是标配,只是搜索的强大与否的区别,有的网站只支持关键词模糊搜索,而淘宝,京东提供了精细的筛选条件,同时支持拼音搜索等更方便的搜索方式。

由于笔者在一家做网络文学的公司工作,所以实现就是以小说为商品的搜索,具体可以参考起点网小说的搜索。

如图所示,起点网的搜索提供了关键词搜索和排序条件以及筛选条件,接下来,我们一起来实现这个吧~

环境

本文以及后续 es 系列文章都基于 5.5.3 这个版本的 elasticsearch ,这个版本比较稳定,可以用于生产环境。

系列文章

环境准备之 ES 集群搭建

master 配置

## 下载 elasticsearch
wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-5.5.3.tar.gz ## 创建目录
mkdir /usr/local/es ## 解压文件到 es 目录
tar -xvf elasticsearch-5.5.3.tar.gz -C /usr/local/es ## 修改 es 的配置文件
cd /usr/local/es/elasticsearch-5.5.3/config vim elasticsearch.yml ## 在文件末尾增加 http.cors.enabled: true
http.cors.allow-origin: "*"
cluster.name: es-search
node.name: slave1
node.master: true
network.host: 0.0.0.0 ## 修改 es 的 jvm 设置,如果不调节,可能启动一个 master, slave 就没足够内存来启动了 vim jvm.options 修改
-Xms2g
-Xmx2g

-Xms512m
-Xmx512m 注意,如果是线上,这个内存就不要修改了,使用默认的内存 2G 即可。

slave 配置

## 准备搭建一个伪集群 1个master + 2个slave
cd /usr/local/es ## 将目录重命名为 master
[root@localhost es]# mv elasticsearch-5.5.3/ master ##拷贝两份为 slave
[root@localhost es]# cp -r master/ slave1
[root@localhost es]# cp -r master/ slave2 ## 修改两个 slave 的配置 ### 修改 slave1 的配置
[root@localhost es]# vim slave1/config/elasticsearch.yml http.cors.enabled: true
http.cors.allow-origin: "*"
cluster.name: es-search
node.name: slave1
## 注意 http 端口不要设置一样,以免冲突
http.port: 8200
#node.master: true
network.host: 0.0.0.0 ### 修改 slave2 的配置
[root@localhost es]# vim slave2/config/elasticsearch.yml http.cors.enabled: true
http.cors.allow-origin: "*"
cluster.name: es-search
node.name: slave2
## 注意 http 端口不要设置一样,以免冲突
http.port: 7200
#node.master: true
network.host: 0.0.0.0

添加用户

## 启动 es 不能使用 root 用户,所以先需要增加新的用户

[root@localhost es]# adduser esuser
[root@localhost es]# chown -R esuser /usr/local/es/ ## 切换到 esuser 用户
[root@localhost es]# su esuser
[esuser@localhost es]$ chmod 777 /usr/local/es/

启动集群中的 master

# 先测试能否正常启动
[esuser@localhost es]$ /usr/local/es/master/bin/elasticsearch # 查看打印的日志信息
[2018-09-02T01:45:21,125][INFO ][o.e.g.GatewayService ] [master] recovered [0] indices into cluster_state
[2018-09-02T01:45:21,138][INFO ][o.e.h.n.Netty4HttpServerTransport] [master] publish_address {127.0.0.1:9200}, bound_addresses {127.0.0.1:9200}
[2018-09-02T01:45:21,138][INFO ][o.e.n.Node ] [master] started ## 启动失败提示
ERROR: [2] bootstrap checks failed
[1]: max file descriptors [4096] for elasticsearch process is too low, increase to at least [65536]
[2]: max virtual memory areas vm.max_map_count [65530] is too low, increase to at least [262144] ## 切换到 root 用户,修改系统配置
su root
# 输入登录密码 vim /etc/security/limits.conf ## 在文件末尾增加,不要去掉前面的 * 号 * soft nofile 300000
* hard nofile 300000
* soft nproc 102400
* soft memlock unlimited
* hard memlock unlimited ## 对 sysctl.conf 文件 进行修改
echo "vm.max_map_count=262144" > /etc/sysctl.conf
sysctl -p ## 修改完毕,切换回 esuser 用户身份
su esuser ## 尝试启动
[esuser@localhost es]$ /usr/local/es/master/bin/elasticsearch # 提示已经启动成功了
[2018-09-02T02:10:14,285][INFO ][o.e.h.n.Netty4HttpServerTransport] [master] publish_address {192.168.199.192:9200}, bound_addresses {[::]:9200}
[2018-09-02T02:10:14,285][INFO ][o.e.n.Node ] [master] started
[2018-09-02T02:10:14,289][INFO ][o.e.g.GatewayService ] [master] recovered [0] indices into cluster_state

验证启动

使用浏览器访问 http://ip:9200 ip 替换你的 ip 地址,我的是 http://192.168.199.192:9200

浏览器响应内容

{
name: "master",
cluster_name: "es-search",
cluster_uuid: "JoNUMEKFS06NHNS7p3bdWg",
version: {
number: "5.5.3",
build_hash: "9305a5e",
build_date: "2017-09-07T15:56:59.599Z",
build_snapshot: false,
lucene_version: "6.6.0"
},
tagline: "You Know, for Search"
}

注意:如果无法访问,请关闭防火墙

后台守护进程启动 es 集群

前文是直接启动,如果按下 ctrl + c 或者结束 ssh 会话,es 会立即停止退出,因此需要通过守护进程后台启动


[esuser@localhost es]$ /usr/local/es/master/bin/elasticsearch -d ## 查看是否启动成功
ps -ef | grep elasticsearch ## 正常可以看到一个 elasticsearch 进程 ## 如前文一样,分别测试两个 slave 是否可以正常启动 ### 测试slave1
[esuser@localhost es]$ /usr/local/es/slave1/bin/elasticsearch -d ### 浏览器访问 http://ip:8200,响应为:
{
"name":"slave1",
"cluster_name":"es-search",
"cluster_uuid":"JoNUMEKFS06NHNS7p3bdWg",
"version":{
"number":"5.5.3",
"build_hash":"9305a5e",
"build_date":"2017-09-07T15:56:59.599Z",
"build_snapshot":false,
"lucene_version":"6.6.0"
},
"tagline":"You Know, for Search"
} ### 测试slave2
[esuser@localhost es]$ /usr/local/es/slave2/bin/elasticsearch -d
### 浏览器访问 http://ip:8200,响应为: {
name: "slave2",
cluster_name: "es-search",
cluster_uuid: "JoNUMEKFS06NHNS7p3bdWg",
version: {
number: "5.5.3",
build_hash: "9305a5e",
build_date: "2017-09-07T15:56:59.599Z",
build_snapshot: false,
lucene_version: "6.6.0"
},
tagline: "You Know, for Search"
}

至此完成了 es 集群(伪)的搭建。

环境准备之 elasticsearch head 安装

为了方便我们观察调试,安装这个 es 插件。

安装步骤参考官方 github

# 把插件安装到 es 目录下
cd /usr/local/es/ git clone git://github.com/mobz/elasticsearch-head.git
cd elasticsearch-head
npm install
npm run start

npm install 这一步,由于国内网络环境的原因,可能会失败,可以npm 换源重试。

启动完成后,浏览器访问 http://ip:9100,我的是 http://192.168.199.192:9100/

这里需要修改连接地址,为你的 es 所在的 ip:9200。后面集群健康为绿色为正常。

到这里,插件也就安好了。

分词

商品搜索,分词是必不可少的,开源的中文分词最有名的莫过于 IK 分词了,同时为了给用户提供更好的体验,同时配置 pinyin 分词,即输入拼音也可以进行搜索,网上也有对应的分词器,在下文中我们一起来配置分词器。

有疑问?

欢迎来信,给我写信

和我一起打造个简单搜索之ElasticSearch集群搭建的更多相关文章

  1. 和我一起打造个简单搜索之ElasticSearch入门

    本文简单介绍了使用 Rest 接口,对 es 进行操作,更深入的学习,可以参考文末部分. 环境 本文以及后续 es 系列文章都基于 5.5.3 这个版本的 elasticsearch ,这个版本比较稳 ...

  2. 和我一起打造个简单搜索之SpringDataElasticSearch入门

    网上大多通过 java 操作 es 使用的都是 TransportClient,而介绍使用 SpringDataElasticSearch 的文章相对比较少,笔者也是摸索了许久,接下来本文介绍 Spr ...

  3. 和我一起打造个简单搜索之SpringDataElasticSearch关键词高亮

    前面几篇文章详细讲解了 ElasticSearch 的搭建以及使用 SpringDataElasticSearch 来完成搜索查询,但是搜索一般都会有搜索关键字高亮的功能,今天我们把它给加上. 系列文 ...

  4. 和我一起打造个简单搜索之Logstash实时同步建立索引

    用过 Solr 的朋友都知道,Solr 可以直接在配置文件中配置数据库连接从而完成索引的同步创建,但是 ElasticSearch 本身并不具备这样的功能,那如何建立索引呢?方法其实很多,可以使用 J ...

  5. 和我一起打造个简单搜索之IK分词以及拼音分词

    elasticsearch 官方默认的分词插件,对中文分词效果不理想,它是把中文词语分成了一个一个的汉字.所以我们引入 es 插件 es-ik.同时为了提升用户体验,引入 es-pinyin 插件.本 ...

  6. elasticsearch集群搭建实例

    elasticsearch集群搭建实例 下个月又开始搞搜索了,几个月没动这块还好没有落下. 晚上在自己虚拟机上搭建了一个简易搜索集群,分享一下. 操作系统环境: Red Hat 4.8.2-16 el ...

  7. Elasticsearch集群搭建及使用Java客户端对数据存储和查询

    本次博文发两块,前部分是怎样搭建一个Elastic集群,后半部分是基于Java对数据进行写入和聚合统计. 一.Elastic集群搭建 1. 环境准备. 该集群环境基于VMware虚拟机.CentOS ...

  8. elasticsearch 集群搭建及启动常见错误

    1.系统环境 三台服务器(最好是单数台,跟master选举方式有关),确保机器互相ping的通,且都需要装了jdk 8环境,机器IP和 elasticsearch 的节点名称如下: cluster n ...

  9. Es学习第十课,ElasticSearch集群搭建

    前面几课我们已经把ES的基本概念和查询了解了,大家知道ES的核心优势就是天生支持分布式,所以,这课我们专门讲讲怎么搭建实现ES的集群部署. ES分布式原理 1.es分布式概念 主分片(Primary ...

随机推荐

  1. redis之hello

    1.创建一个maven工程 2.进入redis官网 https://github.com/xetorthio/jedis 3.找到 <!--导入到pom.xml文件中--><depe ...

  2. 将电脑信息上传到中国移动ONENET平台

    用两个小时做的 可以用在服务器远程运维等环境非常方便 需要源码的可以联系NBDX123

  3. Beta阶段第五篇Scrum冲刺博客-Day4

    1.站立式会议 提供当天站立式会议照片一张 2.每个人的工作 (有work item 的ID),并将其记录在码云项目管理中: 昨天已完成的工作. 张晨晨:目标增加单词收藏功能 郭琪容:学习收藏功能的实 ...

  4. 王家林系列之scala--第69讲:Scala并发编程react、loop代码实战详解

    刚才看了一下,群里王家林老师又更新课程了,真为王老师的勤奋感到佩服,于是迫不及待的下载下来观看学习.本期讲的是关于scala并发编程的react.loop代码实战. 信息来源于 DT大数据梦工厂微信公 ...

  5. caffe 每层结构

    如何在Caffe中配置每一个层的结构 最近刚在电脑上装好Caffe,由于神经网络中有不同的层结构,不同类型的层又有不同的参数,所有就根据Caffe官网的说明文档做了一个简单的总结. 1. Vision ...

  6. JS学习笔记5_DOM

    1.DOM节点的常用属性(所有节点都支持) nodeType:元素1,属性2,文本3 nodeName:元素标签名的大写形式 nodeValue:元素节点为null,文本节点为文本内容,属性节点为属性 ...

  7. 小猴打架(luogu4430)(数论+生成树计数)

    一开始森林里面有\(N\)只互不相识的小猴子,它们经常打架,但打架的双方都必须不是好朋友.每次打完架后,打架的双方以及它们的好朋友就会互相认识,成为好朋友.经过\(N-1\)次打架之后,整个森林的小猴 ...

  8. 控制台API函数----HANDLE、SetConsoleCursorPosition、SetConsoleTextAttribute

    控制台API函数 调用相关文本界面控制的API函数,这些函数可分为三类. 一.用于控制台窗口控制的函数(包括窗口的缓冲区大小.窗口前景字符和背景颜色.窗口标题.大小和位置等): 二.用于控制台输入输出 ...

  9. C# MemoryStream BinaryReader

    不清楚这类东西内部搞什么鬼,直接看代码才舒爽 https://referencesource.microsoft.com/#mscorlib 然后可以在线测试 https://www.tutorial ...

  10. 一步步Cobol 400 上手自学入门教程03 - 数据部

    数据部的作用 程序中涉及到的全部数据(输入.输出.中间)都要在此定义,对它们的属性进行说明.主要描述以下属性: 数据类型(数值/字符)和存储形式(长度) 数据项之间的关系(层次和层号) 文件与记录的关 ...