ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。

以上是百度百科对ES的介绍。本文主要记述在linux环境下安装Elasticsearch及基本的可视化工具sense,并使用ES索引MongoDB中的数据,使我们可以直接通过ES去检索数据库中的数据,使检索速度大大加快,并使用python去完成对ES的检索操作。

环境:ubuntu 14.04, elasticsearch 2.3.4, mongodb 3.2, python 2.7

1.安装ElasticSearch

首先官方文档要求Elasticsearch 至少安装有Java 7. 因此首先确定已经安装有JDK7或以上版本。

安装ElasticSearch非常简单,只需要去官方下载地址https://www.elastic.co/downloads/elasticsearch下载想要安装的版本即可,例如下载2.3.4版本,下载完毕后解压,接着进入bin目录下

 cd elasticsearch-2.3.4/bin

运行

./elasticsearch
接着打开浏览器,输入localhost:9200,如果出现以下信息则启动成功
{
"name" : "Tethlam",
"cluster_name" : "elasticsearch",
"version" : {
"number" : "2.3.4",
"build_hash" : "e455fd0c13dceca8dbbdbb1665d068ae55dabe3f",
"build_timestamp" : "2016-06-30T11:24:31Z",
"build_snapshot" : false,
"lucene_version" : "5.5.0"
},
"tagline" : "You Know, for Search"
}

2.安装kibana和sense

kibana是ES的可视化工具,功能强大,sense是kibana的一个插件,使用sense可以直接在浏览器里完成对ES的基本操作。
    首先安装kibana,安装方法与ES一样,首先下载想要的版本https://www.elastic.co/downloads/kibana,然后解压,进入bin目录,运行以下命令安装sense

 ./bin/kibana plugin --install elastic/sense
安装成功后运行 ./bin/kibana
打开浏览器,输入http://localhost:5601/app/sense即可进入sense 至此一个基本的ES环境就安装完成了

3.安装mongo-connector

接下来我们要使用ES去检索mongodb中的数据,这样首先需要用ES去同步存储在mongodb中数据,创建这些数据的索引。完成这一步工作需要使用的工具是mongo-connector,这是mongodb官方开发的一个非正式工具。

使用mongo-connector同步数据首先需要确保mongodb为副本集,这一步是必不可少的,因为ES是通过mongodb的oplog去建立索引,如果不是副本集就没有oplog,当然也就无法建立索引了,至于如何建立mongodb副本集请自行查阅mongodb文档。

可以使用pip直接安装mongo-connector:

 pip install mongo-connector

然后下载 https://github.com/mongodb-labs/elastic2-doc-manager,接着可以直接运行以下命令完成数据同步
mongo-connector -m localhost:27017 -t localhost:9200 -d elastic2_doc_manager
注意如果使用的ES为1.x版本需要下载 https://github.com/mongodb-labs/elastic-doc-manager并运行
mongo-connector -m localhost:27017 -t localhost:9200 -d elastic_doc_manager

其中-m之后的参数为数据库地址,-t之后为ES地址,这样就完成了同步

4.用python操作ES

最后我们要使用python操作ES,对此ES本身提供了python client,同样使用pip即可安装

 pip install elasticsearch

接着可以使用以下代码测试
from elasticsearch import Elasticsearch
es = Elasticsearch() # ignore 400 cause by IndexAlreadyExistsException when creating an index
es.indices.create(index='test-index', ignore=400) # ignore 404 and 400
es.indices.delete(index='test-index', ignore=[400, 404])

更多信息请参考官方文档

相关链接:ES官方文档https://www.elastic.co/guide/index.html

mongo-connector文档https://github.com/mongodb-labs/mongo-connector/wiki/Usage-with-ElasticSearch

Elasticsearch python client文档https://elasticsearch-py.readthedocs.io/en/master/api.html#elasticsearch

搭建ElasticSearch+MongoDB检索系统的更多相关文章

  1. 一文教您如何通过 Docker 快速搭建各种测试环境(Mysql, Redis, Elasticsearch, MongoDB) | 建议收藏

    欢迎关注个人微信公众号: 小哈学Java, 文末分享阿里 P8 高级架构师吐血总结的 <Java 核心知识整理&面试.pdf>资源链接!! 个人网站: https://www.ex ...

  2. 用ElasticSearch,LogStash,Kibana搭建实时日志收集系统

    用ElasticSearch,LogStash,Kibana搭建实时日志收集系统 介绍 这套系统,logstash负责收集处理日志文件内容存储到elasticsearch搜索引擎数据库中.kibana ...

  3. 快速搭建应用服务日志收集系统(Filebeat + ElasticSearch + kibana)

    快速搭建应用服务日志收集系统(Filebeat + ElasticSearch + kibana) 概要说明 需求场景,系统环境是CentOS,多个应用部署在多台服务器上,平时查看应用日志及排查问题十 ...

  4. Docker搭建ElasticSearch+Redis+Logstash+Filebeat日志分析系统

    一.系统的基本架构 在以前的博客中有介绍过在物理机上搭建ELK日志分析系统,有兴趣的朋友可以看一看-------------->>链接戳我<<.这篇博客将介绍如何使用Docke ...

  5. 孤荷凌寒自学python第六十一天在Fedora28版的linux系统上找搭建本地Mongodb数据服务

    孤荷凌寒自学python第六十一天在Fedora28版的linux系统上找搭建本地Mongodb数据服务 (完整学习过程屏幕记录视频地址在文末) 今天是学习mongoDB数据库的第七天.成功在本地搭建 ...

  6. 孤荷凌寒自学python第六十天在windows10上搭建本地Mongodb数据服务

     孤荷凌寒自学python第六十天在windows10上找搭建本地Mongodb数据服务 (完整学习过程屏幕记录视频地址在文末) 今天是学习mongoDB数据库的第六天.成功在本地搭建了windows ...

  7. 搭建ELK日志分析平台(上)—— ELK介绍及搭建 Elasticsearch 分布式集群

    笔记内容:搭建ELK日志分析平台(上)-- ELK介绍及搭建 Elasticsearch 分布式集群笔记日期:2018-03-02 27.1 ELK介绍 27.2 ELK安装准备工作 27.3 安装e ...

  8. (转)搭建Elasticsearch和kibana环境

    搭建Elasticsearch和kibana环境 作者:IT云清 原文:https://blog.csdn.net/weixin_39800144/article/details/81162002 1 ...

  9. centos7搭建EFK日志分析系统

    前言 EFK可能都不熟悉,实际上EFK是大名鼎鼎的日志系统ELK的一个变种 在没有分布式日志的时候,每次出问题了需要查询日志的时候,需要登录到Linux服务器,使用命令cat -n xxxx|grep ...

随机推荐

  1. 我眼中的ASP.NET Core之微服务

    ### 前言 前几天在博客园看到有园友在分享关于微软的一个微服务架构的示例程序,想必大家都已经知道了,那就是[eShopOnContainers](https://github.com/dotnet- ...

  2. Example016实现下拉框

    <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...

  3. 容器如何访问外部世界?- 每天5分钟玩转 Docker 容器技术(36)

    前面我们已经解决了容器间通信的问题,接下来讨论容器如何与外部世界通信.这里涉及两个方向: 容器访问外部世界 外部世界访问容器 容器访问外部世界 在我们当前的实验环境下,docker host 是可以访 ...

  4. CentOS6.4虚拟机设置固定IP、安装JDK、Tomcat、Redis并部署web项目

    一.CentOS设置固定IP 1.直接修改配置文件的方式,原文地址:http://www.cnblogs.com/zhja/p/3964159.html (1)首先获取你的GATEWAY 方便后面在c ...

  5. VB6之GDI+加载PNG图片

    原生的VB6不支持PNG个图片,因为刚有VB的时候还没有PNG的概念呢.不过,利用GDI+加载解析个PNG简直是砍瓜切菜般简单. GDI+的模块是我在网上下载的,地址应该是:http://vistas ...

  6. Luogu 1559 运动员最佳匹配问题(带权二分图最大匹配)

    Luogu 1559 运动员最佳匹配问题(带权二分图最大匹配) Description 羽毛球队有男女运动员各n人.给定2 个n×n矩阵P和Q.P[i][j]是男运动员i和女运动员j配对组成混合双打的 ...

  7. Python之MRO及其C3算法

    [<class '__main__.B'>, <class '__main__.A'>, <class 'object'>] (<class '__main_ ...

  8. 禁用Ubuntu 15.04登录界面显示客人会话

    在控制台打开如下配置文件,如果没有就自己创建一个: sudo vi /etc/lightdm/lightdm.conf 向文件中添加如下内容: [SeatDefaults] greeter-sessi ...

  9. Android开发相关操作

    命令行启动DDMS工具,前提是有这个工具 ~/rustsoftware/adt-bundle-linux-x86_64-20140702/sdk/tools$ ./ddms 查看机器内存情况: adb ...

  10. python全栈阶段测试(一)

    1.执行Python脚本的两种方式 如果想要永久保存代码,就要用文件的方式 如果想要调试代码,就要用交互式的方式 2.Pyhton单行注释和多行注释分别用什么? 单行注释:# 多行注释: '' &qu ...