mongo-connector导入数据到Es

要求

基于mongo-connector同步数据，必须要求mongodb为复制集架构，原因是此插件是基于oplog操作记录进行数据同步的；而oplog可以说是Mongodb Replication的纽带。具体参见： http://www.mongoing.com/oplog

启动复制集: ./bin/mongod --dbpath /path/to/database --logpath /path/to/log --fork --port 27017 --replSet rs0
配置：

rsconf = {

    _id:'rs0',

    members:

    [

        {_id:,

        host:'192.168.111.11:27017'

        }

    ]

}

初始化配置：rs.initiate(rsconf)

安装相关插件

本机环境phthon2.6，如果没有pip命令，执行easy_install pip，安装pip；如果easy_install也没有，就用它：sudo yum install python-setuptools

pip install mongo-connector
pip install elastic_doc_manager

开始同步

mongo-connector -m localhost:27017 -t eshost:9200 -d elastic_doc_manager

在mongodb中插入数据:db.infos.insert({"message":"测试日志"})
es中查看

问题

ReadTimeoutError(HTTPConnectionPool(host=u'', port=9200): Read timed out. (read timeout=10))

找到/usr/lib/python2.6/site-packages/mongoconnector/docmanagers目录下：elasticdocmanager.py
修改self.elastic = Elasticsearch(hosts=url,**client_options)
修改为self.elastic = Elasticsearch(hosts=url, timeout=200,**client_options)即可

具体配置参数详见：

测试

mongodb导入20多万条数据：

mongoimport --db shakespeare --collection shakespearedata --file wenjian.json --host 0.0.0.0:27017

mongo-connector同步了2分钟左右；暂时没有发现其他问题！

mongo-connector导入数据到Es的更多相关文章

[大数据]-Logstash-5.3.1的安装导入数据到Elasticsearch5.3.1并配置同义词过滤
阅读此文请先阅读上文:[大数据]-Elasticsearch5.3.1 IK分词,同义词/联想搜索设置,前面介绍了ES,Kibana5.3.1的安装配置,以及IK分词的安装和同义词设置,这里主要记录L ...
使用json文件给es中导入数据
使用json文件可以给es中导入数据,10万条左右的数据可以一次导入,数量太大时导入就会报错.大数量的到导入还是需要用bulk方式. accounts.json文件格式如下: {"index ...
转:使用Mongo Connector和Elasticsearch实现模糊匹配
原文来自于:http://www.csdn.net/article/2014-09-01/2821485-how-to-perform-fuzzy-matching-with-mongo-connec ...
使用Logstash来实时同步MySQL数据到ES
上篇讲到了ES和Head插件的环境搭建和配置,也简单模拟了数据作测试本篇我们来实战从MYSQL里直接同步数据一.首先下载和你的ES对应的logstash版本,本篇我们使用的都是6.1.1 下载后使 ...
使用Sqoop从MySQL导入数据到Hive和HBase 及近期感悟
使用Sqoop从MySQL导入数据到Hive和HBase 及近期感悟 Sqoop 大数据 Hive HBase ETL 使用Sqoop从MySQL导入数据到Hive和HBase 及近期感悟基础环境 ...
Logstash导入数据到ElasticSearch
一:在Windows环境 1 下载解压Logstash的压缩包 2 在Logstash的压缩包中安装Logstash-jdbc-input插件: 在Bin命令行下运行命令: .\logstash-pl ...
使用kettle来根据时间戳或者批次号来批量导入数据，达到增量的效果。
1.Kettle是一款国外开源的ETL工具,纯java编写,可以在Window.Linux.Unix上运行,数据抽取高效稳定.下载图形化界面的zip包格式的,直接解压缩使用即可.安装部署模式这里不说了 ...
安装配置elasticsearch、安装elasticsearch-analysis-ik插件、mysql导入数据到elasticsearch、安装yii2-elasticsearch及使用
一.安装elasticsearch 获取elasticsearch的rpm:wget https://download.elastic.co/elasticsearch/release/org/ela ...
教程 | 使用Sqoop从MySQL导入数据到Hive和HBase
基础环境 sqoop:sqoop-1.4.5+cdh5.3.6+78, hive:hive-0.13.1+cdh5.3.6+397, hbase:hbase-0.98.6+cdh5.3.6+115 S ...

随机推荐

51nod 1105 第K大的数【双重二分/二分套二分/两数组任意乘积后第K大数】
1105 第K大的数基准时间限制:1 秒空间限制:131072 KB 分值: 40 难度:4级算法题收藏关注数组A和数组B,里面都有n个整数.数组C共有n^2个整数,分别是A[0] * ...
CodeForces - 16E Fish
Discription n fish, numbered from 1 to n, live in a lake. Every day right one pair of fish meet, and ...
[转] makeFile文件作用
源文件地址 makefile关系到了整个工程的编译规则.一个工程中的源文件不计数,其按类型.功能.模块分别放在若干个目录中,makefile定义了一系列的规则来指定,哪些文件需要先编译,哪些文件需要后 ...
Mac环境下svn命令行的使用
在Windows环境中,我们一般使用TortoiseSVN来搭建svn环境.在Mac环境下,由于Mac自带了svn的服务器端和客户端功能,所以我们可以在不装任何第三方软件的前提下使用svn功能,不过还 ...
zabbix-agent安装报错
最近接触了zabbix,觉得挺好用的,再一次安装agent的过程中,报了如下错误: [root@11005499 ~]# yum install zabbix-agent -y ... groupad ...
如何简单去掉dede后台的验证码 dedecms5.7 验证码怎么去掉
很多朋友都在找,如何去掉dede后台的验证码,每次登陆都很繁琐. 现在教大家一个dedecms5.7 验证码怎么去掉的最直接的方法: 在dedecms5.7[验证码安全设置]里,说修改后 ...
【dubbo】服务提供者运行的三种方式
[dubbo]服务提供者运行的三种方式学习了:https://blog.csdn.net/yxwb1253587469/article/details/78712451 1,使用容器: 2,使用自建 ...
Flak快速上手
本文介绍如何上手 Flask . 这里假定你已经安装好了 Flask ,否则请先阅读< 安装>. 如果已安装好Flask,通过以下命令查看一个简单的例子: from flask impo ...
知其一不知其二之Jenkins Hacking
转自安全脉搏本文首发安全脉搏感谢大王叫我来巡山的投递转载请注明来源大多安全工作者听到jenkins都会知道有个未授权的命令执行但是如果Script页面要授权才能访问呢或者你的用户没有Ov ...
移动端弹窗 layer.js 使用
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...