部署elasticsearch遇到的问题

为增加搜索功能，最近在自己的服务器上部署elasticsearch，折腾一下，把注意的问题记录一下。

1. 因为最近的es5.5.2要求java1.8，所以确保java版本正确.

2. 我的服务器只有1G内存，如果使用默认elasticsearch设置，会出现内存不足的情况，所以需要把jvm的内存调小：

在elasticsearch-5.5.2/config/jvm.options内把jvm初始堆和最大使用内存大小都设为512m：

-Xms512m

-Xmx512m

这个时候可以正常启动es了。

以下部分是扩展.

3. 我的博客数据存在mysql，要把里面的数据同步给es索引，用到logstash-jdbc，这是一个单独的组件，最新也是5.5.2，同样的，把logstash 的jvm的内存调小：

在logstash-5.5.2/config/jvm.options 内设为如下：

-Xms512m

-Xmx512m

4. 在logstash-5.5.2/bin/下建立配置文件：jdbc.conf

# The # character at the beginning of a line indicates a comment. Use

# comments to describe your configuration.

input {

    jdbc {

        # mysql jdbc connection string to our backup databse  后面的test对应mysql中的test数据库

        jdbc_connection_string => "jdbc:mysql://localhost:3306/blog"

        # the user we wish to excute our statement as

        jdbc_user => "root"

        jdbc_password => "密码"

        # the path to our downloaded jdbc driver

        jdbc_driver_library => "/var/mysql-connector-java-5.1.44-bin.jar"

        # the name of the driver class for mysql

        jdbc_driver_class => "com.mysql.jdbc.Driver"

        jdbc_paging_enabled => "true"

        jdbc_page_size => "50000"

        #以下对应着要执行的sql的绝对路径。

        statement_filepath => "/var/ogstash-5.5.2/bin/jdbc.sql"

        #定时字段 各字段含义（由左至右）分、时、天、月、年，全部为*默认含义为每分钟都更新（测试结果，不同的话请留言指出）

        schedule => "* * * * *"

        #设定ES索引类型

        type => "article"

  }

}

filter {

   mutate {

         gsub => ["content", "(<.+?>)", ""]

         gsub => ["content", "&nbsp;", ""]

    }

}

output {

    elasticsearch {

        #ESIP地址与端口

        hosts => "localhost:9200"

        #ES索引名称（自己定义的）

        index => "tornado-blog"

        #自增ID编号

        document_id => "%{id}"

    }

    stdout {

        #以JSON格式输出

        codec => json_lines

    }

}

这里需要注意的是在filter里的配置，要把html标签去除掉再去给es索引。

其中，指定的jdbc.sql内容如下：

select

  *

from article where date_add(up_date, interval -8 hour) >= :sql_last_value

之所以要用date_add函数把时间差8个小时，是因为es里是用的utc标准时间，所以为了增加更新，需要把时间也变成utc时间，不然时间总是比上次同步的时间大，es会每次都会索引。

5. 启动es，logstash

./elasticsearch > log.txt 2>&1 &

./logstash -f jdbc.conf > log.txt 2>&1 &

之所以不用-d选项，是因为在使用中发现使用-d会使的服务器频繁使用swap分区，造成服务器反应慢，反而是这种&方式不会引起服务器变慢的问题.

部署elasticsearch遇到的问题的更多相关文章

Docker部署Elasticsearch集群
http://blog.sina.com.cn/s/blog_8ea8e9d50102wwik.html Docker部署Elasticsearch集群参考文档: https://hub.docke ...
【原创】大数据基础之Ambari（2）通过Ambari部署ElasticSearch（ELK）
ambari2.7.3(hdp3.1) 安装 elasticsearch6.3.2 ambari的hdp中原生不支持elasticsearch安装,下面介绍如何通过mpack方式使ambari支持el ...
Azure vm 扩展脚本自动部署Elasticsearch集群
一.完整过程比较长,我仅给出Azure vm extension script 一键部署Elasticsearch集群的安装脚本,有需要的同学,可以邮件我,我给你完整的ARM Template 如果你 ...
Centos8 部署 ElasticSearch 集群并搭建 ELK，基于Logstash同步MySQL数据到ElasticSearch
Centos8安装Docker 1.更新一下yum [root@VM-24-9-centos ~]# yum -y update 2.安装containerd.io # centos8默认使用podm ...
Centos8 Docker部署ElasticSearch集群
ELK部署部署ElasticSearch集群 1.拉取镜像及批量生成配置文件 # 拉取镜像 [root@VM-24-9-centos ~]# docker pull elasticsearch:7. ...
日志分析系统 - k8s部署ElasticSearch集群
K8s部署ElasticSearch集群 1.前提准备工作 1.1 创建elastic的命名空间 namespace编排文件如下: elastic.namespace.yaml --- apiVers ...
Docker 08 部署Elasticsearch
参考源 https://www.bilibili.com/video/BV1og4y1q7M4?spm_id_from=333.999.0.0 https://www.bilibili.com/vid ...
ES 02 - 部署Elasticsearch单机服务 + 部署中的常见问题
目录 1 准备工作 1.1 安装JDK 1.2 下载安装包 1.3 创建elastic用户 2 启动ES服务 2.1 修改配置文件 2.2 启动服务 3 验证ES服务是否可用 4 关闭与重启服务 4. ...
Linux服务器部署 Elasticsearch 成功，本机却访问不了
Elasticsearch版本: elasticsearch- 服务器版本: CentOS release 6.8 (Final) 问题: Linux服务器上部署了 Elasticsearch 5.5 ...

随机推荐

ADT图及图的实现及图的应用
图: 图中涉及的定义: 有向图: 顶点之间的相关连接具有方向性: 无向图: 顶点之间相关连接没有方向性: 完全图: 若G是无向图,则顶点数n和边数e满足:0<=e<=n(n-1)/2,当e ...
网页访问过程(基于CDN)
1. 全局负载均衡(基于DNS) 如果有多台 WEB 服务器同时为一个域名提供服务时,即一条 URL 对应多个 IP 地址,那么该 URL 的权威域名服务器可能会根据该 URL 解析出多个 IP 地址 ...
Nagios学习笔记
1 Nagios功能 1.1 监控工具 1.2 可以监控主机/服务或者资源 1.3 四种状态值 OK,WARNING,CRITICAL,UNKNOWN CPU:90%(CRITICAL),80% ...
ZooKeeper-基础介绍
What is ZooKeeper? ZooKeeper为分布式应用设计的高性能(使用在大的分布式系统).高可用(防止单点失败).严格地有序访问(客户端可以实现复杂的同步原语)的协同服务. ZooKe ...
ansible部署(pip安装)
centos7 pip安装 ansible 首先ansible基于python2.X 环境默认centos都已经安装好了python2环境安装可选性 ansible可以通过源码,yum,pip等方 ...
查看Mysql正在执行的事务、锁、等待
一.关于锁的三张表(MEMORY引擎) ## 当前运行的所有事务 mysql> select * from information_schema.innodb_trx\G; ********** ...
Ansible基础概述
一.Ansible简介 Ansible基于Python语言实现,由paramiko和PyYAML两个关键模块构建.Ansible的编排引擎可以出色地完成配置管理,流程控制,资源部署等多方面工作.Ans ...
使用msbuild.exe绕过应用程序白名单（多种方法）
一.MSbuild.exe简介 Microsoft Build Engine是一个用于构建应用程序的平台.此引擎也被称为msbuild,它为项目文件提供一个XML模式,该模式控制构建平台如何处理和 ...
linux内核分析第七周读书笔记
第七章链接 1.链接是将各种代码和数据部分收集起来并组合成为一个单一文件的过程,这个文件可被加载到存储器并执行. 2.链接可以执行于编译时,加载时,运行时. 7.1编译器驱动程序 1.大多数编译系统 ...
Reactor模式，或者叫反应器模式 - 为什么用多路io复用提供吞吐量
Reactor这个词译成汉语还真没有什么合适的,很多地方叫反应器模式,但更多好像就直接叫reactor模式了,其实我觉着叫应答者模式更好理解一些.通过了解,这个模式更像一个侍卫,一直在等待你的召唤,或 ...

部署elasticsearch遇到的问题

部署elasticsearch遇到的问题的更多相关文章

随机推荐

热门专题