elasticsearch配置集群+elk报错总结

配置ELK的时候，我平常遇到了以下几种报错情况，整理如下（持续更新中）：

elasticsearch启动失败

# systemctl start elasticsearch

Job for elasticsearch.service failed because the control process exited with error code. See "systemctl status elasticsearch.service" and "journalctl -xe" for details.

#这个时候，直接查看系统日志，因为elasticsearch没有专门的日志审计

tail -f /var/log/messages

出现如下报错

Dec 13 10:16:30 oldboy elasticsearch: ERROR: [1] bootstrap checks failed

Dec 13 10:16:30 oldboy elasticsearch: [1]: initial heap size [536870912] not equal to maximum heap size [775946240]; this can cause resize pauses and prevents mlockall from locking the entire heap

其实提示已经很明显了，jvm给的内存不足，那么我们直接把内存调大就可以了

#修改jvm内存大小

# vim /etc/elasticsearch/jvm.options

-Xms1500m

-Xms1500m

#因为刚才把内存改的很小，改回来就行了

如果不是使用的systemd方法启动，直接调用bin/elasticsearch 启动，那么有几点需要注意

#1.不能使用root进行登录

useradd elk #创建用户elk

#2.将涉及的用户权限赋予elk

kibana显示中文乱码

#首先查看要拉取的日志的格式是什么

file file.txt  #在linux上查看

以记事本打开log文件，点击另存为查看，如果显示为ANSI，那么就是gbk  #在windows上查看

#在filebeat中配置字符集

# vim /etc/filebeat/filebeat.yml

filebeat.inputs:

- type: log

  enabled: true

  paths:

    - c:\work\CA*

  encoding: gbk   #此处加入字符格式，如果是utf8，那么不需要添加

继续生成测试日志，登录kibana查看，发现中文字符已经正常显示，没有乱码了。

es集群配置xpack启动后，创建密码失败

[root@db01 elasticsearch]# bin/elasticsearch-setup-passwords interactive

Failed to determine the health of the cluster running at http://10.0.0.200:9200

Unexpected response code [503] from calling GET http://10.0.0.200:9200/_cluster/health?pretty

Cause: master_not_discovered_exception

It is recommended that you resolve the issues with your cluster before running elasticsearch-setup-passwords.

It is very likely that the password changes will fail when run against an unhealthy cluster.

Do you want to continue with the password setup process [y/N]y

Initiating the setup of passwords for reserved users elastic,apm_system,kibana,logstash_system,beats_system,remote_monitoring_user.

You will be prompted to enter passwords as the process progresses.

Please confirm that you would like to continue [y/N]y

#错误原因，因为脏数据的原因，当开始xpack的时候，集群链接失败

#终极大招（只适用于初始创建集群，或者测试环境）

1.停止服务

2.删除数据目录

3.三个节点只配置xpack.security.enabled: true,启动

4.设置密码

#配置文件（三台除了ip之外都一样）

cluster.name: think

node.name: node-1

path.data: /var/lib/elasticsearch

path.logs: /var/log/elasticsearch

bootstrap.memory_lock: true

network.host: 10.0.0.200,127.0.0.1

http.port: 9200

discovery.seed_hosts: ["10.0.0.200", "10.0.0.201"]

cluster.initial_master_nodes: ["10.0.0.200", "10.0.0.201","10.0.0.202"]

http.cors.enabled: true

http.cors.allow-origin: "*"

xpack.security.enabled: true

#测试效果

[root@db01 elasticsearch]# bin/elasticsearch-setup-passwords interactive

Initiating the setup of passwords for reserved users elastic,apm_system,kibana,logstash_system,beats_system,remote_monitoring_user.

You will be prompted to enter passwords as the process progresses.

Please confirm that you would like to continue [y/N]y

Enter password for [elastic]:

Reenter password for [elastic]:

Enter password for [apm_system]:

Reenter password for [apm_system]:

Enter password for [kibana]:

Reenter password for [kibana]:

Enter password for [logstash_system]:

Reenter password for [logstash_system]:

Enter password for [beats_system]:

Reenter password for [beats_system]:

Enter password for [remote_monitoring_user]:

Reenter password for [remote_monitoring_user]:

Changed password for user [apm_system]

Changed password for user [kibana]

Changed password for user [logstash_system]

Changed password for user [beats_system]

Changed password for user [remote_monitoring_user]

Changed password for user [elastic]

#成功

4.隔天上班又出现和标题3同样的情况，如下解决方案

#直接配上ca证书验证，开启ssl

# 设置默认的角色密码

bin/elasticsearch-setup-passwords interactive  #这一步我是不成功的，不过标题3已经创建过了，所以跳过

再elasticsearch.yml加入如下

xpack.security.transport.ssl.enabled: true

xpack.security.transport.ssl.verification_mode: certificate # 证书验证级别

xpack.security.transport.ssl.keystore.path: certs/elastic-certificates.p12 # 节点证书路径

xpack.security.transport.ssl.truststore.path: certs/elastic-certificates.p12

#创建证书

# 创建keystore文件

# bin/elasticsearch-keystore create # config文件夹下有的话这一步就不用再执行了

# 生成CA证书，一直回车

bin/elasticsearch-certutil ca (CA证书：elastic-stack-ca.p12)

# 生成节点使用的证书，一直回车

bin/elasticsearch-certutil cert --ca elastic-stack-ca.p12  (节点证书：elastic-certificates.p12)

# 创建证书保存目录，并移动到config文件下

mkdir -p /etc/elasticsearch/certs

mv elastic-certificates.p12 /etc/elasticsearch/certs

chmod 777 /etc/elasticsearch/certs   #不给授权就无法登录，可以自己测测到底给多少合适

#重启

elasticsearch配置集群+elk报错总结的更多相关文章

elasticsearch集群搭建报错： not enough master nodes discovered during pinging
自己用一台阿里云服务器搭建ES集群的时候,总是报上面的问题. 而且两个ES服务都是报同样的问题.自己的配置文件如下: es服务1配置文件 cluster.name: elasticsearch ...
IMPI Python集群运行报错:
Intel MPI环境利用hostfile多主机运行下报错 HYDU_process_mfile_token (../../utils/args/args.c:523): token slots no ...
执行redis命令redis-trib.rb查看集群信息报错cannot load such file -- redis (LoadError)
问题描述: 在执行redis-trib.rb命令查看集群状态的时候,报错: [aiprd@hadoop1 ~]$ redis-trib.rb check Traceback (most recent ...
ceph-deploy离线部署ceph集群及报错解决FAQ
ceph-deploy部署ceph集群环境介绍主机名 ip地址操作系统角色备注 ceph-node1 10.153.204.13 Centos7.6 mon.osd.mds.mgr.rgw. ...
rabbimq集群搭建报错：Error: unable TO perform an operation ON node 'rabbit@test3'. Please see diagnostics information AND suggestions below.
在搭建rabbitmq集群的时候,添加内存节点时,抛出异常:Error: unable TO perform an operation ON node 'rabbit@test3'. Please s ...
Redis集群创建报错
Redis集群环境:och163/och164/och165 在执行如下脚本时报错: ./src/redis-trib.rb create 10.1.253.163: 10.1.253.164: 10 ...
Elasticsearch配置集群环境
环境选择: 1.方案一:准备三台机器每一台机器一个节点 2.方案二:准备一台机器启动三个节点,用端口号区分即可 3.ES启 ...
HBase 2.1.3 集群 web 报错InvalidProtocolBufferException 解决方法
搭建好HBase 集群后,各种后台进程都正常,搭建手册参考: Hbase 2.1.3 集群搭建手册https://www.cndba.cn/dave/article/3322 但是通过web访问,却报 ...
【问题集】redis集群set报错(error) MOVED 11469 192.168.181.201:7002
没有启动集群模式(即缺少了那个"-c"): redis-cli -c -h yourhost -p yourpost

随机推荐

Eclipse 常用快捷键-java
(转自https://www.runoob.com/w3cnote/eclipse-shortcut-keys.html) Eclipse有强大的编辑功能, 工欲善其事,必先利其器, 掌握Eclips ...
VS2019已还原ReSharper的功能
本文只谈论 ReSharper 的那些常用功能中,Visual Studio 2019 能还原多少,主要提供给那些正在考虑不使用 ReSharper 插件的 Visual Studio 用户作为参考. ...
SQLAlchemy--基本增删改查
目录简介安装组成部分简单使用执行原生sql(不常用) orm使用(重点) 常用数据类型 Column常用参数常用操作(CURD) 创建映射类的实例创建会话Session 增加add()/ ...
JVM指令手册
JVM指令大全常量入栈指令指令码操作码(助记符) 操作数描述(栈指操作数栈) 0x01 aconst_null null值入栈. 0x02 iconst_m1 -1(int)值入栈. 0x03 ...
我脑中的JVM大全附带Java8的特性
Java虚拟机-sun classic vm 世界上第一款商用的Java虚拟机. 只能使用纯解释器的方式来执行Java代码. Java虚拟机-ExactVM Exact Memory Manageme ...
基于hashlib下的文件校验
hashlib不仅可以对密码进行加密也可以对文件内容进行校验,传统的小文件校验通过人为校验是不现实的,如果摸个文件里面的内容多出一个空格的话那么哦是根本就不知道的因此我们需要一个可以校验文件的方法,而 ...
初识.netCore以及如何vs2019创建项目和发布
一:什么是.netCore 从图上得知,.NetCore是同.NetFramework一样也是一种框架,并且都是基于.Net Standard Library,前面我们有用过.netFramwork来 ...
关于VS2015 发布.net mvc 网站失败的问题
问题:VS生成成功,发布失败,在“正在连接到***文件夹”处就不能继续了.. 项目开发告一段落,准备部署到服务器上进行最后测试,但是始终发布失败生成成功,发布失败,没有任何提示信息一开始以为是文 ...
odoo10学习笔记十五：仪表板
转载请注明原文地址:https://www.cnblogs.com/ygj0930/p/11189353.html 仪表盘可以通过外部ID引用其他视图文件的内容,整合到一个界面进行显示. 一:建立仪表 ...
SpringBoot整合Fastdfs，实现图片上传（IDEA）
我们部署Fastdfs,就是为了实现文件的上传. 现在使用idea整合Fastdfs,实现图片上传部署环境:Centos7部署分布式文件存储(Fastdfs) 利用Java客户端调用FastDFS ...

elasticsearch配置集群+elk报错总结

配置ELK的时候，我平常遇到了以下几种报错情况，整理如下（持续更新中）：

elasticsearch配置集群+elk报错总结的更多相关文章

随机推荐

热门专题