Doris再次启动FE失败的思考

背景描述

在昨天已经成功下载安装最新稳定版docker、拉取doris-0.15.0版本的镜像、将镜像挂载道本地Doris源码目录、完成了doris的编译之后,今天在继续按照文档进行集群部署时,基本没遇到什么问题,后面在查看be节点状态时发现hadoop102节点的可用空间只有3个G,便想给hadoop102集群扩容

问题描述

直接关掉虚拟机后,删除所有快照(不删不让在VMvare的设置里面修改虚拟机的空间),然后将空间从50G改到了80G--(后来才知道在设置里面扩展的是虚拟磁盘空间)--,重启时出现的一个问题也都解决了,但是hadoop102节点的状态发生了改变,回退了很多操作,导致我需要重新给他配置并启动doris,我从其他节点直接拷贝配置文件过来,然后运行fe报错,运行其他节点的fe也会报错

问题原因

Centos7磁盘空间扩容操作不规范,删掉所有快照,回退了操作,导致集群出现故障

Centos7磁盘空间扩容

报错信息

一、FE启动失败,fe.log 中一直滚动如下信息:

wait catalog to be ready. FE type UNKNOWN

听说是因为doris暂时不支持ip变动,因为fe主节点ip变化 导致无法启动,换个版本重新编译一遍,再部署一次就好了

二、尝试使用Mysql客户端连接Doris时报错

Lost connection to MySQL server at 'reading initial communication packet', system error: 0

通常是因为编译 FE 时使用的 jdk 版本和运行 FE 时使用的 jdk 版本不同导致的。



三、启动FE时,使用jps命令看不到进程,查看日志

java.lang.Suchmethoderror: java.nio. ByteBuffer. limit (I)Ljava/nio/ByteBuffer;

Docker 里默认是 JDK 11,如果您的安装环境是使用 JDK8 ,需要在 Docker 里 JDK 环境切换成 JDK8



四、启动FE错误:

找不到或无法加载主类 org.apache.doris.PaloFe

思路可以



尚未解决

Doris官方常见报错处理指导文档

问题相似,可以参考

他的问题是FE挂掉后,启动不起来了



这个关系不大

可能有点用

思考

一、

我用docker build编译完doris后(编译前我有将Docker镜像挂载到本地),关机或重启节点,我还需要去重新启动一下docker吗?还是去本地挂载目录下直接配置运行doris

二、如果恢复到刚扩容重启的时候你会怎么做?

是向往常一样死马当活马医,看到一个解决方法就拿来试试,还是捋顺思路后再动手,没搞清楚问题本质前,宁可搁置,也不让事态继续恶化

其他问题

问题描述

直接在VMvare里面通过设置扩展虚拟磁盘的容量,重启虚拟机时遇到的问题

错误信息

重启后命令行提示如下:

generating “/run/initramfs/rdsosreport.txt”
entering emergencymode. exit the shell to continue
type “journalctl” to view system logs.
you might want to save “/run/initramfs/rdsosreport.txt” to a usb stick or /boot after mounting them and attach it to a bug report。

解决方法

查看设备的信息

# ls /dev/mapper/

这里会显示三个设备,其中有一个: xxxx-root,我的虚拟机是:rhel-root

问题修复:

# xfs_repair /dev/mapper/rhel-root

上述命令执行后,提示: xxxx busy...(大致意思就是:那块设备正在被使用)

此时,需要尝试先卸载那块设备。

# umount /rhel-root

卸载之后,在此尝试修复(此时可以正常修复)

# xfs_repair /dev/mapper/rhel-root

上述命令不能修复,需要添加参数 -L

# xfs_repair /dev/mapper/rhel-root -L

Doris 再次启动FE失败的思考的更多相关文章

  1. 启动OracleDBConsoleorcl失败,提示错误代码2

    异常问题: 启动OracleDBConsoleorcl失败,提示错误代码2 原因分析: 由于更改计算机名导致的异常 解决方法: 1.管理员权限cmd下执行emctl start dbconsole 2 ...

  2. 完全关闭及再次启动cdh集群

    关闭集群 - 关闭集群所有组件 关闭Cloudera Management Service 关闭cdh所有客户端节点 sudo /opt/cloudera-manager/cm-5.11.1/etc/ ...

  3. 启动OpenVPN失败

    启动OpenVPN失败 文:铁乐与猫 [root@yunwei_OpenVPN openvpn]# systemctl status openvpn ● openvpn.service - LSB: ...

  4. MyEclipse 启动 tomcate 失败 解决方法

    MyEclipse中启动tomcate失败 十月 20, 2015 9:53:04 下午 org.apache.catalina.startup.VersionLoggerListener log信息 ...

  5. unity3D Socket连接C#server出现unity3D编辑器再次启动连接 unity3D编辑器马上卡死

    unity3D Socket与C#server第一次连接时通讯正常.客服端段关闭后.unity3D编辑器再次启动连接 unity3D编辑器马上卡死 原因是Socket处于异步状态,而异步线程是不受Un ...

  6. Tomcat学习笔记 - 错误日志 - NetBeans配置tomcat出错情况总结 -- 部署错误: 启动 Tomcat 失败。-- '127.0.0.1' 不是内部或外部命令,也不是可运行的程序

    真的管用,不知道为啥管用.转载自:http://blog.sina.com.cn/s/blog_709548200102vgy4.html 问题描述: 新安装的NetBeans8.0.2,安装过程中还 ...

  7. centos7 启动docker失败的解决

    控制端使用yum install docker安装完成docker后启动docker失败,出现以下信息: Job for docker.service failed because the contr ...

  8. Linux_解决启动网卡失败 Device eth0 does not seem to be present

    Linux_解决启动网卡失败  Device eth0 does not seem to be present 虚拟机克隆  发现service network restart 启动失败 故障现象: ...

  9. 删除了原有的offset之后再次启动会报错park Streaming from Kafka has error numRecords must not ...

          笔者使用Spark streaming读取Kakfa中的数据,做进一步处理,用到了KafkaUtil的createDirectStream()方法:该方法不会自动保存topic parti ...

  10. Android Bug分析系列:第三方平台安装app启动后,home键回到桌面后点击app启动时会再次启动入口类bug的原因剖析

    前言 前些天,测试MM发现了一个比较奇怪的bug. 具体表现是: 1.将app包通过电脑QQ传送到手机QQ上面,点击安装,安装后选择打开app (此间的应用逻辑应该是要触发 [闪屏页Activity] ...

随机推荐

  1. SQL:DATEDIFF和DATEADD函数

    DATEDIFF和DATEADD函数.DATEDIFF函数计算两个日期之间的小时.天.周.月.年等时间间隔总数.DATEADD函数计算一个日期通过给时间间隔加减来获得一个新的日期.要了解更多的DATE ...

  2. go语言中实现生产者-消费者模式有哪些方法呢

    1. 简介 本文将介绍在 Go 语言中实现生产者消费者模式的多种方法,并重点探讨了通道.条件变量的适用场景和优缺点.我们将深入讨论这些方法的特点,以帮助开发者根据应用程序需求选择最适合的方式.通过灵活 ...

  3. ConcurrentHashMap是如何实现的?

    众所周知 ConcurrentHashMap 是 HashMap 的多线程版本,HashMap 在并发操作时会有各种问题,比如死循环问题.数据覆盖等问题.而这些问题,只要使用 ConcurrentHa ...

  4. Django 有关 models 数据类型介绍:

    在model中添加字段的格式一般为:  field_name = field_type(**field_options) 一  field options(所有字段共用) 1  null   默认为F ...

  5. STP生成树实验

    实验拓扑 实验需求 所有设备都运行STP 改变阻塞端口 实验步骤 1.所有设备都运行STP ,等到收敛完毕,观察状态 [SW1]stp mode stp [SW2]stp mode stp [SW3] ...

  6. CANoe_系统变量的创建过程

    在Canoe中创建系统变量,可以用于定义和管理与CAN网络通信相关的参数和配置.遵循以下步骤: 1.打开Canoe 启动Canoe软件. 2.打开项目 在Canoe的菜单栏中,选择"File ...

  7. Spring Cloud Gateway编码实现任意地址跳转

    欢迎访问我的GitHub 这里分类和汇总了欣宸的全部原创(含配套源码):https://github.com/zq2599/blog_demos 本篇概览 作为<Spring Cloud Gat ...

  8. 记一次etcd全局锁使用不当导致的事故

    1.背景介绍 前两天,现场的同事使用开发的程序测试时,发现日志中报etcdserver: mvcc: database space exceeded,导致 etcd 无法连接.很奇怪,我们开发的程序只 ...

  9. .NET周报 【7月第1期 2023-07-02】

    国内文章 C# 实现 Linux 视频聊天.远程桌面(源码,支持信创国产化环境,银河麒麟,统信UOS) https://www.cnblogs.com/shawshank/p/17420469.htm ...

  10. IoTOS v1.0.0 开源 高效 实用 | 免费商用

    IoTOS v1.0.0 一款高效实用 IoTCard 管理 & 运营系统. IoTOS 目前取名范围过大,其主要用于IoTCard 管理业务以高效.健壮.灵活设计 SaaS.多语言.机器人推 ...