Doris再次启动FE失败的思考

背景描述

在昨天已经成功下载安装最新稳定版docker、拉取doris-0.15.0版本的镜像、将镜像挂载道本地Doris源码目录、完成了doris的编译之后,今天在继续按照文档进行集群部署时,基本没遇到什么问题,后面在查看be节点状态时发现hadoop102节点的可用空间只有3个G,便想给hadoop102集群扩容

问题描述

直接关掉虚拟机后,删除所有快照(不删不让在VMvare的设置里面修改虚拟机的空间),然后将空间从50G改到了80G--(后来才知道在设置里面扩展的是虚拟磁盘空间)--,重启时出现的一个问题也都解决了,但是hadoop102节点的状态发生了改变,回退了很多操作,导致我需要重新给他配置并启动doris,我从其他节点直接拷贝配置文件过来,然后运行fe报错,运行其他节点的fe也会报错

问题原因

Centos7磁盘空间扩容操作不规范,删掉所有快照,回退了操作,导致集群出现故障

Centos7磁盘空间扩容

报错信息

一、FE启动失败,fe.log 中一直滚动如下信息:

wait catalog to be ready. FE type UNKNOWN

听说是因为doris暂时不支持ip变动,因为fe主节点ip变化 导致无法启动,换个版本重新编译一遍,再部署一次就好了

二、尝试使用Mysql客户端连接Doris时报错

Lost connection to MySQL server at 'reading initial communication packet', system error: 0

通常是因为编译 FE 时使用的 jdk 版本和运行 FE 时使用的 jdk 版本不同导致的。



三、启动FE时,使用jps命令看不到进程,查看日志

java.lang.Suchmethoderror: java.nio. ByteBuffer. limit (I)Ljava/nio/ByteBuffer;

Docker 里默认是 JDK 11,如果您的安装环境是使用 JDK8 ,需要在 Docker 里 JDK 环境切换成 JDK8



四、启动FE错误:

找不到或无法加载主类 org.apache.doris.PaloFe

思路可以



尚未解决

Doris官方常见报错处理指导文档

问题相似,可以参考

他的问题是FE挂掉后,启动不起来了



这个关系不大

可能有点用

思考

一、

我用docker build编译完doris后(编译前我有将Docker镜像挂载到本地),关机或重启节点,我还需要去重新启动一下docker吗?还是去本地挂载目录下直接配置运行doris

二、如果恢复到刚扩容重启的时候你会怎么做?

是向往常一样死马当活马医,看到一个解决方法就拿来试试,还是捋顺思路后再动手,没搞清楚问题本质前,宁可搁置,也不让事态继续恶化

其他问题

问题描述

直接在VMvare里面通过设置扩展虚拟磁盘的容量,重启虚拟机时遇到的问题

错误信息

重启后命令行提示如下:

generating “/run/initramfs/rdsosreport.txt”
entering emergencymode. exit the shell to continue
type “journalctl” to view system logs.
you might want to save “/run/initramfs/rdsosreport.txt” to a usb stick or /boot after mounting them and attach it to a bug report。

解决方法

查看设备的信息

# ls /dev/mapper/

这里会显示三个设备,其中有一个: xxxx-root,我的虚拟机是:rhel-root

问题修复:

# xfs_repair /dev/mapper/rhel-root

上述命令执行后,提示: xxxx busy...(大致意思就是:那块设备正在被使用)

此时,需要尝试先卸载那块设备。

# umount /rhel-root

卸载之后,在此尝试修复(此时可以正常修复)

# xfs_repair /dev/mapper/rhel-root

上述命令不能修复,需要添加参数 -L

# xfs_repair /dev/mapper/rhel-root -L

Doris 再次启动FE失败的思考的更多相关文章

  1. 启动OracleDBConsoleorcl失败,提示错误代码2

    异常问题: 启动OracleDBConsoleorcl失败,提示错误代码2 原因分析: 由于更改计算机名导致的异常 解决方法: 1.管理员权限cmd下执行emctl start dbconsole 2 ...

  2. 完全关闭及再次启动cdh集群

    关闭集群 - 关闭集群所有组件 关闭Cloudera Management Service 关闭cdh所有客户端节点 sudo /opt/cloudera-manager/cm-5.11.1/etc/ ...

  3. 启动OpenVPN失败

    启动OpenVPN失败 文:铁乐与猫 [root@yunwei_OpenVPN openvpn]# systemctl status openvpn ● openvpn.service - LSB: ...

  4. MyEclipse 启动 tomcate 失败 解决方法

    MyEclipse中启动tomcate失败 十月 20, 2015 9:53:04 下午 org.apache.catalina.startup.VersionLoggerListener log信息 ...

  5. unity3D Socket连接C#server出现unity3D编辑器再次启动连接 unity3D编辑器马上卡死

    unity3D Socket与C#server第一次连接时通讯正常.客服端段关闭后.unity3D编辑器再次启动连接 unity3D编辑器马上卡死 原因是Socket处于异步状态,而异步线程是不受Un ...

  6. Tomcat学习笔记 - 错误日志 - NetBeans配置tomcat出错情况总结 -- 部署错误: 启动 Tomcat 失败。-- '127.0.0.1' 不是内部或外部命令,也不是可运行的程序

    真的管用,不知道为啥管用.转载自:http://blog.sina.com.cn/s/blog_709548200102vgy4.html 问题描述: 新安装的NetBeans8.0.2,安装过程中还 ...

  7. centos7 启动docker失败的解决

    控制端使用yum install docker安装完成docker后启动docker失败,出现以下信息: Job for docker.service failed because the contr ...

  8. Linux_解决启动网卡失败 Device eth0 does not seem to be present

    Linux_解决启动网卡失败  Device eth0 does not seem to be present 虚拟机克隆  发现service network restart 启动失败 故障现象: ...

  9. 删除了原有的offset之后再次启动会报错park Streaming from Kafka has error numRecords must not ...

          笔者使用Spark streaming读取Kakfa中的数据,做进一步处理,用到了KafkaUtil的createDirectStream()方法:该方法不会自动保存topic parti ...

  10. Android Bug分析系列:第三方平台安装app启动后,home键回到桌面后点击app启动时会再次启动入口类bug的原因剖析

    前言 前些天,测试MM发现了一个比较奇怪的bug. 具体表现是: 1.将app包通过电脑QQ传送到手机QQ上面,点击安装,安装后选择打开app (此间的应用逻辑应该是要触发 [闪屏页Activity] ...

随机推荐

  1. Vue选日期滚动条自动定位到选定的日期位置

    html 这里的关键点就是   :id="'scroll'+index" 以及 :scroll-into-view="intoIndex" <view c ...

  2. 在Winform中一分钟入门使用好看性能还好的Blazor Hybrid

    在Winform中一分钟入门使用好看性能还好的Blazor Hybrid 安装模板 dotnet new install Masa.Template::1.0.0-rc.2 创建 Winform的Bl ...

  3. 洛谷P3374 【模板】树状数组 1-(单点修改,区间查询)

    题目描述 如题,已知一个数列,你需要进行下面两种操作: 将某一个数加上 x 求出某区间每一个数的和 输入格式 第一行包含两个正整数 n,m,分别表示该数列数字的个数和操作的总个数. 第二行包含 n 个 ...

  4. 使用umi+dva做一个demo

    最初只是使用react 进行开发项目,发现项目过大状态管理起来就相当困难,虽然有redux, mobx,但是使用起来还是相当繁琐,而目前umi有现成的轮子使用简单,当然愿意尝试了,趁现在假期有时间简单 ...

  5. 【lwip】14-TCP协议分析之TCP协议之可靠传输的实现(TCP干货)

    lwip_14_TCP协议之可靠传输的实现 前言 ‍ 前面章节太长了,不得不分开. 这里已源码为主,默认读者已知晓概念或原理,概念或原理可以参考前面章节,有分析. 参考:李柱明博客:https://w ...

  6. MySQL全面瓦解30:备份与恢复

    合辑地址:MySQL全面瓦解 1 为什么需要数据库备份 灾难恢复:当发生数据灾难的时候,需要对损坏的数据进行恢复和还原 需求的变更或者回滚:当需求发生变更,或者需要回滚到之前的版本时,数据库备份也显得 ...

  7. ARC142

    ARC142 考试情况:一眼订正,鉴定为做出前三题. A - Reverse and Minimize 分析题目性质可得三种情况: \(K\) 末尾有 \(0\) 最多只有 \(K\) 本身一个答案. ...

  8. 解决github无法打开问题

    在国内访问国外服务器(如github)会有卡顿.无法加载等问题,提供两种解决方案: 1.查看github的IP地址并修改Hosts windows键+R,打开cmd(或windows键+X,打开Win ...

  9. Java NIO原理 (Selector、Channel、Buffer、零拷贝、IO多路复用)

    系列文章目录和关于我 零丶背景 最近有很多想学的,像netty的使用.原理源码,但是苦于自己对于操作系统和nio了解不多,有点无从下手,遂学习之. 一丶网络io的过程 上图粗略描述了网络io的过程,了 ...

  10. 深度解读 Linux 内核级通用内存池 —— kmalloc 体系

    本文是笔者 slab 系列的最后一篇文章,为了方便大家快速检索,先将相关的文章列举出来: <细节拉满,80 张图带你一步一步推演 slab 内存池的设计与实现> <从内核源码看 sl ...