摘要:误执行了 rm -rf /* 之后,除了跑路还能怎么办?

本文分享自华为云社区《拯救被 rm -rf 伤到的小伙》,作者:Gauss 松鼠会。

灵魂画师再次上线

 

在开饭前我们先了解下两个关键的配置文件

1. 数据目录下的 postgresql.conf

比对一下主备节点的 postgresql.conf,应该有以下几个参数不一致

listen_addresses 远程客户端连接使用的数据库主节点ip或者主机名
local_bind_address 当前节点连接openGauss其他节点时绑定的本地IP地址
replconninfo1 设置本端侦听和鉴权的第一个节点信息,如果备机有2个,就会有replconninfo2
log_directory 决定存放服务器日志文件的目录,om初始化安装时命名跟实例id相关
audit_directory 审计文件的存储目录,om初始化安装时命名跟实例id相关
application_name 连接请求时所使用的客户端名称,om初始化安装时命名跟实例id相关

来自踩坑者的 warning:根据某一个节点生成例外一个节点的 postgresql.conf 文件,俗手请按参数逐个修改,不可全量替换,容易改错 ip 等

2.$GAUSSHOME/bin/cluster_static_config

俗称静态配置文件,OM 工具的核心,记录了当前节点和集群的基本信息,二进制结构化文件

可以通过 gs_om -t view 来查看

可以通过 gs_om -t generateconf -X XMLFILE --distribute 重新生成

有静态配置文件,就有动态配置文件 cluster_static_config

动态配置文件最大的作用就是记录了当前节点状态,标记节点主备角色,这样重启的时候知道节点的启动方式

可以通过 gs_om -t refreshconf 生成 只有进行过主备切换才有必要执行这个命令

开胃菜拼盘之备机的数据目录丢失

建立 postgresql.conf 文件后 build 即可
postgresql.conf 可以从主机拷贝后修改,如果日常养成了备份的习惯那就更方便了

gs_om -t status --detail
scp xb01:/data1/zxbog/openGauss/data/dn1/postgresql.conf ./data1/zxbog/openGauss/data/dn2/
gs_ctl build -D /data1/zxbog/openGauss/data/dn2

开胃菜拼盘之主机的数据目录丢失

按修复备机的方式肯定是不行滴,需要先备升主,然后按备机方式修复,最后再主备切换
主机 down 的时候,需要在备机 failover 来实现备升主
主机 normal 的时候,需要在备机 switchover 来实现备升主

gs_ctl failover -D /data1/zxbog/openGauss/data/dn2
gs_ctl switchover -D /data1/zxbog/openGauss/data/dn1

开胃菜拼盘之 GPHOME/GAUSSHOME 目录丢失

GPHOME 下主要是 OM 脚本 (数据库运维工具),python 语言

如果丢失,可以从其他节点直接 cp(推荐),或者安装包直接解压覆盖,也可以重新执行一遍 gs_preinstall
GAUSSHOME 下主要存放数据库内核可执行文件,C/C++ 语言编译

如果丢失,可以从同集群其他节点 cp(推荐)或者解压安装包中的 bz 压缩包,由于 GAUSSHOME/bin 目录下存放了各自的静态配置文件,需要修改

为啥我都是推荐从其他节点 cp 呢,通过 om 安装的数据库会产生证书在每个节点,解压包是不会产生这些的,如果用到了 openssl,需要手动生成

正菜之节点替换与修复

节点替换与修复一般有两种场景

  1. 机器损坏,需要重新搭建一台,配置比如 ip 都不变
  2. 机器被征用,需要换一台新的机器,ip 地址也变更了

这种情况可以先用 gs_dropnode 删除老的节点,然后通过 gs_expansion 扩新的节点

这两个命令都是要求在主节点下执行,如果要修改主节点,请先主备切换,并刷新静态 / 动态配置文件

gs_dropnode 需要在普通用户下执行,gs_expansion 需要在 root 用户下执行

[xb0608@xb01 ~]$ gs_dropnode -U xb0608 -G xb0608 -h 192.168.0.26
[root@xb01 script]# /opt/software/script/gs_expansion -U xb0608 -G xb0608 -X ../double.xml -h 192.168.0.26

 在执行扩节点之前,为减少不必要的麻烦,请确保新的节点足够干净,邪 恶代码如下,谨慎使用
ps -ef|grep ^xb0608|awk '{print $2}'|xargs kill -9 && userdel -r xb0608
rm -rf /data1/zxbog/openGauss/
groupadd xb0608 && useradd xb0608 -g xb0608
passwd xb0608

传说中的甜点

如果整个集群都被 干掉了咋办~~既然有主备节点,就可以有主备集群啦

OM 重磅功能支持主备集群 - 流式容灾搭建即将上线,敬请期待

点击关注,第一时间了解华为云新鲜技术~

不止跑路,拯救误操作rm -rf /*的小伙儿的更多相关文章

  1. oracle truncate table recover(oracle 如何拯救误操作truncate的表)

     生产上肯定是容易脑袋发热,truncate一张表,立马的心跳加速,眼神也不迷糊了,搞错了,完了-- 那么,truncate表后,能不能进行恢复? truncate操作是比较危险的操作,不记录redo ...

  2. 理解Linux文档的默认安全机制、隐藏属性、特殊权限,妈妈在也不用担心你从删库到跑路!!!

    写在前面 前面的章节 详解Linux文档属性.拥有者.群组.权限.差异,介绍了文档的基本权限,包括读写执行(r,w,x),还有文档若干的属性,包括是否为目录(d).文件(-).链接文件(l).拥有者. ...

  3. Linux记录- Linux下限制rm -rf /

    操作说明: 为了防止在linux下执行操作的时候误操作rm -rf /,或者rm -rf 一些比较重要的目录,我们做以下操作来限制rm的删除 1.下载源码安装包 https://raw.githubu ...

  4. 写了Bug,误执行 rm -fr /*,我删删删删库了,要跑路吗?

    每日英语,每天进步一点点(偷笑): 前言 临近五一节,想到有 5 天假期,小林开始飘了. 写个简单的 Bash 脚本都不上心了,写完连检查都不检查,直接拖到到实体服务器跑. 结果一跑起来,发生不对劲, ...

  5. 数据误操作,删库跑路?教你使用ApexSQLLog工具从 SQLServer日志恢复数据!

    前几天同事不小心误操作,将SQLServer库的一张表的一个状态字段给刷成了一个统一状态,由于是update执行所以原来的相关状态无法确定.发生这种事情的时候我的小伙伴背后 一凉,估计心里里面想这怕是 ...

  6. 干货,不小心执行了rm -f,除了跑路,如何恢复?

    前言 每当我们在生产环境服务器上执行rm命令时,总是提心吊胆的,因为一不小心执行了误删,然后就要准备跑路了,毕竟人不是机器,更何况机器也有bug,呵呵. 那么如果真的删除了不该删除的文件,比如数据库. ...

  7. 干货,不小心执行了rm -f,除了跑路,如何恢复?https://www.cnblogs.com/justmine/p/10359186.html

    前言 每当我们在生产环境服务器上执行rm命令时,总是提心吊胆的,因为一不小心执行了误删,然后就要准备跑路了,毕竟人不是机器,更何况机器也有bug,呵呵. 那么如果真的删除了不该删除的文件,比如数据库. ...

  8. 不小心执行了 rm -f,先别急着跑路

    作者:justmine http://www.cnblogs.com/justmine/p/10359186.html 前言 每当我们在生产环境服务器上执行rm命令时,总是提心吊胆的,因为一不小心执行 ...

  9. rm误操作 which查看命令存放路径

    目录 一:rm误操作 which查看命令存放路径 一:rm误操作 which查看命令存放路径 解决rm命令误操作 让别人使用不了自己的rm命令 将rm命令改一个名称 mv rm abc 查看命令存放路 ...

随机推荐

  1. python操作MySQL与MySQL补充

    目录 python操作MySQL 基本使用 SQL注入问题 二次确认 视图 触发器 事务 存储过程 函数 流程控制 索引 练习 python操作MySQL python中支持操作MySQL的模块很多, ...

  2. 安装Siege到Linux(源码)

    运行环境 系统版本:CentOS Linux release 7.3.1611 (Core) 软件版本:siege-4.0.4 硬件要求:无 安装过程 1.安装依赖 [root@localhost ~ ...

  3. 【单片机】CH32V103串口IDLE空闲中断

    CH32V103c8t6 在寻找解决接收完数据后,怎么即时判断数据已经完成了接收.发现串口有一个IDLE空闲中断.如下图描述: 意思是在串口接收完一帧数据 会产生一个中断,此时程序可判断为数据已接收完 ...

  4. Spring IOC源码研究笔记(2)——ApplicationContext系列

    1. Spring IOC源码研究笔记(2)--ApplicationContext系列 1.1. 继承关系 非web环境下,一般来说常用的就两类ApplicationContext: 配置形式为XM ...

  5. 关于使用 koa路由与mysql模块, ctx.body获取不到值的问题

    var Koa = require('koa');var Router = require('koa-router' );var bodyParser = require('koa-bodyparse ...

  6. javascript写淡入淡出效果的轮播图

    <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...

  7. sort基本用法

    sort 选项 -u --去除重复行 -r --降序排列,默认是升序 -o --由于sort默认是把结果输出到标准输出,所以需要用重定向才能将结果写入文件,形如sort filename > n ...

  8. Spring框架系列(9) - Spring AOP实现原理详解之AOP切面的实现

    前文,我们分析了Spring IOC的初始化过程和Bean的生命周期等,而Spring AOP也是基于IOC的Bean加载来实现的.本文主要介绍Spring AOP原理解析的切面实现过程(将切面类的所 ...

  9. 学习C4C的视频分享

  10. lerna学习笔记

    lerna简介 Lerna 是一个优化基于Git+npm的多package项目的项目管理工具,lerna是架构优化的产物,项目复杂度提升后,架构优化的主要目标是以提高ROI为核心的 lerna的主要功 ...