cephfs元数据池故障的恢复

【cephfs元数据池故障的恢复】的更多相关文章

cephfs元数据池故障的恢复

前言 cephfs 在L版本已经比较稳定了,这个稳定的意义个人觉得是在其故障恢复方面的成熟,一个文件系统可恢复是其稳定必须具备的属性,本篇就是根据官网的文档来实践下这个恢复的过程实践过程部署一个ceph Luminous集群 [root@lab102 ~]# ceph -v ceph version 12.2.5 (cad919881333ac92274171586c827e01f554a70a) luminous (stable) 创建filestore ceph-deploy osd c…

Mongodb 5节点异地两中心故障转移恢复测试案例

Mongodb5节点异地两中心故障转移恢复测试案例架构方式:5节点,主中心(2数据1仲裁),备中心(1数据1仲裁) 1基本情况操作系统:Red Hat Enterprise Linux Server release 6.3 (Santiago) Mongodb版本:db version v3.6.3 Mongodb架构: Ip,端口规划 "hosts" : [##数据节点 "10.15.7.114:28001",#主中心 "10.15.7.114:28…

Oracle 不同故障的恢复方案

之前在Blog中对RMAN 的备份和恢复做了说明,刚看了下,在恢复这块还有知识点遗漏了. 而且恢复这块很重要,如果DB 真要出了什么问题,就要掌握对应的恢复方法. 所以把DB的恢复这块单独拿出来说明一下. RMAN 备份与恢复实例 http://blog.csdn.net/tianlesoftware/archive/2009/10/19/4699320.aspx 如何搭建一个数据库服务器平台 http://blog.csdn.net/tianlesoftware/archive/2010/0…

linux系统无法正常启动，故障排查恢复

linux内核启动修复首先看linux内核重要文件grub.conf # grub.conf generated by anaconda # # Note that you do not have to rerun grub after making changes to this file # NOTICE: You have a /boot partition. This means that # all kernel and initrd paths are relative to /b…

数据故障的恢复-MSSQL ndf文件大小变为0 KB恢复过程

一.故障描述成都某客户,存储损坏,数据库崩溃.重组存储,恢复数据库文件,发现有四个ndf文件大小变为0 KB.数据库大小约80TB.数据库中有1223个文件,数据库每10天生成一个NDF文件,每个NDF大约500GB,数据库包含两个LDF文件.二.故障分析存储损坏,NDF文件大小变为0 KB,根据NDF文件在磁盘上可能存在.可以通过编写数据库扫描碎片程序,扫描数据库碎片.拼接碎片恢复NDF文件,然后修复数据库. 三.恢复过程1 磁盘扫描,扫描数据库碎片2 拼接碎片根据NDF文…

Atlas 读写分离 & Atlas + MHA 故障自动恢复

目录 Atals 介绍 Atlas 主要功能 Atlas 相对于官方 MySQL-Proxy 的优势 Atlas 使用 Atlas 安装 Atlas 目录 Atlas 配置 Atlas 启动 Atlas 使用 Atlas + MHA 故障恢复 Atlas 自动恢复思路 Atlas + MHA 恢复脚本 MHA 恢复脚本 Atals 介绍 Atlas 主要功能读写分离从库负载均衡 IP 过滤自动分表 DBA 可平滑上下线 DB 自动摘除宕机的 DB Atlas 相对于官方 MySQL-Pro…

es故障节点恢复后加入集群导致删除索引重新出现

es的每个shard下的文件都可以看做一个完整的lucene文件,shard数据目录下的segment文件包含了索引的分片数量,副本数量.es shard可以恢复,就是因为每个shard都包含了一份数据,而且包含了索引的分片数量,副本数量等信息. 有这样一种情形,es集群中的某一个节点坏掉了,接着又删除了集群中的某个索引.坏掉的节点恢复后,重新加入集群,该节点上的shard还是完整的,最终的结果就是,删除的索引又被重新的恢复了.这并不是所期望的结果. es 5.x中该问题已经被解决,es会记录已…

DG中模拟failover故障与恢复

问题描述:情形是当主库真正出现异常之后,才会执行的操作,那么我们执行过failover 之后,如何在重新构建DG,这里我们利用flashback database来重构.模拟前主库要开启闪回区,否则要重新搭建DG了 1.由于主库已经不可访问,下面所有的操作都在备库完成,先取消实时同步 SQL> alter database recover managed standby database cancel; 2.强制取消redo接收 3.确认一下备库 4.切换为物理主库,然后open,确认一下切换成…

记录一次dns引发的线程池故障

# 问题描述公司做的是一个支付系统,会对接很多第三方公司. 突然有一天,有一家第三方(简称金花平台)反应收不到我们的通知消息. # 排查过程我们登陆自己的服务器,检查程序日志,是有给金花平台发送通知的.而且大多订单都是通知成功而且金花平台也成功返回了. 仔细检查日志后,发现金花平台说的没有收到通知的订单其实在我们服务器的日志里面是有发送的,只是没有返回与金花平台沟通后,手动模拟程序给金花平台发送通知后,金花平台反馈之前没有收到通知的订单经过手动模拟发送通知成功了 # 定位问题与研发沟通后…

技术干货：Ceph搭建硬件建议详解

Ceph是专为在商品硬件上运行而设计的,这使得构建和维护超大规模的数据集群在经济上是可行的.当规划出你的集群硬件时,你需要平衡一些考虑因素,包括故障域和潜在的性能问题.硬件规划应该包括将Ceph守护进程和其他使用Ceph的进程分布在许多主机上.一般来说,我们建议在为该类型的守护进程配置的主机上运行特定的Ceph守护进程.我们建议使用其他主机来处理使用您的数据集群的进程(例如OpenStack.CloudStack) CPU Ceph元数据服务器会动态地重新分配负载,这对CPU来说是很有必要的.…