ceph修复osd为down的情况

尝试一、直接重新激活所有osd

1、查看osd树

root@ceph01:~# ceph osd tree

ID WEIGHT  TYPE NAME       UP/DOWN REWEIGHT PRIMARY-AFFINITY

-1 0.29279 root default

-2 0.14639     host ceph01

 0 0.14639         osd.0        up  1.00000          1.00000

-3 0.14639     host ceph02

 1 0.14639         osd.1      down        0          1.00000

发现osd.1是down掉的。

2、再次激活所有的osd(记住是所有的，不只是down掉这一个)

下面命令当中的/dev/sdb1是每一个osd节点使用的实际存储硬盘或分区。

ceph-deploy osd activate  ceph01:/dev/sdb1 ceph02:/dev/sdb1

3、查看osd树和健康状态

root@ceph01:~/my-cluster# ceph osd tree

ID WEIGHT  TYPE NAME       UP/DOWN REWEIGHT PRIMARY-AFFINITY

- 0.29279 root default

- 0.14639     host ceph01

  0.14639         osd.        up  1.00000          1.00000

- 0.14639     host ceph02

  0.14639         osd.        up  1.00000          1.00000

root@ceph01:~/my-cluster#

root@ceph01:~/my-cluster# ceph -s

    cluster ecacda71-af9f-46f9-a2a3-a35c9e51db9e

     health HEALTH_OK

     monmap e1:  mons at {ceph01=10.111.131.125:/}

            election epoch , quorum  ceph01

     osdmap e150:  osds:  up,  in

            flags sortbitwise,require_jewel_osds

      pgmap v9284:  pgs,  pools,  bytes data,  objects

             MB used,  GB /  GB avail

                   active+clean

只有为 HEALTH_OK 才算是正常的。

尝试二、修复down掉的osd

该方法主要应用于某个osd物理损坏，导致激活不了

1、查看osd树

root@ceph01:~# ceph osd tree

ID WEIGHT  TYPE NAME       UP/DOWN REWEIGHT PRIMARY-AFFINITY

- 0.29279 root default

- 0.14639     host ceph01

  0.14639         osd.        up  1.00000          1.00000

- 0.14639     host ceph02

  0.14639         osd.      down                  1.00000

发现osd.1是down掉的。

2、将osd.1的状态设置为out

root@ceph02:~# ceph osd out osd.

osd. is already out.

3、从集群中删除

root@ceph02:~# ceph osd rm osd.

removed osd.

4、从CRUSH中删除

root@ceph02:~# ceph osd crush rm osd.

removed item id  name 'osd.1' from crush map

5、删除osd.1的认证信息

root@ceph02:~# ceph auth del osd.

updated

6、umount

umount /dev/sdb1

7、再次查看osd的集群状态

root@ceph02:~# ceph osd tree

ID WEIGHT  TYPE NAME       UP/DOWN REWEIGHT PRIMARY-AFFINITY

- 0.14639 root default

- 0.14639     host ceph01

  0.14639         osd.        up  1.00000          1.00000

-            host ceph02

8、登录ceph-deploy节点

root@ceph01:~# cd /root/my-cluster/

root@ceph01:~/my-cluster#

9、初始化磁盘

ceph-deploy --overwrite-conf osd  prepare ceph02:/dev/sdb1

10、再次激活所有的osd(记住是所有的，不只是down掉这一个)

ceph-deploy osd activate  ceph01:/dev/sdb1 ceph02:/dev/sdb1

11、查看osd树和健康状态

root@ceph01:~/my-cluster# ceph osd tree

ID WEIGHT  TYPE NAME       UP/DOWN REWEIGHT PRIMARY-AFFINITY

-1 0.29279 root default

-2 0.14639     host ceph01

 0 0.14639         osd.0        up  1.00000          1.00000

-3 0.14639     host ceph02

 1 0.14639         osd.1        up  1.00000          1.00000

root@ceph01:~/my-cluster#

root@ceph01:~/my-cluster# ceph -s

    cluster ecacda71-af9f-46f9-a2a3-a35c9e51db9e

     health HEALTH_OK

     monmap e1: 1 mons at {ceph01=10.111.131.125:6789/0}

            election epoch 14, quorum 0 ceph01

     osdmap e150: 2 osds: 2 up, 2 in

            flags sortbitwise,require_jewel_osds

      pgmap v9284: 64 pgs, 1 pools, 17 bytes data, 3 objects

            10310 MB used, 289 GB / 299 GB avail

                  64 active+clean

只有为 HEALTH_OK 才算是正常的。

ceph修复osd为down的情况的更多相关文章

影响性能的关键部分-ceph的osd journal写
在前面一篇文章中,我们看到,当使用filestore时,osd会把磁盘分成data和journal两部分.这主要是为了支持object的transaction操作.我的想法是,ceph需要具有数据保护 ...
ceph增加osd流程
假如需要新增一个主机名:osd4 ip:192.168.0.110的OSD1.在osd4创建挂载目录及放置配置文件的目录 ssh 192.168.0.110 (这里是从mon主机ssh到osd4主机) ...
ceph存储osd启动异常处理和正常启停操作
机器角色:cloudstack虚拟机的宿主机:ceph存储机器. 事件:ceph存储的物理机器由于内存异常,需要停机更换,仅仅是把该物理机上面的虚拟机迁移走,同时启动了停机维护,然后就直接关机.结果造 ...
ceph之osd
一.删除osd ceph osd out 1ceph osd down 1systemctl stop ceph-osd@1ceph osd crush remove osd.1ceph osd rm ...
Ceph更换OSD磁盘
目录简介更换OSD操作步骤 1. 故障磁盘定位 2. 摘除故障磁盘 3. 重建raid0 4. 重建osd 控制数据恢复及回填速度简介首先需要说明的是,ceph的osd是不建议做成raid10 ...
ceph 剔除osd
先将osd.2移出集群 root@ceph-monster:~# ceph osd out osd.2 marked out osd.2. root@ceph-monster:~# ceph osd ...
Ceph删除OSD上一个异常object
前言 ceph里面的数据是以对象的形式存储在OSD当中的,有的时候因为磁盘的损坏或者其它的一些特殊情况,会引起集群当中的某一个对象的异常,那么我们需要对这个对象进行处理在对象损坏的情况下,启动OSD ...
查询Ceph的OSD占用内存
前言之前写过一篇关于查询OSD的运行的CPU的情况的分享,本篇是讲的获取内存占用的,代码包括两种输出,一种是直接的表格,一种是可以方便解析的json 代码直接上代码,python才用不久,所以可能 ...
不小心清空了Ceph的OSD的分区表如何恢复
前言如果你是新手,应该出现过敲盘符的时候,敲错的情况,有些操作可能没什么问题,查询类的操作都没问题,但是写入的情况,就可能比较麻烦了,当然老手也可能有误操作,本篇将讲述在误操作把分区表给弄丢了的情况 ...

随机推荐

SQL Server Management Studio (SSMS)
最新的SQLServer数据库已经不集成SQL Server Management Studio需要单独下载安装. https://docs.microsoft.com/zh-cn/sql/ssms/ ...
用PyMOL展示配体和受体相互作用的原子和氢键
转载于 https://mp.weixin.qq.com/s/P62sjqhSTxmWVicrEAk-RQ 为了简化展示过程,我们设计了一个pml脚本 (脚本内有很详细的解释),只需要修改脚本里面受体 ...
Yaml学习笔录
YAML概要 [YAML](http://yaml.org/)是"YAML Ain't a Markup Language"(YAML不是一种置标语言)的递归缩写,早先YAML的意 ...
SVN专题（Visual SVN Server + TortoiseSVN + Visual SVN）
参考资料: 1.Windows环境下搭建SVN服务器.原文地址:https://blog.csdn.net/lu1024188315/article/details/74082227 2.Git|SV ...
Disconf实践指南：改造篇
上一篇文章Disconf实践指南:使用篇介绍了如何在项目中应用disconf,虽然实现了分布式配置的实时刷新,但是我们希望能够去除所有的配置文件,把配置都交给disconf管理,本地只需要实现配置监听 ...
CentOS7.6安装JDK(Openjdk)
安装开始: 第一步: 使用yum源安装 OpenJDK,yum install -y java-1.8.0-openjdk 第二步: 查看安装版本,java -version 运行时发现错误汇总: 错 ...
leetcode hashmap
187. Repeated DNA Sequences 求重复的DNA序列 public List<String> findRepeatedDnaSequences(String s) { ...
在EXCEL中使用SQL语句查询
SQL语句在数据库使用中十分重要. 在EXCEL中可以不打开工作簿,就获取数据,对多工作簿操作很用,也很快. 对大量数据处理,比循环快很多,但是比词典方法还有点距离(可惜我还没有学会词典). 对数据库 ...
自动补齐flexselect+级联下拉框案例
在开发web应用时,经常遇到类似省市区级联下拉框操作,即选中省份自动级联加载该省份所有的市,选中市自动级联加载该市所有的区:假设省市区的数据量很大,此时用户想选中某市,因而要从上往下查找,可能半天都找 ...
glTexGen
[glTexGen] Rather than having to explicitly provide a texture coordinate for each vertex, we can use ...

ceph修复osd为down的情况

ceph修复osd为down的情况的更多相关文章

随机推荐

热门专题