标签（空格分隔）： ceph，ceph运维，pg

集群环境：

[root@node3 ~]# cat /etc/redhat-release

CentOS Linux release 7.3.1611 (Core)

[root@node3 ~]# ceph -v

ceph version 12.2.1 (3e7492b9ada8bdc9a5cd0feafd42fbca27f9c38e) luminous (stable)

集群当前布局：

[root@node3 ceph-6]# ceph osd tree

ID CLASS WEIGHT  TYPE NAME      STATUS REWEIGHT PRI-AFF

-1       0.08844 root default

-3       0.02948     host node1

 0   hdd 0.00980         osd.0      up  1.00000 1.00000

 3   hdd 0.00980         osd.3      up  1.00000 1.00000

-5       0.02948     host node2

 1   hdd 0.00980         osd.1      up  1.00000 1.00000

 4   hdd 0.00980         osd.4      up  1.00000 1.00000

-7       0.02948     host node3

 2   hdd 0.00980         osd.2      up  1.00000 1.00000

 5   hdd 0.00980         osd.5      up  1.00000 1.00000

为每个主机再添加一个osd：

为了重现too few pgs的错误，同时为了创建指定数据位置osd，下面创建bluestore的osd，数据存储在/dev/sdd1上。在每个主机上执行下面的步骤：

第一步：创建bluestore类型的osd：

[root@node2 ~]# ceph-disk prepare --bluestore /dev/sdd2 --block.db /dev/sdd1

set_data_partition: incorrect partition UUID: cafecafe-9b03-4f30-b4c6-b4b80ceff106, expected ['4fbd7e29-9d25-41b8-afd0-5ec00ceff05d', '4fbd7e29-9d25-41b8-afd0-062c0ceff05d', '4fbd7e29-8ae0-4982-bf9d-5a8d867af560', '4fbd7e29-9d25-41b8-afd0-35865ceff05d']

prepare_device: OSD will not be hot-swappable if block.db is not the same device as the osd data

prepare_device: Block.db /dev/sdd1 was not prepared with ceph-disk. Symlinking directly.

meta-data=/dev/sdd2              isize=2048   agcount=4, agsize=648895 blks

         =                       sectsz=512   attr=2, projid32bit=1

         =                       crc=1        finobt=0, sparse=0

data     =                       bsize=4096   blocks=2595579, imaxpct=25

         =                       sunit=0      swidth=0 blks

naming   =version 2              bsize=4096   ascii-ci=0 ftype=1

log      =internal log           bsize=4096   blocks=2560, version=2

         =                       sectsz=512   sunit=0 blks, lazy-count=1

realtime =none                   extsz=4096   blocks=0, rtextents=0

第二步：激活该osd：

[root@node2 ~]# ceph-disk activate /dev/sdd2

creating /var/lib/ceph/tmp/mnt.mR3qCJ/keyring

added entity osd.8 auth auth(auid = 18446744073709551615 key=AQBNqOVZt/iUBBAArkrWrZi9N0zxhHhYfhanyw== with 0 caps)

got monmap epoch 1

Removed symlink /etc/systemd/system/ceph-osd.target.wants/ceph-osd@8.service.

Created symlink from /etc/systemd/system/ceph-osd.target.wants/ceph-osd@8.service to /usr/lib/systemd/system/ceph-osd@.service.

最后查看集群布局，发现共有9个osd：

[root@node3 ~]# ceph osd tree

ID CLASS WEIGHT  TYPE NAME      STATUS REWEIGHT PRI-AFF

-1       0.08844 root default

-3       0.02948     host node1

 0   hdd 0.00980         osd.0      up  1.00000 1.00000

 3   hdd 0.00980         osd.3      up  1.00000 1.00000

 7   hdd 0.00989         osd.7      up  1.00000 1.00000

-5       0.02948     host node2

 1   hdd 0.00980         osd.1      up  1.00000 1.00000

 4   hdd 0.00980         osd.4      up  1.00000 1.00000

 8   hdd 0.00989         osd.8      up  1.00000 1.00000

-7       0.02948     host node3

 2   hdd 0.00980         osd.2      up  1.00000 1.00000

 5   hdd 0.00980         osd.5      up  1.00000 1.00000

 6   hdd 0.00989         osd.6      up  1.00000 1.00000

重现too few pgs错误：

创建一个pg数较小的存储池：

[root@node3 ~]# ceph osd pool create rbd 64 64

pool 'rbd' created

[root@node3 ~]# rados lspools

rbd

[root@node3 ~]# ceph -s

  cluster:

    id:     b8b4aa68-d825-43e9-a60a-781c92fec20e

    health: HEALTH_WARN

            too few PGs per OSD (21 < min 30)

  services:

    mon: 1 daemons, quorum node1

    mgr: node1(active)

    osd: 9 osds: 9 up, 9 in

  data:

    pools:   1 pools, 64 pgs

    objects: 0 objects, 0 bytes

    usage:   9742 MB used, 82717 MB / 92459 MB avail

    pgs:     64 active+clean

从上面可以看到，提示说每个osd上的pg数量小于最小的数目30个。pgs为64，因为是3副本的配置，所以当有9个osd的时候，每个osd上均分了64/9 *3=21个pgs,也就是出现了如上的错误小于最小配置30个。

集群这种状态如果进行数据的存储和操作，会发现集群卡死，无法响应io，同时会导致大面积的osd down。

解决办法：修改默认pool rbd的pgs

[root@node3 ~]# ceph osd pool set rbd pg_num 128

set pool 1 pg_num to 128

之后查看集群状态

[root@node3 ~]# ceph -s

  cluster:

    id:     b8b4aa68-d825-43e9-a60a-781c92fec20e

    health: HEALTH_WARN

            Reduced data availability: 5 pgs inactive, 44 pgs peering

            Degraded data redundancy: 49 pgs unclean

            1 pools have pg_num > pgp_num

  services:

    mon: 1 daemons, quorum node1

    mgr: node1(active)

    osd: 9 osds: 9 up, 9 in

  data:

    pools:   1 pools, 128 pgs

    objects: 0 objects, 0 bytes

    usage:   9743 MB used, 82716 MB / 92459 MB avail

    pgs:     7.031% pgs unknown

             38.281% pgs not active

             70 active+clean

             44 peering

             9  unknown

             5  activating

可以看到还没ok，提示pg_num 大于 pgp_num，所以还需要修改pgp_num

[root@node3 ~]# ceph osd pool set rbd pgp_num 128

set pool 1 pgp_num to 128

再次查看集群状态：

[root@node3 ~]# ceph -s

  cluster:

    id:     b8b4aa68-d825-43e9-a60a-781c92fec20e

    health: HEALTH_OK

  services:

    mon: 1 daemons, quorum node1

    mgr: node1(active)

    osd: 9 osds: 9 up, 9 in

  data:

    pools:   1 pools, 128 pgs

    objects: 0 objects, 0 bytes

    usage:   9750 MB used, 82709 MB / 92459 MB avail

    pgs:     128 active+clean

这里是简单的实验，pool上也没有数据，所以修改pg影响并不大，但是如果是生产环境，这时候再重新修改pg数，会对生产环境产生较大影响。因为pg数变了，就会导致整个集群的数据重新均衡和迁移，数据越大响应io的时间会越长。所以，最好在一开始就设置好pg数。

参考资料：

HEALTH_WARN too few PGs per OSD (16 < min 30）

HEALTH_WARN too few PGs per OSD (21 < min 30）解决方法的更多相关文章

too few PGs per OSD (20 < min 30)
ceph osd pool set replicapool pg_num 150 ceph osd pool set replicapool pgp_num 150
天河2 程序 version GLIBCXX_3.4.21 not found 解决方法
本文告诉大家在天河2 运行程序时发现 version GLIBCXX_3.4.21 not found 如何修复我在天河2运行一个程序报错 version `GLIBCXX_3.4.21' not ...
021 Ceph关于too few PGs per OSD的问题
在一个ceph集群中,操作创建一个池后,发现ceph的集群状态处于warn状态,信息如下检查集群的信息查看看池 [root@serverc ~]# ceph osd pool ls images ...
ceph -s集群报错too many PGs per OSD
背景集群状态报错,如下: # ceph -s cluster 1d64ac80-21be-430e-98a8-b4d8aeb18560 health HEALTH_WARN <-- 报错的地方 ...
ceph故障：too many PGs per OSD
原文:http://www.linuxidc.com/Linux/2017-04/142518.htm 背景集群状态报错,如下: # ceph -s cluster 1d64ac80-21be-43 ...
jquery.validate.min.js 用法方法示例
页面html 代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://w ...
5.7.2.2 min()和max()方法
Math对象还包含许多方法,用于辅助完成简单和复杂的数学计算. 其中,min()和max()方法用于确定一组数值中的最小值和最大值.这两个方法都可以接受任意多个数值参数,如下例子: var max = ...
std::min error C2059: 语法错误:“::” 的解决方法
std::min error C2059: 语法错误:"::" 的解决方法下面这段代码: size_t n = std::min(count_, num_elements); 编 ...
ubuntu 更显列表　[Connecting to archive.ubuntu.com (2001:67c:1360:8001::21)]　超时的解决方法
问题描述: 在使用apt-get update 时更行列表,显示[Connecting to archive.ubuntu.com (2001:67c:1360:8001::21)]超时分析: 我已 ...

随机推荐

ASCII_01
1.来自“http://baike.baidu.com/link?url=WgFPtGe-rT6x6X0r_OiHGVZAV87Fu4_P5fvr7FsGyrm8QqTGuvVUfg4Jx7Rn-Le ...
Java多线程 - 线程组
Java使用ThreadGroup来表示线程组,用以对一批线程进行分类管理. Java允许程序对线程组直接进行控制,对线程组的控制相当于同时控制这批线程: 用户创建的所有线程都属于指定线程组,如果程序 ...
使用Mybatis时报错Cause: java.sql.SQLSyntaxErrorException: ORA-00911: 无效字符
首先保证sql语句在oracle中的编写是正确的,然后在配置文件中插入时就报这样的错误.有可能是因为sql语句后面多了“:”分号,在标签中写分号是错的.如果我写成了 insert into emplo ...
Entity Framework 6：专家版本
随着 Entity Framework 最新主版本 EF6 的推出,Microsoft 对象关系映射 (ORM) 工具达到了新的专业高度,与久负盛名的 .NET ORM 工具相比已不再是门外汉. EF ...
公共域名服务DNS 114.114.114.114和8.8.8.8
一.两者的联系 114.114.114.114和8.8.8.8,这两个IP地址都属于公共域名解析服务DNS其中的一部分,而且由于不是用于商业用途的,这两个DNS都很纯净,不用担心因ISP运营商导致的D ...
TCP粘包问题及解决方案
① TCP是个流协议,它存在粘包问题 TCP是一个基于字节流的传输服务,"流"意味着TCP所传输的数据是没有边界的.这不同于UDP提供基于消息的传输服务,其传输的数据是有边界的.T ...
python运行httpserver
$ python -m SimpleHTTPServer $ python3 -m http.server
三十三 Python分布式爬虫打造搜索引擎Scrapy精讲—数据收集(Stats Collection)
Scrapy提供了方便的收集数据的机制.数据以key/value方式存储,值大多是计数值. 该机制叫做数据收集器(Stats Collector),可以通过 Crawler API 的属性 stats ...
内存保护机制及绕过方案——通过覆盖虚函数表绕过/GS机制
1 GS内存保护机制 1.1 GS工作原理栈中的守护天使--GS,亦称作Stack Canary / Cookie,从VS2003起开始启用(也就说,GS机制是由编译器决定的,跟操作系统 ...
关于Object类的equals方法和hashCode方法
关于Object类的equals的特点,对于非空引用: 1.自反性:x.equals(x) return true : 2.对称性:x.equals(y)为true,那么y.equals(x)也为tr ...

HEALTH_WARN too few PGs per OSD (21 < min 30）解决方法