PG数计算

原地址:http://xiaqunfeng.cc/2017/09/15/too-many-PGs-per-OSD/

ceph告警问题:”too many PGs per OSD” 的解决方法,以及pg数量的合理设定

现象

1
2
3
4
5
6
7
8
9
10
11
12
13
# ceph -s
cluster 4c7ec5af-cbd3-40fd-8c96-0615c77660d4
health HEALTH_WARN
too many PGs per OSD (412 > max 300)
monmap e2: 3 mons at {ceph0=172.21.1.21:6789/0,ceph1=172.21.1.22:6789/0,ceph2=172.21.1.23:6789/0}
election epoch 1780, quorum 0,1,2 ceph0,ceph1,ceph2
mgr active: ceph0 standbys: ceph1, ceph2
osdmap e94: 6 osds: 6 up, 6 in
flags sortbitwise,require_jewel_osds,require_kraken_osds
pgmap v161317: 824 pgs, 10 pools, 30201 MB data, 8642 objects
90831 MB used, 181 GB / 269 GB avail
824 active+clean
client io 34800 B/s wr, 0 op/s rd, 9 op/s wr

原因

  • 集群osd 数量较少
  • 搭建rgw网关、OpenStack、容器组件等,pool创建较多,每个pool默认需要占用一些pg,pool中pg数目设置不合理,导致集群 total pg 数过多

解决

方法

调整每个osd默认pg数,参数为 mon_pg_warn_max_per_osd ,当前默认参数如下:

1
2
# ceph --show-config | grep mon_pg_warn_max_per_osd
mon_pg_warn_max_per_osd = 300

步骤

1、修改ceph配置文件

1
2
3
4
5
# cd /etc/ceph
# vim ceph.conf
[global]
.......
mon_pg_warn_max_per_osd = 500

2、将配置文件推到mon所在的其他节点

1
# ceph-deploy --overwrite-conf config push ceph1 ceph2

3、重启mon进程

1
# systemctl restart ceph-mon.target

重启成功后,再次查看配置项

1
2
# ceph --show-config | grep mon_pg_warn_max_per_osd
mon_pg_warn_max_per_osd = 500

此时集群状态ok

1
2
3
4
5
6
7
8
9
10
11
12
# ceph -s
cluster 4c7ec5af-cbd3-40fd-8c96-0615c77660d4
health HEALTH_OK
monmap e2: 3 mons at {ceph0=172.21.1.21:6789/0,ceph1=172.21.1.22:6789/0,ceph2=172.21.1.23:6789/0}
election epoch 1780, quorum 0,1,2 ceph0,ceph1,ceph2
mgr active: ceph0 standbys: ceph1, ceph2
osdmap e94: 6 osds: 6 up, 6 in
flags sortbitwise,require_jewel_osds,require_kraken_osds
pgmap v161317: 824 pgs, 10 pools, 30201 MB data, 8642 objects
90831 MB used, 181 GB / 269 GB avail
824 active+clean
client io 34800 B/s wr, 0 op/s rd, 9 op/s wr

pg数目的设定

信息查询

1、查看当前osd数目

1
2
# ceph osd ls | wc -l
6

2、查看当前有多少个pool

1
2
# ceph osd pool ls | wc -l
10

3、查看 replication pool 的数量

1
2
3
4
5
6
7
8
9
10
11
# ceph osd dump | grep repli
pool 0 'rbd' replicated size 3 min_size 2 crush_ruleset 0 object_hash rjenkins pg_num 256 pgp_num 256 last_change 31 flags hashpspool stripe_width 0
pool 1 '.rgw.root' replicated size 3 min_size 2 crush_ruleset 0 object_hash rjenkins pg_num 8 pgp_num 8 last_change 14 flags hashpspool stripe_width 0
pool 2 'default.rgw.control' replicated size 3 min_size 2 crush_ruleset 0 object_hash rjenkins pg_num 8 pgp_num 8 last_change 16 flags hashpspool stripe_width 0
pool 3 'default.rgw.data.root' replicated size 3 min_size 2 crush_ruleset 0 object_hash rjenkins pg_num 8 pgp_num 8 last_change 19 flags hashpspool stripe_width 0
pool 4 'default.rgw.gc' replicated size 3 min_size 2 crush_ruleset 0 object_hash rjenkins pg_num 8 pgp_num 8 last_change 20 flags hashpspool stripe_width 0
pool 5 'default.rgw.lc' replicated size 3 min_size 2 crush_ruleset 0 object_hash rjenkins pg_num 8 pgp_num 8 last_change 21 flags hashpspool stripe_width 0
pool 6 'default.rgw.log' replicated size 3 min_size 2 crush_ruleset 0 object_hash rjenkins pg_num 8 pgp_num 8 last_change 23 flags hashpspool stripe_width 0
pool 7 'default.rgw.users.uid' replicated size 3 min_size 2 crush_ruleset 0 object_hash rjenkins pg_num 8 pgp_num 8 last_change 26 flags hashpspool stripe_width 0
pool 8 'kube' replicated size 3 min_size 2 crush_ruleset 0 object_hash rjenkins pg_num 256 pgp_num 256 last_change 36 flags hashpspool stripe_width 0
pool 9 'stage' replicated size 3 min_size 2 crush_ruleset 0 object_hash rjenkins pg_num 256 pgp_num 256 last_change 54 flags hashpspool stripe_width 0

可以看到,每个pool都是 3 副本(replicated size 3

total pg num

公式如下:

1
Total PGs = (Total_number_of_OSD * 100) / max_replication_count

结果必须取最接近该数的 2 的幂

比如,根据以上信息:

1
2
3
Total_number_of_OSD = 6
max_replication_count = 3
Total PGs = 200

最接近 200 的 2 的幂是 256。所以推荐的集群最大 total PGs 数为 256。

pool pg num

每个 pool 的 pg 数目计算:

1
Total PGs = ((Total_number_of_OSD * 100) / max_replication_count) / pool_count

结果同样要取最接近的 2 的幂。

对应该例,每个 pool 的 pg num 为:

1
2
pool_count = 10
Total PGs = 200 / 10 = 20

所以每个 pool 的平均分配 pg num 为 16。

pg num command

得到和设置指定 pool 中的 pg_num 和 pgp_num

command function
ceph osd pool create <pool-name> <pg-number> <pgp-number> To create a new pool
ceph osd pool get <pool-name> <pg_num> To get number of PG in a pool
ceph osd pool get <pool-name> <pgp_num> To get number of PGP in a pool
ceph osd pool set <pool-name> <pg_num number> To increase number of PG in a pool
ceph osd pool set <pool-name> <pgp_num number> To increase number of PGP in a pool

创建pool时如果不指定 pg_num,默认为8

1
2
# ceph --show-config | grep osd_pool_default_pg_num
osd_pool_default_pg_num = 8

PG数计算的更多相关文章

  1. 每个pool pg数计算

    ceph PGs per Pool Calculator 原文档:http://xiaqunfeng.cc/2017/09/18/ceph-PGs-per-Pool-Calculator/ 2017- ...

  2. Ceph之PG数调整

    1. PG介绍 PG, Placement Groups.CRUSH先将数据分解成一组对象,然后根据对象名称.复制级别和系统中的PG数等信息执行散列操作,再将结果生成PG ID.可以将PG看做一个逻辑 ...

  3. 调整ceph的pg数(pg_num, pgp_num)

    https://www.jianshu.com/p/ae96ee24ef6c 调整ceph的pg数 PG全称是placement groups,它是ceph的逻辑存储单元.在数据存储到cesh时,先打 ...

  4. ACM Fibonacci数 计算

    Fibonacci数 时间限制:3000 ms  |  内存限制:65535 KB 难度:1   描述 无穷数列1,1,2,3,5,8,13,21,34,55...称为Fibonacci数列,它可以递 ...

  5. js-小数计算问题

    先上图: 什么情况? 原因:js采用二进制进行小数计算 先看十进制的小数转换为二进制的方法: 十进制数的整数位是二进制数的整数位,十进制数的小数位是二进制数的小数位 假如我们有小数111.4(10), ...

  6. PHP PDO select语句结果行数计算

    PDO有一个函数PDOStatement::rowCount返回上一个SQL语句影响的行数. rowCount函数对于DELETE, INSERT, 或者UPDATE语句的结果是正确的,但对于sele ...

  7. CNN中的卷积操作的参数数计算

    之前一直以为卷积是二维的操作,而到今天才发现卷积其实是在volume上的卷积.比如输入的数据是channels*height*width(3*10*10),我们定义一个核函数大小为3*3,则输出是8* ...

  8. Catalan数计算及应用

    Catalan数列是非常奇妙的一列数字,因为很多问题的解就是一个Catalan数.知道了这一规律,很多看似复杂的问题便可迎刃而解.那么什么是Catalan数,什么样的问题的解是Catalan数呢? 1 ...

  9. Lucene索引数计算

    Elasticsearch默认在创建索引结束时得到5个分片及1个副本: 分片是有0-n个副本,“5个分片及1个副本”即“5个分片及5个相应分片副本”:共10个Lucene索引 副本数:指的是“单个分片 ...

随机推荐

  1. Swoole跟thinkphp5结合开发WebSocket在线聊天通讯系统

    ThinkPHP使用Swoole需要安装 think-swoole Composer包,前提系统已经安装好了Swoole PECL 拓展* tp5的项目根目录下执行composer命令安装think- ...

  2. 高质量App的架构设计与思考!

    最近在做一功能不大.业务也不复杂的小众App,以往做App是发现自己从来没有考虑过一些架构方面的问题,只是按照自己以往的习惯去写代码,忽略了App的设计.本次分享主要包含一些开发App的小经验和技巧, ...

  3. 【故障公告】数据库服务器 CPU 近 100% 引发的故障(源于 .NET Core 3.0 的一个 bug)

    非常抱歉,这次故障给您带来麻烦了,请您谅解. 今天早上 10:54 左右,我们所使用的数据库服务(阿里云 RDS 实例 SQL Server 2016 标准版)CPU 突然飙升至 90% 以上,应用日 ...

  4. mysql数据库E-R图

    学会绘制E-R图 绘制E-R图首先要了解什么是实体,什么是属性,什么是联系. 1.首先实体是指现实世界中具有区分其他事物的特征或属性与其他实体有联系的实体,针对于数据库中的表而言实体是指表中一行一行特 ...

  5. Netflix 开源 Polynote:对标 Jupyter,一个笔记本运行多种语言

    谈到数据科学领域的开发工具,Jupyter 无疑是非常知名的一种.它具有灵活高效的特点,非常适合进行开发.调试.分享和教学.近日,Netflix(奈飞)居然也玩起了跨界,他们开源了一个名为 Polyn ...

  6. Rust 入门 (三)_上

    这部分我们学习 rust 语言的 变量.数据类型.函数.注释.流程控制 这五个方面的内容.本文我们介绍前两个内容,下一篇文章介绍后三个内容. 变量 默认情况下,rust 语言中声明的变量是不可变的,比 ...

  7. Dart Learn Notes 02

    Functions Dart是一门面向对象的语言,所以即便是方法也是一个对象,它的类型是Function. 这就意味着方法可以指向变量,也可以作为方法中的参数供其他方法使用.甚至可以让 一个类作为一个 ...

  8. vue学习笔记(九)vue-cli中的组件通信

    前言 在上一篇博客vue学习笔记(八)组件校验&通信中,我们学会了vue中组件的校验和父组件向子组件传递信息以及子组件通知父组件(父子组件通信),上一篇博客也提到那是对组件内容的刚刚开始,而本 ...

  9. day 33 线程锁

    Python的GIL锁 - Python内置的一个全局解释器锁,锁的作用就是保证同一时刻一个进程中只有一个线程可以被cpu调度. 为什么有这把GIL锁? 答:Python语言的创始人在开发这门语言时, ...

  10. Altium Designer 20.0.9

    Altium Designer 20.0.9 Download: http://dl3.downloadly.ir/Files/Software/Altium_Designer_20.0.9_Buil ...