集群搭建好之后网络，raid卡策略，磁盘都会影响集群的性能。为了避免因上述问题使得集群的性能受到影响，我们依次进行测试，最后得到基本的集群性能。

网络

首先是网络，ceph集群一大堆让人摸不着头脑的问题都出在网络上，所以我们在建立集群之前就可以测试网络，看其是否有问题，可以通过ping命令来测试网络的连通性，但最好使用iperf，测试下网络传输速度。

遇到有不少现场情况，因为光模块导致万兆网络只有百兆的速度，如果等集群建好之后性能不如意，花费大量时间排查发现是这个问题就太冤了。

iperf命令

选择一个节点作为iperf server

iperf -s

选择其他节点作为iperf client，比如server IP地址为192.168.12.4

iperf -c 192.168.12.4 -i 1 -t 5

# -i: 间隔多少秒报告一次结果

# -t: 向服务器发送多少秒

# 结果如下

[  3]  0.0- 1.0 sec   575 MBytes  4.83 Gbits/sec

[  3]  1.0- 2.0 sec   361 MBytes  3.03 Gbits/sec

[  3]  2.0- 3.0 sec   618 MBytes  5.18 Gbits/sec

[  3]  3.0- 4.0 sec   423 MBytes  3.55 Gbits/sec

[  3]  4.0- 5.0 sec   519 MBytes  4.35 Gbits/sec

[  3]  0.0- 5.0 sec  2.44 GBytes  4.19 Gbits/sec

# 最后一行为 0-5秒的平均速度

iperf -c 192.168.12.4 -i 1 -t 10 |awk '/sec/ {print $8,9}'

一般ceph的内部通信网络是万兆网络，那通过iperf测试的速度为8-9Gbits/sec为正常，一次测试每个节点，没问题后接下来检查raid卡cache策略

raid卡cache策略

基于megacli的raid相关操作可参考我的《Raid操作与坏盘诊断》

总之，如果有BBU，设置raid cache为No Write Cache if Bad BBU

# 查看是否存在BBU

/opt/MegaRAID/MegaCli/MegaCli64 -AdpBbuCmd -aAll

# 设置为No Write Cache if Bad BBU，即BBU损坏或learning时变为Write Through

/opt/MegaRAID/MegaCli/MegaCli64 -LDSetProp -NoCachedBadBBU -Immediate -Lall -aAll

测试带宽与IOPS

带宽和IOPS测试的时候要同时使用atop来看当前测试压力的瓶颈在哪里，以三节点集群为例，通常使用两台节点同时往集群写入数据就可以测出最大性能，但是如果硬件设备配置很高，这时候atop观察发现两台同时给压力集群还是没有满负荷跑，可以使用三个节点同时压：

通常带宽使用1M的数据块来顺序写测试，IOPS使用4K小文件随机写来测试

带宽测试的瓶颈往往在万兆网卡上，atop命令可以看到万兆卡被压红

IOPS的瓶颈往往在磁盘上，atop可以看到不同节点的磁盘轮番被压红，或者同时压红则正常。如果发现有一个节点始终没有太大的变化，就需要去排查分析是否有问题

注意无论是dd命令还是fio命令，都不要对系统盘写，尤其是直接对系统块设备写，会直接抹掉系统数据。

带宽

以集群提供的NAS文件夹为例，如果为3节点集群，可以利用其中两个节点向同一文件夹同时写入，最后将结果相加

以顺序写为例：

进入nas目录里（同时写入的两个节点of文件名取不同的，否则测试结果偏高），同时从两个节点写数据,带宽为1.7GB/s（两个节点测试结果之和）

dd命令

# 测nas文件夹写速率

dd if=/dev/zero of=dd.client1 bs=1M count=40960 conv=fsync

# of：要写到哪个文件

# bs：同时设置读入/输出的数据块大小为1M

# count：共复制多少个bs 此处：bs=1M count=40960，则一共写入40G数据

# conv=fsync：在完成dd命令前需要确保文件的data和metadata都flush到后端存储，如果不加这个选项，可能还没写到存储上，只存在于客户端的memory里就结束了，这样的结果会偏高。

IOPS测试

一般使用fio工具来测试IOPS，fio也可以测试带宽。

测试IOPS一般使用4K的数据块

测试带宽建议使用大于等于1M的数据块

我们使用集群提供的块服务（iscsi），如块名为rbd0

下图为同时从两个节点向/dev/rbd0写如数据的IOPS测试结果，同理，将两个IOPS的值相加即粗略得到集群的IOPS，记得上面说到的用atop查看三个节点的磁盘状态，最直观的就是是否压红

fio命令

 # 测rbd IOPS

 fio --name=randwrite --rw=randwrite --bs=4k --size=100G --runtime=120 --ioengine=libaio --iodepth=128 --numjobs=1 --filename=/dev/rbd0 --direct=1 --norandommap --randrepeat=0 --group_reporting

--name=randwrite     # Job的名称，命令行模式下的必填项，如果没有指定filename，那么将会根据这个name来生成filename

--rw=randwrite       # IO pattern的类型，允许的值包括：					read/write/randwrite/randread/rw/randrw，具体意义可以直接从字面看出来

--bs=4k              # 每次IO的块大小，默认是4k，如果是带宽测试，建议至少1m

--size=100G          # 文件大小，fio将会传输完整个文件大小，除非设置了运行时间runtime

--runtime=120        # 本次fio测试最多会运行这么长时间，和size共同决定fio运行的时间

--ioengine=libaio    # 定义了job如何发送IO请求，本质上对应了不同的系统IO函数调用，常见的有sync/psync/libaio，新版本还有直接针对ceph的rbd

--iodepth=128        # IO深度，即同一时刻在途的IO个数，这个参数只在ioengine是异步的时候有用，如果是sync/psync，那么不管设多少只能是1

--numjobs=1          # Job的个数，即多进程运行fio，如果同时给出thread表示多线程运行

--filename=/dev/rbd0 # 如果指定filename，那么所有的job都会读写这个file，否则会根据name和numjobs启动生成file

--direct=1           # 如果是1，表示使用non-buffered IO，即读写均不经过本地内存

--norandommap        # fio测试时会维护一张表来记着写过的地方，默认不会重复的写一块地方，添加此选项，会在任何块随机写，这样更接近业务情景。一般在随机读写的时候加这个参数

--randrepeat=0       # 设置产生的随机数是不可重复的，目的是增加读写的随机性

--group_reporting    # 如果有多个job，不加这个参数就会单独显示每个job的输出，有这个参数就会汇总显示

# 测NAS带宽

 fio --name=seqwrite --rw=write --bs=1M --size=5G --runtime=1200 --numjobs=20 --ioengine=libaio --iodepth=16 --direct=1 --group_reporting

总结

以上简单的测试只是根据经验交付完的临时测试，机房的环境与客户现场是相当复杂的，通常环境也不是很好，但是搭建好集群后还是稍微坚持下花点时间进行简单的测试。

即便客户没有问到相关问题，但这样做首先是负责，其次将测试结果记录在案，方便后面自己与同事的维护工作。

集群搭建完成简要测试集群（性能）带宽与IOPS的更多相关文章

mongodb 3.4 集群搭建：分片+副本集
mongodb是最常用的nodql数据库,在数据库排名中已经上升到了前六.这篇文章介绍如何搭建高可用的mongodb(分片+副本)集群. 在搭建集群之前,需要首先了解几个概念:路由,分片.副本集.配置 ...
Redis集群搭建，伪分布式集群，即一台服务器6个redis节点
Redis集群搭建,伪分布式集群,即一台服务器6个redis节点一.Redis Cluster(Redis集群)简介集群搭建需要的环境二.搭建集群 2.1Redis的安装 2.2搭建6台redi ...
【Oracle 集群】Linux下Oracle RAC集群搭建之基本测试与使用（九)
Oracle 11G RAC数据库安装(九) 概述:写下本文档的初衷和动力,来源于上篇的<oracle基本操作手册>.oracle基本操作手册是作者研一假期对oracle基础知识学习的汇总 ...
【转】【Oracle 集群】Linux下Oracle RAC集群搭建之基本测试与使用（九)
原文地址:http://www.cnblogs.com/baiboy/p/orc9.html 阅读目录目录检查RAC状态检查创建的数据库全部参考文献相关文章 Oracle 11G RAC ...
mongodb 3.6 集群搭建：分片+副本集
mongodb是最常用的nosql数据库,在数据库排名中已经上升到了前六.这篇文章介绍如何搭建高可用的mongodb(分片+副本)集群. 在搭建集群之前,需要首先了解几个概念:路由,分片.副本集.配置 ...
Zookeeper 集群搭建--单机伪分布式集群
一. zk集群,主从节点,心跳机制(选举模式) 二.Zookeeper集群搭建注意点 1.配置数据文件 myid 1/2/3 对应 server.1/2/3 2.通过./zkCli.sh -serve ...
Redis5以上版本伪集群搭建（高可用集群模式）
redis集群需要至少要三个master节点,我们这里搭建三个master节点,并且给每个master再搭建一个slave节点,总共6个redis节点,这里用一台机器(可以多台机器部署,修改一下ip地 ...
斯坦福大学公开课机器学习：advice for applying machine learning | model selection and training/validation/test sets（模型选择以及训练集、交叉验证集和测试集的概念）
怎样选用正确的特征构造学习算法或者如何选择学习算法中的正则化参数lambda?这些问题我们称之为模型选择问题. 在对于这一问题的讨论中,我们不仅将数据分为:训练集和测试集,而是将数据分为三个数据组:也 ...
Redis3.2.5 集群搭建以及Spring-boot测试
1:集群中的机器信息 IP PORT 192.168.3.10 7000,7001,7002 192.168.3.11 7004,7005,7006 2:安装Redis 分别在10与11机器上面安装R ...

随机推荐

Java实现 LeetCode 454 四数相加 II
454. 四数相加 II 给定四个包含整数的数组列表 A , B , C , D ,计算有多少个元组 (i, j, k, l) ,使得 A[i] + B[j] + C[k] + D[l] = 0. 为 ...
Java实现蓝桥杯VIP 算法提高字符串比较
算法提高字符串比较时间限制:1.0s 内存限制:512.0MB 独立实现标准字符串库的strcmp函数,即字符串比较函数,从键盘输入两个字符串,按字典序比较大小,前者大于后者输出1,前者小于后者输 ...
java实现第三届蓝桥杯方块填数
方块填数 "数独"是当下炙手可热的智力游戏.一般认为它的起源是"拉丁方块",是大数学家欧拉于1783年发明的. 如图[1.jpg]所示:6x6的小格被分为6个部 ...
【Spring注解开发】组件注册-使用@Configuration和@Bean给容器中注册组件
写在前面在之前的Spring版本中,我们只能通过写XML配置文件来定义我们的Bean,XML配置不仅繁琐,而且很容易出错,稍有不慎就会导致编写的应用程序各种报错,排查半天,发现是XML文件配置不对! ...
KVM在线扩展虚拟机内存
环境介绍在KVM下有一台虚拟机内存不够需要扩展内存.宿主机地址是192.168.1.28.我需要扩展的虚拟机是centos1708vm03. 1.登陆上宿主机查看虚拟机配置 virsh dumpxm ...
关于vue不能像angular深度克隆数据解决办法
vue要让数据源实现响应式前提必须要在初始化的时候有这个属性如果没有这个属性,也可实现数据实时响应.解决方法: this.数组/对象.spice(0,1,'属性值') Vue.set(要修改的数组或 ...
Nice Jquery Validator 【从 jQuery Validation 迁移】
1. 初始化表单验证 .validate VS .validator jquery-validation : $("#myform").validate(options) nice ...
CGAL代码阅读跳坑指南
CGAL代码阅读跳坑指南整体框架介绍 CGAL中的算法和数据结构由它们使用的对象类型和操作参数化.它们可以处理满足特定语法和语义需求的任何具体模板参数.为了避免长参数列表,参数类型被收集到一个单独的 ...
Chrome扩展移植到Edge浏览器教程
微软在推出Edge浏览器之初,就把能够使用扩展(extension)作为一个重要功能.在Win10一周年更新版(1607)中,这项功能正式向广大用户推出(当然,Insider用户早就测试了一段时间了) ...
一张图搞懂Ubuntu安装时姓名、计算机名、用户名
安装Ubuntu时会要求填写如下图的信息: 感谢:苏守坤注意:上面的博客讲述了各自的具体含义,本篇博客只是说明这些名称在系统安装后会出现的位置.

集群搭建完成简要测试集群（性能）带宽与IOPS

网络