https://zhuanlan.zhihu.com/p/451341132

dperf是一款高性能的开源网络压力测试仪,是Linux基金会旗下的DPDK官方生态项目。本文介绍如利用dperf在两台物理服务器之间互打http流量进行基本性能测试:每秒新建连接数、并发连接数、带宽、PPS。本次测试示例客户端与服务器均使用1个核、1个网口。客户端、服务器上已经安装了dperf。

环境说明

项目 配置
物理服务器(客户端) 大页内存>=40G
数据网卡>=10GbpsIP=6.6.245.3-6.6.245.102地址:6.6.245.3-6.6.245.102,100个IP网关:6.6.245.1
物理服务器(服务器) 大页内存>=40G
数据网卡>=10GbpsIP=6.6.247.1地址:6.6.247.3网关:6.6.247.1
三层交换机 客户端网关地址:6.6.245.1
服务器网关地址:6.6.247.1
dperf版本 V1.0.0

网络拓扑图

准备工作

dperf安装

请在客户端与服务器上分别安装dperf。安装方请参考这篇文章:ArtNowBen:【dperf系列-4】dperf快速上手

熟悉配置

配置手册详细说明了dperf的所有配置项含义;建议在往下阅读前,先读一遍此文档。

https://github.com/baidu/dperf/blob/main/docs/configuration-CN.md

新建连接数测试

测试方法

在新建连接数测试中,我们使用短连接,每个连接只一个HTTP请求与响应,报文序列如下:

客户端发送SYN
服务器发送SYN+ACK
客户端发送请求(最小HTTP请求)
客户端发送请求(最小HTTP响应)
服务器发送响应+FIN
客户端发送FIN + ACK
服务器发送ACK

新建连接数测试会消耗较多的连接数(五元组),在新建连接数测试中,建议dperf连接总数是新建连接数目标的10倍以上;因为tcp超时为2秒,4次超时则认为连接失败。

dperf中连接总数 = 客户端IP数 * 65535 * 服务器IP数 * 监听端口数

为了达到较高的性能,我们配置客户端较多的IP,本例中客户端使用了100个IP;服务器监听端口数为5。

服务器配置

#daemon
mode server
tx_burst 128
cpu 48 duration 3m
payload_size 1 #numa2
port 0000:87:00.0 6.6.247.3 6.6.247.1 b4:a9:fc:ab:7a:85 # addr_start num
client 6.6.245.3 100 # addr_start num
server 6.6.247.3 1 # port_start num
listen 80 5

配置文件:server-cps-port1-1.conf

  1. 监听IP是6.6.247.3,监听端口范围为:80-84
  2. 只接受客户端地址范围是:6.6.245.3-6.6.245.102;tcp报文的源地址不在这个范围就丢包或RST,ping不受影响
  3. 服务器只绑定一个网口,设置与交换机的互连IP为6.6.247.3(复用了监听IP),网关为6.6.247.1(交换机IP)
  4. 新建连接数测试不能开启keepalive
  5. 设置HTTP响应长度为最小:payload_size 1

客户端配置

mode            client
tx_burst 128
launch_num 10
cpu 0 payload_size 1
duration 2m
cps 2.1m #port pci addr gateway [mac]
port 0000:01:00.0 6.6.245.3 6.6.245.1 b4:a9:fc:ab:7a:85 # addr_start num
client 6.6.245.3 100 # addr_start num
server 6.6.247.3 1
# port_start num
listen 80 5

配置文件:client-cps-port1-1.conf

  1. 给出服务器的监听地址,客户端向这个地址发起连接。 IP:6.6.247.3 监听端口范围为:80-84
  2. 客户端使用地址池的地址作为源地址:6.6.245.3-6.6.245.102
  3. 客户端只绑定一个网口,设置与交换机的互连IP为6.6.245.3(复用了地址池内的IP),网关为6.6.245.1(交换机IP)
  4. 设置HTTP响应长度为最小:payload_size 1
  5. 设置CPS目标为2m,请根据CPU能力灵活调整cps值,建议先设置较小的值,如"10k"

运行dperf

#运行服务器
dperf -c server-cps-port1-1.conf #运行客户端
dperf -c client-cps-port1-1.conf

并发连接数测试

测试方法

在并发连接数测试中,我们要使用长连接,每个连接持续发送HTTP请求、响应。在测试过程中,并发连接数持续增加,直到达到测试目标;我们可以通过客户端的每秒新建连接数来控制爬坡斜率;在测试并发连接数时,建议为客户端配置较大请求发送的间隔,如60秒;payload_size设置为最小。

服务器配置

#daemon
mode server
tx_burst 128
cpu 48 duration 10m
payload_size 1
keepalive 1 #numa2
port 0000:87:00.0 6.6.247.3 6.6.247.1 b4:a9:fc:ab:7a:85 # addr_start num
client 6.6.245.3 100 # addr_start num
server 6.6.247.3 1 # port_start num
listen 80 32

配置文件:server-cc-port1-1.conf

客户端配置

mode                        client
tx_burst 128
launch_num 10
cpu 0 payload_size 1
duration 10m cps 0.5m
cc 100m
keepalive 60s #port pci addr gateway [mac]
port 0000:01:00.0 6.6.245.3 6.6.245.1 b4:a9:fc:ab:7a:85 # addr_start num
client 6.6.245.3 100 # addr_start num
server 6.6.247.3 1
# port_start num
listen 80 32

配置文件:client-cc-port1-1.conf

带宽测试

测试方法

带宽的测试,是在并发连接数的基础上基础上进行的:

  1. 增大报文长度,payload_size设置为1400
  2. 降低并发连接数,如cc设置为3000
  3. 提升请求发送速度,如从60秒发送1次,提升为1毫秒发送一次
  4. 降低cps,由于并发度连接数较低,应该把新建速度同时调低

服务器配置

#daemon
mode server
tx_burst 128
cpu 48 duration 3m
payload_size 1400
keepalive 1 #numa2
port 0000:87:00.0 6.6.247.3 6.6.247.1 b4:a9:fc:ab:7a:85 # addr_start num
client 6.6.245.3 100 # addr_start num
server 6.6.247.3 1 # port_start num
listen 80 5

配置文件:server-tps-port1-1.conf

服务器配置

mode                        client
tx_burst 128
launch_num 10
cpu 0 payload_size 1400
duration 2m
cps 400
cc 3000
keepalive 1ms #port pci addr gateway [mac]
port 0000:01:00.0 6.6.245.3 6.6.245.1 b4:a9:fc:ab:7a:85 # addr_start num
client 6.6.245.3 100 # addr_start num
server 6.6.247.3 1
# port_start num
listen 80 5

配置文件:client-tps-port1-1.conf

PPS测试

PPS(packets perf second)是网络设备的一个重要指标,测试PPS只需要在并发连接数的基础上做少量调整,与带宽测试类似。

  1. 降低报文长度,payload_size设置为1
  2. 设置合适的并发连接数
  3. 提升请求发送速度,如从60秒发送1次,提升为1毫秒发送一次
  4. 降低cps,由于并发度连接数较低,应该把新建速度同时调低

总结

本文使用dper客户端打dperf服务器,介绍了新建、并发、带宽、PPS的测试方法。对于要测试DUT的场景,测试方法相同,修改dperf发送、接收地址即可。复杂的使用场景请关注后续文章。

如果喜欢,请去github上为dperf加个star,支持一下,非常感谢!

[转帖]【dperf系列-5】使用dperf进行性能测试(初级)的更多相关文章

  1. 黄聪:Microsoft Enterprise Library 5.0 系列教程(三) Validation Application Block (初级)

    原文:黄聪:Microsoft Enterprise Library 5.0 系列教程(三) Validation Application Block (初级) 企业库提供了一个很强大的验证应用程序模 ...

  2. 黄聪:Microsoft Enterprise Library 5.0 系列教程(二) Cryptography Application Block (初级)

    原文:黄聪:Microsoft Enterprise Library 5.0 系列教程(二) Cryptography Application Block (初级) 企业库加密应用程序模块提供了2种方 ...

  3. 黄聪:Microsoft Enterprise Library 5.0 系列教程(一) : Caching Application Block (初级)

    原文:黄聪:Microsoft Enterprise Library 5.0 系列教程(一) : Caching Application Block (初级) 本篇文章具体官方解释请参照以下链接: h ...

  4. [转帖]HTTPS系列干货(一):HTTPS 原理详解

    HTTPS系列干货(一):HTTPS 原理详解 https://tech.upyun.com/article/192/HTTPS%E7%B3%BB%E5%88%97%E5%B9%B2%E8%B4%A7 ...

  5. [转帖]Linux系列之SAR命令使用详解

    Linux系列之SAR命令使用详解 sar是System Activity Reporter(系统活动情况报告)的缩写.这个工具所需要的负载很小,也是目前linux中最为全面的性能分析工具之一.此款工 ...

  6. 2015年11月26日 Java基础系列(三)ThreadLocal类初级学习

    序,ThreadLocal类是为了解决多线程的安全问题.线程安全的意思也就是说每个线程操作自己的变量,不要对其他线程的值造成影响. 在很多情况下,ThreadLocal比直接使用synchronize ...

  7. 《Unity系列》Json文件格式的解析——初级教程

    Json作为轻量级的数据交换格式,被广泛应用于网络数据传输中.相关的解析工具层出不穷,一般掌握一个工具的应用其他的相应工具就能立马学会. 这里以C#中的LitJson为例给大家示范一下解析工具的用法. ...

  8. [转帖]APP逆向神器之Frida【Android初级篇】

    APP逆向神器之Frida[Android初级篇] https://juejin.im/post/5d25a543e51d455d6d5358ab 说到逆向APP,很多人首先想到的都是反编译,但是单看 ...

  9. 【转帖】sysbench的安装和做性能测试

    iMySQL | 老叶茶馆 sysbench的安装和做性能测试 http://imysql.cn/node/312 我仿照这个学的 但是 需要用更新的版本才可以.   By yejr on 14 六月 ...

  10. Enterprise Library 5.0 系列教程

    1. Microsoft Enterprise Library 5.0 系列教程(一) Caching Application Block (初级) 2. Microsoft Enterprise L ...

随机推荐

  1. 云小课|MRS基础原理之Hue组件介绍

    阅识风云是华为云信息大咖,擅长将复杂信息多元化呈现,其出品的一张图(云图说).深入浅出的博文(云小课)或短视频(云视厅)总有一款能让您快速上手华为云.更多精彩内容请单击此处. 摘要:Hue是一组WEB ...

  2. 干了三年的Java,你竟然还不会MySQL性能优化

    摘要:MySQL性能优化就算通过合理安排资源,调整系统参数使MySQL运行更快,更节省资源.MySQL性能优化包括查询速度优化,更新速度优化,MySQL服务器优化等等. 前言 MySQL性能优化就算通 ...

  3. CoralCache:一个提高微服务可用性的中间件

    摘要:当数据库出问题时能降级从本地缓存的数据中查询数据,CoralCache就是这样一个提高微服务可用性的中间件. 背景 有些场景下,微服务依赖数据库中一些配置项或者数量很少的数据,但当数据库本身有问 ...

  4. 经典永流传,华为云媒体 AI 让老电影焕发新生

    摘要:近日,在华为云TechWave全球技术峰会(人工智能&数据)上,马栏山视频文创产业园首席专家周苏岳受邀发表演讲<经典永流传,媒体 AI 让老电影焕发新生>,分享与华为云原生媒 ...

  5. 云小课 | 华为云KYON:网段零修改上云,简单又好用

    摘要:KYON(Keep Your Own Network)是华为云推出的企业级云网络解决方案,KYON能让用户直接将IDC组网搬到云上,网段零修改,简单又好用. 本文分享自华为云社区<[云小课 ...

  6. 带你认识Flink容错机制的两大方面:作业执行和守护进程

    摘要:Flink 容错机制主要有作业执行的容错以及守护进程的容错两方面,前者包括 Flink runtime 的 ExecutionGraph 和Execution的容错,后者则包括 JobManag ...

  7. 5种Python使用定时调度任务的方式

    摘要:Python 有几种方法可以定时调度一个任务,这就是我们将在本文中学习的内容. 本文分享自华为云社区<Python中使用定时调度任务(Schedule Jobs)的5种方式)>,作者 ...

  8. 教你3种Kafka的指定副本作为Leader的实现方式

    摘要:因为在我们实际的运维过程中,需要指定某个副本为ISR,但是Kafka中的Leader选举策略并不支持这个功能,所以需要我们自己来实现它. 本文分享自华为云社区<Kafka的指定副本作为Le ...

  9. LAS Spark+云原生:数据分析全新解决方案

    更多技术交流.求职机会,欢迎关注字节跳动数据平台微信公众号,回复[1]进入官方交流群 随着数据规模的迅速增长和数据处理需求的不断演进,云原生架构和湖仓分析成为了现代数据处理的重要趋势.在这个数字化时代 ...

  10. 火山引擎DataLeap数据调度实例的 DAG 优化方案 (二):功能设计

    针对上面存在的问题以及对需求的分析,我们可以进行如下的功能实现与设计: 首先是渲染方案的替换,将 svg 的渲染方案替换成 canvas 渲染,通过减少页面中 DOM 的数量,提高前端渲染性能. 其次 ...