UnixBench的简单测试与验证


目标

飞腾2000+ (物理机和虚拟机)
Intel Golden 6170 物理机
Intel Golden 5218 虚拟机 Gold 5218 CPU @ 2.30GHz
至强十年前的CPU E5-2620 物理机
E5-2630 v3 @ 2.40GHz 虚拟机
验证一下不同机器的最简单的性能数据.

过程

第一步 下载UnixBench
https://codeload.github.com/kdlucas/byte-unixbench/tar.gz/refs/tags/v5.1.3
下载完后 该改名, 放到不同的机器里面 tar -zxvf unixbench-5.1.3.tar.gz
cd byte-unixbench-5.1.3/UnixBench/
sed -i "s/GRAPHIC_TESTS = defined/#GRAPHIC_TESTS = defined/g" ./Makefile
make 执行命令为:
./Run

简单参数介绍


简单参数介绍文字版

Unixbench做了哪些性能测试
Dhrystone 2 using register variables
这里有比较详细的dhrystone介绍,这个主要是测整数性能,对应的浮点数测试是:Double-Precision Whetstone。
那绕开里面一坨计算,说下输出:默认就是在10秒内,那一坨计算能计算次数,算出分数后,参考前面篇UnixBench算分介绍,算出Index分数。 Double-Precision Whetstone
既然有整数运算的CPU性能,那么浮点数运算性能也希望有,于是就有了:whets.c Execl Throughput
除了前面介绍的那两个比较复杂,UnixBench其他的运算都比较简单,Execl它的实际就是递归调用,它主要利用的是execl函数。
本身execl.c编译出来后的执行文件是execl的二进制文件,execl函数执行的时候记录参数:开始时间,执行次数,耗时(一般都是10秒)。
当本次总执行时间耗时超过10秒时,输出执行次数,然后根据算分规则算分,这个思想还是很巧妙的。 File Copy
这个主要是测试的write和read两个函数,测试30秒。实现很简单,先写入一个文件2秒(循环写入),再读2秒,
然后从刚刚写入的文件读取数据,写入到另一个文件,循环写入,在30秒的读写次数。
不同的参数测试测的是不同块大小,不同块数的性能,如果测试磁盘建议用FIO测试。 Pipe Throughput
打开一个管道,往管道写入512个bytes,再读出来,测试10秒,总共读写次数 Pipe-based Context Switching
打开两个管道,开启两个进程,其中一个进程往管道1写,往管道2读,另一个进程往管道2写,往管道2读,
一个进程完成一次读写,计数+1。其中一个很有意思的事情:如果这两个进程在同一个CPU和不同的CPU有完全不同的性能,
在同一个CPU下性能会好很多。这里有篇很细致的分析,值得大家评阅:Unixbench 测试套件缺陷深度分析 Process Creation
就是不停调用fork函数,创建进程,并立马退出,成功一次计数+1。 Shell Scripts
通过fork函数,创建进程,不停地执行一个脚本, 执行成功一次+1.
所谓Shell Scripts (1 concurrent) 一个并发是指传递给脚本:pgms/multi.sh 参数是1,
同样Shell Scripts (8 concurrent) ,传递给脚本的参数是8,同时8个子任务并发执行。 System Call Overhead
本意是想计算进入离开操作系统的开销,进入离开一次计数+1,
在10秒内的执行次数. 实际执行的效果是fork子进程,waitpid函数后退出,计数+1

部分机器的配置与结果

  • Intel(R) Xeon(R) Gold 6150 CPU @ 2.70GHz * 18 *4 1T内存
System Benchmarks Index Values               BASELINE       RESULT    INDEX
Dhrystone 2 using register variables 116700.0 45321616.5 3883.6
Double-Precision Whetstone 55.0 3994.4 726.3
Execl Throughput 43.0 990.5 230.3
File Copy 1024 bufsize 2000 maxblocks 3960.0 653004.6 1649.0
File Copy 256 bufsize 500 maxblocks 1655.0 170341.0 1029.3
File Copy 4096 bufsize 8000 maxblocks 5800.0 1991790.6 3434.1
Pipe Throughput 12440.0 812102.4 652.8
Pipe-based Context Switching 4000.0 129430.3 323.6
Process Creation 126.0 2688.8 213.4
Shell Scripts (1 concurrent) 42.4 2276.7 536.9
Shell Scripts (8 concurrent) 6.0 1225.2 2042.0
System Call Overhead 15000.0 656542.4 437.7
========
System Benchmarks Index Score 811.8 ------------------------------------------------------------------------
Benchmark Run: 日 9月 25 2022 17:19:07 - 17:19:07
144 CPUs in system; running 144 parallel copies of tests

  • Intel(R) Xeon(R) CPU E5-2620 0 @ 2.00GHz62 32G内存
System Benchmarks Index Values               BASELINE       RESULT    INDEX
Dhrystone 2 using register variables 116700.0 26845867.5 2300.4
Double-Precision Whetstone 55.0 3161.6 574.8
Execl Throughput 43.0 1477.6 343.6
File Copy 1024 bufsize 2000 maxblocks 3960.0 253582.3 640.4
File Copy 256 bufsize 500 maxblocks 1655.0 67713.4 409.1
File Copy 4096 bufsize 8000 maxblocks 5800.0 731087.8 1260.5
Pipe Throughput 12440.0 322218.7 259.0
Pipe-based Context Switching 4000.0 95001.7 237.5
Process Creation 126.0 5645.1 448.0
Shell Scripts (1 concurrent) 42.4 3719.6 877.3
Shell Scripts (8 concurrent) 6.0 1646.3 2743.9
System Call Overhead 15000.0 211672.9 141.1
========
System Benchmarks Index Score 578.5 ------------------------------------------------------------------------
Benchmark Run: 日 9月 25 2022 17:25:56 - 17:25:56
24 CPUs in system; running 24 parallel copies of tests

  • FT-2000+/64 2.0Ghz * 64core * 1 128G内存
System Benchmarks Index Values               BASELINE       RESULT    INDEX
Dhrystone 2 using register variables 116700.0 22368348.8 1916.7
Double-Precision Whetstone 55.0 3631.2 660.2
Execl Throughput 43.0 2535.4 589.6
File Copy 1024 bufsize 2000 maxblocks 3960.0 403977.6 1020.1
File Copy 256 bufsize 500 maxblocks 1655.0 123146.9 744.1
File Copy 4096 bufsize 8000 maxblocks 5800.0 1059038.5 1825.9
Pipe Throughput 12440.0 731953.9 588.4
Pipe-based Context Switching 4000.0 128939.1 322.3
Process Creation 126.0 5281.5 419.2
Shell Scripts (1 concurrent) 42.4 3729.0 879.5
Shell Scripts (8 concurrent) 6.0 1687.8 2813.0
System Call Overhead 15000.0 512275.3 341.5
========
System Benchmarks Index Score 800.7 ------------------------------------------------------------------------
Benchmark Run: 日 9月 25 2022 17:27:32 - 17:27:32
64 CPUs in system; running 64 parallel copies of tests

  • 虚拟机 Intel(R) Xeon(R) CPU E5-2630 v3 @ 2.40GHz *8vCPU 16G内存
System Benchmarks Index Values               BASELINE       RESULT    INDEX
Dhrystone 2 using register variables 116700.0 211612119.4 18133.0
Double-Precision Whetstone 55.0 35513.7 6457.0
Execl Throughput 43.0 7928.8 1843.9
File Copy 1024 bufsize 2000 maxblocks 3960.0 1008598.8 2547.0
File Copy 256 bufsize 500 maxblocks 1655.0 280047.4 1692.1
File Copy 4096 bufsize 8000 maxblocks 5800.0 3083540.8 5316.4
Pipe Throughput 12440.0 6476970.5 5206.6
Pipe-based Context Switching 4000.0 1522650.6 3806.6
Process Creation 126.0 29679.7 2355.5
Shell Scripts (1 concurrent) 42.4 21083.6 4972.6
Shell Scripts (8 concurrent) 6.0 3255.8 5426.4
System Call Overhead 15000.0 4443744.9 2962.5
========
System Benchmarks Index Score 4032.0 只进行一个copy的性能为: Run -c 1
System Benchmarks Index Values BASELINE RESULT INDEX
Dhrystone 2 using register variables 116700.0 34026972.9 2915.8
Double-Precision Whetstone 55.0 4072.9 740.5
Execl Throughput 43.0 2797.2 650.5
File Copy 1024 bufsize 2000 maxblocks 3960.0 747208.9 1886.9
File Copy 256 bufsize 500 maxblocks 1655.0 208899.4 1262.2
File Copy 4096 bufsize 8000 maxblocks 5800.0 1819202.2 3136.6
Pipe Throughput 12440.0 1148215.4 923.0
Pipe-based Context Switching 4000.0 132960.3 332.4
Process Creation 126.0 7724.1 613.0
Shell Scripts (1 concurrent) 42.4 6659.2 1570.6
Shell Scripts (8 concurrent) 6.0 2005.4 3342.3
System Call Overhead 15000.0 2023562.5 1349.0
========
System Benchmarks Index Score 1245.8

  • KVM虚拟机 FT-2000+/64 *12 32G内存
System Benchmarks Index Values               BASELINE       RESULT    INDEX
Dhrystone 2 using register variables 116700.0 230828135.7 19779.6
Double-Precision Whetstone 55.0 43293.8 7871.6
Execl Throughput 43.0 12516.6 2910.8
File Copy 1024 bufsize 2000 maxblocks 3960.0 337653.1 852.7
File Copy 256 bufsize 500 maxblocks 1655.0 88730.2 536.1
File Copy 4096 bufsize 8000 maxblocks 5800.0 1151598.8 1985.5
Pipe Throughput 12440.0 6932899.9 5573.1
Pipe-based Context Switching 4000.0 839878.7 2099.7
Process Creation 126.0 14315.2 1136.1
Shell Scripts (1 concurrent) 42.4 14834.8 3498.8
Shell Scripts (8 concurrent) 6.0 2267.5 3779.1
System Call Overhead 15000.0 1072451.9 715.0
========
System Benchmarks Index Score 2470.5 只进行一个copy的性能为:
System Benchmarks Index Values BASELINE RESULT INDEX
Dhrystone 2 using register variables 116700.0 22350448.1 1915.2
Double-Precision Whetstone 55.0 3610.6 656.5
Execl Throughput 43.0 2140.6 497.8
File Copy 1024 bufsize 2000 maxblocks 3960.0 361175.9 912.1
File Copy 256 bufsize 500 maxblocks 1655.0 107413.0 649.0
File Copy 4096 bufsize 8000 maxblocks 5800.0 998342.8 1721.3
Pipe Throughput 12440.0 689464.3 554.2
Pipe-based Context Switching 4000.0 45415.8 113.5
Process Creation 126.0 3255.5 258.4
Shell Scripts (1 concurrent) 42.4 3168.9 747.4
Shell Scripts (8 concurrent) 6.0 1299.4 2165.6
System Call Overhead 15000.0 472585.1 315.1
========
System Benchmarks Index Score 646.1

部分结论1

这次测试感觉非常反常识.. 我的服务器甚至不如部分云主机的结果好..
而且很奇怪的是 物理机器的测试结果都不如虚拟机..所以感觉很诡异.
猜测物理机的性能结果有损耗, 可能只能用来评估虚拟机的性能.
但是感觉自己的部分项目经验. 能够得出部分浅显的结论2

部分结论2

  • 只是自己最近学到的和简单的总结. 不是很准确.
CPU的速度主频仅是其中一个变量.
不同指令集, 不同架构, 不同厂商的CPU完全不具备横向对比的基础. 引申出来比较重要的概念是IPC, instruction per cycle.
但是这个概念意义也不是很大, 通过整数和浮点计算出来的结果其实与现实生产差距巨大
但是可以这样理解. 跑分高了性能不一定好, 但是跑分低了性能一定很差. SPEC2006和SPEC2017可以对CPU进行简单的度量, 但是结果具有一定的欺骗性
GCC和ICC不同编译器以及不通的编译优化会导致结果天差地别. CPU的指令集对性能有影响,但是不是最大的变量.VIA的x86的CPU就不如安培的ARM架构的CPU
架构和制程非常重要. 架构会决定流水线深度和多发射的条数,以及uos的数量和编译器前后端的优化程度.
制程会决定CPU的体质, 能不能支撑大量的计算和生产的压力.
可以理解 架构就是技术 支撑就是体力. 想打好球 两者缺一不可. 并且是相辅相成的. 流水线深度和多发射的数量对性能影响很大.
并且指令预取.以及分支判断的算法对性能影响也很大. 分支判断对了. L1I就会更好发挥做用. 然后缓存对CPU的影响更体现在生产上. 科学计算可能可以不太考虑缓存. 但是生产服务器必须要考虑.
不管是L1 L2 L3 还是TLB 还是寄存器. 他的性能和容量决定了很大一部分CPU的性能也很考验CPU厂商的技术功底 在满足上面的情况下. CPU对中断和上下文切换的效率也会影响性能表现.
尤其是多线程情况时的处理. CPU终归是要将数据从内存中取出,计算完再写入到内存的. 所以内存带宽和内存时延 就是除了CPU本身之外最大的性能参数
CPU的带宽很好理解. 一般就是比如DDR4-2933 然后乘以系统内的激活通道数再乘以(根据配置和插入的内存可能不乘) 2 进行计算.
现在来说带宽一把还可以喂饱CPU,但是时延是非常重要的. 他决定了计算的响应时间. 时延一方面跟内存体质有关系.
另一方面也跟CPU的总线结构, 以及Core之间的互连结构有关系. 其他像是PCI-E以及ACHI接口对性能的影响主要体现在数据库和文件系统落盘上面.
应用环境一般不会考虑这个. 但是数据库会考虑的更多,
其实不管是网络还是存储. 都可以理解为是IO.都需要关注带宽以及延时.

UnixBench的简单测试与验证的更多相关文章

  1. shiro 简单的身份验证 案例

    Apache Shiro是Java的一个安全框架,Shiro可以帮助我们完成:认证.授权.加密.会话管理.与Web集成.缓存等. 简单的身份验证 项目目录: 首先,在shiro.ini里配置了用户名和 ...

  2. jQuery结合Ajax实现简单的前端验证和服务端查询

    上篇文章写了简单的前端验证由传统的JavaScript转向流畅的jQuery滑动验证,现在拓展一下,使用Ajax实现用户体验比较好的异步查询,同样还是从建立一个简单的表单开始 <form nam ...

  3. struts2+hibernate+spring注解版框架搭建以及简单测试(方便脑补)

    为了之后学习的日子里加深对框架的理解和使用,这里将搭建步奏简单写一下,目的主要是方便以后自己回来脑补: 1:File--->New--->Other--->Maven--->M ...

  4. ASP.NET Core 项目简单实现身份验证及鉴权

    ASP.NET Core 身份验证及鉴权 目录 项目准备 身份验证 定义基本类型和接口 编写验证处理器 实现用户身份验证 权限鉴定 思路 编写过滤器类及相关接口 实现属性注入 实现用户权限鉴定 测试 ...

  5. [20190211]简单测试端口是否打开.txt

    [20190211]简单测试端口是否打开.txt --//昨天看一个链接,提到如果判断一个端口是否打开可以简单执行如下:--//参考链接:https://dba010.com/2019/02/04/c ...

  6. MongoDB 副本集和C#交互,简单测试

    MongoDB 副本集和C#交互,简单测试 primary节点宕机: 模拟primary节点宕机的情况,这时查看监控: 可以看到37018已经成了primary节点.主界面宕机导致了整个集群发生一次e ...

  7. 技术分享 | 简单测试MySQL 8.0.26 vs GreatSQL 8.0.25的MGR稳定性表现

    欢迎来到 GreatSQL社区分享的MySQL技术文章,如有疑问或想学习的内容,可以在下方评论区留言,看到后会进行解答 GreatSQL社区原创内容未经授权不得随意使用,转载请联系小编并注明来源. M ...

  8. TODO:Golang UDP连接简单测试慎用Deadline

    TODO:Golang UDP连接简单测试慎用Deadline UDP 是User Datagram Protocol的简称, 中文名是用户数据报协议,是OSI(Open System Interco ...

  9. jQuery validate 根据 asp.net MVC的验证提取简单快捷的验证方式(jquery.validate.unobtrusive.js)

    最近在学习asp.netMVC,发现其中的验证方式书写方便快捷,应用简单,易学好懂. 验证方式基于jQuery的validate 验证方式,也可以说是对jQuery validate的验证方式的扩展, ...

  10. .net orm比较之dapper和Entity Framework6的简单测试比较

    .net orm比较之dapper和Entity Framework6的简单测试比较

随机推荐

  1. 4种方法帮你解决IntelliJ IDEA控制台中文乱码问题

    摘要:在本文中总结了4 种方法完美解决 IntelliJ IDEA 控制台中文乱码问题. 前言 IntelliJ IDEA 如果不进行配置的话,运行程序时控制台中文乱码问题会非常严重,严重影响我们对信 ...

  2. 如何正确使用Python临时文件

    摘要:临时文件通常用来保存无法保存在内存中的数据,或者传递给必须从文件读取的外部程序.一般我们会在/tmp目录下生成唯一的文件名,但是安全的创建临时文件并不是那么简单,需要遵守许多规则. 1.前言 临 ...

  3. 一文带你认识MindSpore新一代分子模拟库SPONGE

    [本期推荐专题]物联网从业人员必读:华为云专家为你详细解读LiteOS各模块开发及其实现原理. 摘要:基于MindSpore自动并行.图算融合等特性,SPONGE可高效地完成传统分子模拟过程,利用Mi ...

  4. 云图说|图解DGC:基于华为智能数据湖解决方案的一体化数据治理平台

    摘要:数据湖治理中心DGC,帮助企业快速构建从数据集成到数据服务的端到端智能数据系统,消除数据孤岛,统一数据标准,加快数据变现,实现数字化转型. 本文分享自华为云社区<[云图说]第232期 图解 ...

  5. 无法安装此app,因为无法验证其完整性 ,解决方案

    最近有很多兄弟萌跟我反应"无法安装此app,因为无法验证其完整性 ",看来这个问题无法避免了,今天统一回复下,出现提示主要有以下几种可能 1.安装包不完整 首先申请我所有分享的破解 ...

  6. PPT 动画-莲花绽放

    画两圆,合并形状 -> 相交 复制8个图片,一共9片 旋转 最后动画 -> 平滑

  7. 【vue3】创建vue3项目的两种方式 setup函数 ref和reactive 计算和监听属性 生命周期 hooks toRefs script setup的作用和lang=ts 后台管理模板

    目录 昨日回顾 今日内容 1 vue3介绍 2 创建vue3项目的两种方式 vue-cli创建Vue3项目 Vite创建Vue3项目 Vue3目录结构 Vite的优点 3 setup函数 Vue3创建 ...

  8. 第六届蓝桥杯C++C组 A~F题题解

    蓝桥杯历年国赛真题汇总:Here 1. 分机号 X老板脾气古怪,他们公司的电话分机号都是3位数,老板规定,所有号码必须是降序排列,且不能有重复的数位.比如: 751,520,321 都满足要求,而, ...

  9. 供应链安全情报 | cURL最新远程堆溢出漏洞复现与修复建议

    漏洞概述 cURL 是一个支持多种网络协议的开源项目,被广泛集成到自动化构建.网络测试.网络数据采集以及其他网络相关的任务中,备受开发者和系统管理员青睐. cURL在2023年10月11日下午紧急发布 ...

  10. node-sass安装失败,安装后无法使用 gyp verb check python checking for Python executable "python2" in the PATH

    这个问题搞了一会想起开始安装node-sass时的一句被我忽略的提示:执行 npm rebuild node-sass 这行后就可以了. 再说说 node-sass 的安装问题,现在使用 yarn i ...