每秒浮点运算次数flops
每秒浮点运算次数[编辑]
|
|
此条目需要补充更多来源。 (2018年2月28日) 请协助添加多方面可靠来源以改善这篇条目,无法查证的内容可能会因为异议提出而移除。 |
每秒浮点运算次数(亦称每秒峰值速度)是每秒所执行的浮点运算次数(英语:Floating-point operations per second;缩写:FLOPS)的简称,被用来估算电脑效能,尤其是在使用到大量浮点运算的科学计算领域中。因为FLOPS字尾的那个S代表秒,而不是复数,所以不能够省略。
浮点运算实际上包括了所有涉及浮点数的运算,在某类应用软件中常常出现,比较整数运算更用时间。现今大部分的处理器中都有浮点运算器。因此每秒浮点运算次数所量测的实际上就是浮点运算器的执行速度。而最常用来测量每秒浮点运算次数的基准程式(benchmark)之一,是Linpack。
评价[编辑]
许多专家[谁?]对每秒浮点运算次数颇多微词,认为它并不是一个有意义的量度,因为FLOPS并不能反应出许多对执行效能有影响的因素。例如:I/O的效能、内存的架构、快取内存一致性(cache coherence)。这意味着电脑的实际计算容量,与FLOPS的理论峰值间会有一段不小的差距。
随着新资讯科技时代(数据挖掘、机器学习、深度学习、BIG DATA 大数据、各种人工神经网络和人工智能等)及工业革命 4.0 的发展,与 FLOPS 运算效能指标有关的计算设备以显卡 GPU 和 FPGA 为主要核心,但 FLOPS 指标却未能准确地反映出以上设备在相关领域运算的效能表现。皆因以上设备的架构是利用 CUDA、OpenCL 等编程语言来实现加速相关应用程序的运算速度(普遍达 20 倍甚至高达过千倍),而这些技术的实现依赖的更多是如 GPU 比 CPU 拥有更多倍数集成的核心,如一块 NVIDIA GeForce GTX-750Ti 处理器就拥有高达 500+ 多个 CUDA Core,其 GFLOPS 性能表现理想但 GFLOPS 并未实际对大数据运算作出很大的贡献,更多地是因为成百计以上的 CUDA 核心(每核心内置各自的 ALU 算术逻辑运算单元)能进行并行运算而产生的指数级别运算速度提升。
换算[编辑]
- 一个MFLOPS(megaFLOPS)等于每秒一百万(106)次的浮点运算; [1]
- 一个GFLOPS(gigaFLOPS)等于每秒十亿/十亿(109)次的浮点运算;
- 一个TFLOPS(teraFLOPS)等于每秒一兆/一万亿(1012)次的浮点运算;
- 一个PFLOPS(petaFLOPS)等于每秒一千兆/一千万亿(1015)次的浮点运算;
- 一个EFLOPS(exaFLOPS)等于每秒一百京/一百亿亿(1018)次的浮点运算。
其他[编辑]
以下列出几个有代表性硬件的每秒浮点运算次数
- 注意:本页所收集之数据于大部分情况下仅供作实际参考值,视不同设备持有者的芯片品质及运作相关(如:厂商硬件设置、主板条件、供电系统设置、运作温度会因高温而自动强制降频作保护等因素)而有所不同,大致会与参考值有 (+/-)MAX 9 % 的差异值。
浮点性能参考指标 (xFLOPS) = 总运算核心数 x 每周期运算次数 x 处理器相对运作频率 i.e.: 1,228.8 GFLOPS/1.2288 TFLOPS = 384 Core x 4 x 800 MHz(0.8 GHz)
FLOPS[编辑]
- ENIAC: 300 FLOPS
MFLOPS[编辑]
- CRAY-1: 160 MFLOPS
- Raspberry Pi Broadcom CM2708 ARM11 @1 GHz(OC): 316.56 MFLOPS
- 好奇号 BAE RAD750 抗辐射处理器(基于 IBM PowerPC 750 设计)@0.1~0.2 GHz: 400 MIPS
GFLOPS[编辑]
- Intel Xeon 3.6 GHz: <1.8 GFLOPS
- Intel Pentium 4 HT 3.6Ghz: 7 GFLOPS
- Raspberry Pi Cluster (32 node)x Broadcom CM2708 ARM11@1 GHz: 10.13 GFLOPS (集群由 博伊西州立大学电气工程与计算机系博士生 Joshua Kiepert 实践)
- Nintendo Wii: 12 GFLOPS
- Intel Core 2 Duo E4300 14 GFLOPS
- ARM Mali-400 MP4 @ 533MHz: 19.2 GFLOPS
- 树莓派 上的 VideoCore: 24 GFLOPS
- Intel Core 2 Duo E8400 24 GFLOPS
- AMD Phenom 9950: 29.05 GFLOPS
- Intel Core i5-4210U: 36.77175 GFlops (Win 8.1/Pro x64, LinX 0.6.5, Problem Size=11,530, MiB=1,024, 3 times) in 27.798sec
- Intel Core 2 Quad Q8200 37 GFLOPS
- Intel Core 2 Extreme QX9770: 39.63 GFLOPS
- AMD Phenom II x4 955: 42.13 GFlopS
- Intel Core i5-4210U: 43.4467 GFlops (Win 8.1/Pro x64, LinX 0.6.5, Problem Size=11,530, MiB=1,024, 3 times) in 23.526sec
- Intel HD Graphics 2000 @ 1250MHz(SB): 60 GFLOPS
- Intel Core i7 965: 69.23 GFLOPS
- ARM Mali-T720 MP8 @ 600MHz: 81.6 Peak GFLOPS
- Intel Core i7 980 XE : 107.6 GFLOPS
- Intel HD Graphics 2500 @ 1150MHz(IVB): 110.4 GFLOPS
- Intel Core i5 2500K @ 4.5GHz: 123.35 GFLOPS (w/AVX instruction set)
- Intel HD Graphics 3000 @ 1300MHz: 125 GFLOPS
- Intel HD Graphics 3000 @ 1350MHz(SB): 129.6 GFLOPS
- New Intel HD Graphics GT1 @ 1150MHz(Haswell): 184 GFLOPS
- SONY PlayStation 3: 228.8 GFLOPS
- Mircosoft Xbox 360: 240 GFLOPS
- IBM POWER7: 264.96GFLOPS[2]
- ARM Mali-T760 MP16 @ 600MHz: 326 GFLOPS
- NVIDIA Jetson TK1 (Tegra K1) 开发平台-Ubuntu: 326 GFLOPS (此为最大值且于自带风扇下运作)
- Nintendo Wii U: 352 GFLOPS
- Intel HD Graphics 4000 @ 1300MHz(IVB): 332.8 GFLOPS
- NVIDIA GeForce 8800 Ultra(G80-450 GPU):393.6 GFLOPS
- Intel HD Graphics 4200/4400 (Mobile)/4600/P4600/P4700 GT2 @ 1350MHz: 432 GFLOPS
- AMD Radeon HD 3870(RV670 GPU):497 GFLOPS
- NVIDIA Tegra X1:512 GFLOPS
- Intel HD Graphics 5000 GT3 ~HD4XXX @ 1100MHz <15W+>: ~704 GFLOPS
- NVIDIA GeForce GTX 280(G200-300 GPU):720 GFLOPS
- NVIDIA GeForce 840M w/2GB vRAM: 790 GFLOPS
- NVIDIA GeForce 840M (2GB Dedicated VRAM): 790.3 GFLOPS
- Intel Iris Graphics 5100 @ 1100MHz <28W+>: 704 GFLOPS
- AMD Radeon HD 4870(RV770 GPU):1008 GFLOPS
- NVIDIA Jetson TX1: over 1,100 GFLOPS
TFLOPS[编辑]
- Microsoft Xbox One:1.31TFLOPS
- Microsoft Xbox One S:1.4052TFLOPS
- NVIDIA Geforce GTX 950(GM206 GPU):1.57 TFLOPS
- SONY PlayStation 4:1.84TFLOPS
- AMD Radeon HD 7850(Pitcairn GPU):1.946 TFLOPS
- NVIDIA Geforce GTX 960(GM206 GPU):2.3 TFLOPS
- NVIDIA Geforce GTX 580(GF110-375 GPU):2.37 TFLOPS
- NVIDIA Geforce GTX 680(GK104-400-A2 GPU):3.09 TFLOPS
- AMD Radeon R9 380(Tonga GPU):3.48 TFLOPS
- NVIDIA Geforce GTX 970(GM204 GPU):3.49 TFLOPS
- NVIDIA Geforce GTX 1060(GP106 GPU):3.85 TFLOPS
- SONY PlayStation 4 Pro:4.2TFLOPS
- AMD Radeon HD 7970 Ghz Edition(Tahiti XT2 GPU):4.3 TFLOPS
- NVIDIA Geforce GTX Titan(GK110 GPU):4.5 TFLOPS
- NVIDIA Geforce GTX 980(GM204 GPU):4.61 TFLOPS
- AMD Radeon HD 6990(R900 GPU):4.98 TFLOPS
- NVIDIA Geforce GTX 780Ti(GK110 GPU):5.046 TFLOPS
- AMD Radeon R9 390(Grenada GPU):5.1 TFLOPS
- AMD Radeon RX 480(Polaris 10 GPU):5.1 TFLOPS
- NVIDIA Geforce GTX 980 Ti(GM200 GPU):5.63 TFLOPS
- AMD Radeon R9 290X(Hawaii XT GPU):5.632 TFLOPS
- Microsoft Xbox One X:6 TFLOPS
- NVIDIA Geforce GTX 1070(GP104 GPU):6 TFLOPS
- NVIDIA Geforce GTX Titan X(GM200 GPU):7 TFLOPS
- NVIDIA Geforce GTX Titan Z(GK110 GPU):8.122 TFLOPS
- NVIDIA Geforce GTX 1070 ti (GP104-300) : 8.168 TFLOPS
- AMD Radeon R9 Nano(Fiji XT GPU):8.19 TFLOPS
- AMD Radeon HD 7990(Malta GPU):8.2 TFLOPS
- NVIDIA Geforce GTX 1080(GP104 GPU):9 TFLOPS
- NVIDIA Titan X(GP102 GPU):11 TFLOPS
- NVIDIA Geforce GTX 1080 Ti(GP102 GPU):11.5 TFLOPS
- AMD Radeon R9 295X2(Vesuvius GPU):11.46 TFLOPS
- NVIDIA Tesla P100 (For PCIe) :18.7 TFLOPS
- NVIDIA Tesla P100 (for NVLink): 21.2 TFLOPS
- Earth Simulator:35.61 TFLOPS
- NVIDIA Titan V (GV100 GPU) : 110 TFLOPS
- NVIDIA Tesla V100 (GV100 GPU) (For PCIe) :112 TFLOPS
- NVIDIA Tesla V100 (GV100 GPU) (for NVLink): 125 TFLOPS
- Blue Gene/L:135.5 TFLOPS
- 中国曙光Dawning 5000A:230 TFLOPS
PFLOPS[编辑]
- IBM Roadrunner:1.026 PFLOPS
- 台湾杉:1.7 PFLOPS
- Jaguar:1.75 PFLOPS
- 天河一号:2.566 PFLOPS
- IBM Mira: 8.16 PFLOPS
- 京:10.51 PFLOPS
- IBM Sequoia:16.32 PFLOPS
- Cray Titan:17.59 PFLOPS[3]
- BOINC运算平台:28.283 PFLOPS(2018-12-18)
- 天河二号:33.86 PFLOPS
- Folding@home运算平台:92.03 PFLOPS(随时变动)
- 神威太湖之光:93.01 PFLOPS
- Summit : 122.3 PFLOPS
EFLOPS[编辑]
参见[编辑]
注释[编辑]
- ^ 中文数字使用万进,一万万为一亿,一万亿为一兆,一万兆为一京;此处的兆不是SI词头mega。参见中文数字
- ^ IBM POWER7超高规格处理器正式发布. 2010年2月9日 [2011年12月18日]. (原始内容存档于2017年4月19日).
- ^ Oak Ridge Claims No. 1 Position on Latest TOP500 List with Titan. TOP500. November 12, 2012 [November 15, 2012].
外部链接[编辑]
每秒浮点运算次数flops的更多相关文章
- 磁盘 IOPS(每秒读写次数) 的计算方法
一.磁盘 I/O 的概念 I/O 的概念,从字义来理解就是输入输出.操作系统从上层到底层,各个层次之间均存在 I/O.比如,CPU 有 I/O,内存有 I/O, VMM 有 I/O, 底层磁盘上也有 ...
- (转载)CNN 模型所需的计算力(FLOPs)和参数(parameters)数量计算
FLOPS:注意全大写,是floating point operations per second的缩写,意指每秒浮点运算次数,理解为计算速度.是一个衡量硬件性能的指标. FLOPs:注意s小写,是f ...
- CNN中计算量FLOPs的计算
1.FLOPs的概念:全称是floating point operations per second,意指每秒浮点运算次数,即用来衡量硬件的计算性能:在CNN中用来指浮点运算次数: 2.计算过程: 如 ...
- yolo类检测算法解析——yolo v3
每当听到有人问“如何入门计算机视觉”这个问题时,其实我内心是拒绝的,为什么呢?因为我们说的计算机视觉的发展史可谓很长了,它的分支很多,而且理论那是错综复杂交相辉映,就好像数学一样,如何学习数学?这问题 ...
- 论文笔记——Deep Residual Learning for Image Recognition
论文地址:Deep Residual Learning for Image Recognition ResNet--MSRA何凯明团队的Residual Networks,在2015年ImageNet ...
- Roofline Model与深度学习模型的性能分析
原文链接: https://zhuanlan.zhihu.com/p/34204282 最近在不同的计算平台上验证几种经典深度学习模型的训练和预测性能时,经常遇到模型的实际测试性能表现和自己计算出的复 ...
- Efficient and Accurate Arbitrary-Shaped Text Detection with Pixel Aggregation Network(利用像素聚合网络进行高效准确的任意形状文本检测)
PSENet V2昨日刚出,今天翻译学习一下. 场景文本检测是场景文本阅读系统的重要一步,随着卷积神经网络的快速发展,场景文字检测也取得了巨大的进步.尽管如此,仍存在两个主要挑战,它们阻碍文字检测部署 ...
- teraflop级、TFLOPS、TOPS
FLOPS 每秒浮点运算次数,TFLOPS表示每秒万亿(10^12)次浮点计算: TFLOPS是floating point operations per second 每秒所执行的浮点运算次数. 1 ...
- ShuffleNet系列学习笔记
ShuffleNet是旷世提出的高效轻量化网络,是一款很值得一提的轻量化网络,其相关论文也是很有价值的. ShuffleNet V1 该网络提出于2017年,论文为<ShuffleNet: An ...
随机推荐
- 最简容器化动手小实践——再战flappybird
<Flappy Bird>是一名越南开发者所开发的游戏,这款游戏的主要内容是帮助一只小鸟穿越水管的层层阻碍,玩家所需要的只是点击屏幕从而调整小鸟的高度.而令这款游戏与众不同的是,这款游戏的 ...
- 在论坛中出现的比较难的sql问题:15(生成动态删除列语句 分组内多行转为多列)
原文:在论坛中出现的比较难的sql问题:15(生成动态删除列语句 分组内多行转为多列) 所以,觉得有必要记录下来,这样以后再次碰到这类问题,也能从中获取解答的思路. 1.如果去掉这个临时表中合计为0 ...
- SQL Server2008数据库报错与解决方法
一. 报错信息 启动MSSQLSERVER时有以下报错信息 打开SQL SERVER配置管理器,发现以下情况报错: 原因:由于先前安装了2005版VS,然后又安装了2015版VS 解决办法:卸载Loc ...
- processon使用教程
原文地址:https://www.cnblogs.com/yangliheng/p/6082250.html 一.引言 作为一名IT从业者,不仅要有扎实的知识储备,出色的业务能力,还需要具备一定的软实 ...
- 编写Postgres扩展之四:测试
原文:http://big-elephants.com/2015-11/writing-postgres-extensions-part-iv/ 编译:http://big-elephants.com ...
- Http 和 Socket 之间的恩爱情仇
前言 一些刚入门的小伙伴可能会用 Socket,也会用 OkHttp 或者 HttpUrlConnection 等一些 HTTP 客户端工具,这两个东西看着有点像可是又不太一样,到底是哪里不一样呢? ...
- https、加密安全
1.Https HTTPS在传输的过程中会涉及到三个密钥: 服务器端的公钥和私钥,用来进行非对称加密 客户端生成的随机密钥,用来进行对称加密 一个HTTPS请求实际上包含了两次HTTP传输,可以细分为 ...
- js 单引号和双引号相互替换的实现方法
1.双引号替换成单引号 var domo = JSON.stringify(address).replace(/\"/g,"'"); var a = {a:1,b:2}; ...
- 【已解决】老型号电脑需要按F1键才能进入系统
[已解决]老型号电脑需要按F1键才能进入系统 本文作者:天析 作者邮箱:2200475850@qq.com 发布时间: Tue, 16 Jul 2019 20:49:00 +0800 问题描述:电脑因 ...
- 【转载】解密ThreadLocal
概述 相信读者在网上也看了很多关于ThreadLocal的资料,很多博客都这样说:ThreadLocal为解决多线程程序的并发问题提供了一种新的思路:ThreadLocal的目的是为了解决多线程访问资 ...