每秒浮点运算次数[编辑]

维基百科，自由的百科全书

此条目需要补充更多来源。 (2018年2月28日)
请协助添加多方面可靠来源以改善这篇条目，无法查证的内容可能会因为异议提出而移除。

每秒浮点运算次数（亦称每秒峰值速度）是每秒所执行的浮点运算次数（英语：Floating-point operations per second；缩写：FLOPS）的简称，被用来估算电脑效能，尤其是在使用到大量浮点运算的科学计算领域中。因为FLOPS字尾的那个S代表秒，而不是复数，所以不能够省略。

浮点运算实际上包括了所有涉及浮点数的运算，在某类应用软件中常常出现，比较整数运算更用时间。现今大部分的处理器中都有浮点运算器。因此每秒浮点运算次数所量测的实际上就是浮点运算器的执行速度。而最常用来测量每秒浮点运算次数的基准程式（benchmark）之一，是Linpack。

评价[编辑]

许多专家^[谁？]对每秒浮点运算次数颇多微词，认为它并不是一个有意义的量度，因为FLOPS并不能反应出许多对执行效能有影响的因素。例如：I/O的效能、内存的架构、快取内存一致性（cache coherence）。这意味着电脑的实际计算容量，与FLOPS的理论峰值间会有一段不小的差距。

随着新资讯科技时代（数据挖掘、机器学习、深度学习、BIG DATA 大数据、各种人工神经网络和人工智能等）及工业革命 4.0 的发展，与 FLOPS 运算效能指标有关的计算设备以显卡 GPU 和 FPGA 为主要核心，但 FLOPS 指标却未能准确地反映出以上设备在相关领域运算的效能表现。皆因以上设备的架构是利用 CUDA、OpenCL 等编程语言来实现加速相关应用程序的运算速度（普遍达 20 倍甚至高达过千倍），而这些技术的实现依赖的更多是如 GPU 比 CPU 拥有更多倍数集成的核心，如一块 NVIDIA GeForce GTX-750Ti 处理器就拥有高达 500+ 多个 CUDA Core，其 GFLOPS 性能表现理想但 GFLOPS 并未实际对大数据运算作出很大的贡献，更多地是因为成百计以上的 CUDA 核心（每核心内置各自的 ALU 算术逻辑运算单元）能进行并行运算而产生的指数级别运算速度提升。

换算[编辑]

一个MFLOPS（megaFLOPS）等于每秒一百万（10⁶）次的浮点运算； ^[1]
一个GFLOPS（gigaFLOPS）等于每秒十亿/十亿（10⁹）次的浮点运算；
一个TFLOPS（teraFLOPS）等于每秒一兆/一万亿（10¹²）次的浮点运算；
一个PFLOPS（petaFLOPS）等于每秒一千兆/一千万亿（10¹⁵）次的浮点运算；
一个EFLOPS（exaFLOPS）等于每秒一百京/一百亿亿（10¹⁸）次的浮点运算。

其他[编辑]

以下列出几个有代表性硬件的每秒浮点运算次数

注意：本页所收集之数据于大部分情况下仅供作实际参考值，视不同设备持有者的芯片品质及运作相关（如：厂商硬件设置、主板条件、供电系统设置、运作温度会因高温而自动强制降频作保护等因素）而有所不同，大致会与参考值有 (+/-)MAX 9 % 的差异值。

浮点性能参考指标 (xFLOPS) = 总运算核心数 x 每周期运算次数 x 处理器相对运作频率 i.e.: 1,228.8 GFLOPS/1.2288 TFLOPS = 384 Core x 4 x 800 MHz(0.8 GHz)

FLOPS[编辑]

ENIAC: 300 FLOPS

MFLOPS[编辑]

CRAY-1: 160 MFLOPS
Raspberry Pi Broadcom CM2708 ARM11 @1 GHz(OC): 316.56 MFLOPS
好奇号 BAE RAD750 抗辐射处理器(基于 IBM PowerPC 750 设计)@0.1~0.2 GHz: 400 MIPS

GFLOPS[编辑]

Intel Xeon 3.6 GHz: <1.8 GFLOPS
Intel Pentium 4 HT 3.6Ghz: 7 GFLOPS

Raspberry Pi Cluster (32 node)x Broadcom CM2708 ARM11@1 GHz: 10.13 GFLOPS (集群由博伊西州立大学电气工程与计算机系博士生 Joshua Kiepert 实践)
Nintendo Wii: 12 GFLOPS
Intel Core 2 Duo E4300 14 GFLOPS
ARM Mali-400 MP4 @ 533MHz: 19.2 GFLOPS
树莓派上的 VideoCore: 24 GFLOPS
Intel Core 2 Duo E8400 24 GFLOPS
AMD Phenom 9950: 29.05 GFLOPS
Intel Core i5-4210U: 36.77175 GFlops (Win 8.1/Pro x64, LinX 0.6.5, Problem Size=11,530, MiB=1,024, 3 times) in 27.798sec
Intel Core 2 Quad Q8200 37 GFLOPS
Intel Core 2 Extreme QX9770: 39.63 GFLOPS
AMD Phenom II x4 955: 42.13 GFlopS
Intel Core i5-4210U: 43.4467 GFlops (Win 8.1/Pro x64, LinX 0.6.5, Problem Size=11,530, MiB=1,024, 3 times) in 23.526sec
Intel HD Graphics 2000 @ 1250MHz(SB): 60 GFLOPS
Intel Core i7 965: 69.23 GFLOPS
ARM Mali-T720 MP8 @ 600MHz: 81.6 Peak GFLOPS
Intel Core i7 980 XE : 107.6 GFLOPS
Intel HD Graphics 2500 @ 1150MHz(IVB): 110.4 GFLOPS
Intel Core i5 2500K @ 4.5GHz: 123.35 GFLOPS (w/AVX instruction set)
Intel HD Graphics 3000 @ 1300MHz: 125 GFLOPS
Intel HD Graphics 3000 @ 1350MHz(SB): 129.6 GFLOPS
New Intel HD Graphics GT1 @ 1150MHz(Haswell): 184 GFLOPS
SONY PlayStation 3: 228.8 GFLOPS
Mircosoft Xbox 360: 240 GFLOPS
IBM POWER7: 264.96GFLOPS^[2]
ARM Mali-T760 MP16 @ 600MHz: 326 GFLOPS
NVIDIA Jetson TK1 (Tegra K1) 开发平台-Ubuntu: 326 GFLOPS (此为最大值且于自带风扇下运作)
Nintendo Wii U: 352 GFLOPS
Intel HD Graphics 4000 @ 1300MHz(IVB): 332.8 GFLOPS
NVIDIA GeForce 8800 Ultra（G80-450 GPU）:393.6 GFLOPS
Intel HD Graphics 4200/4400 (Mobile)/4600/P4600/P4700 GT2 @ 1350MHz: 432 GFLOPS
AMD Radeon HD 3870（RV670 GPU）:497 GFLOPS
NVIDIA Tegra X1:512 GFLOPS
Intel HD Graphics 5000 GT3 ~HD4XXX @ 1100MHz <15W+>: ~704 GFLOPS
NVIDIA GeForce GTX 280（G200-300 GPU）:720 GFLOPS
NVIDIA GeForce 840M w/2GB vRAM: 790 GFLOPS
NVIDIA GeForce 840M (2GB Dedicated VRAM): 790.3 GFLOPS
Intel Iris Graphics 5100 @ 1100MHz <28W+>: 704 GFLOPS
AMD Radeon HD 4870（RV770 GPU）:1008 GFLOPS
NVIDIA Jetson TX1: over 1,100 GFLOPS

TFLOPS[编辑]

Microsoft Xbox One：1.31TFLOPS
Microsoft Xbox One S：1.4052TFLOPS
NVIDIA Geforce GTX 950（GM206 GPU）：1.57 TFLOPS
SONY PlayStation 4：1.84TFLOPS
AMD Radeon HD 7850（Pitcairn GPU）：1.946 TFLOPS
NVIDIA Geforce GTX 960（GM206 GPU）：2.3 TFLOPS
NVIDIA Geforce GTX 580（GF110-375 GPU）：2.37 TFLOPS
NVIDIA Geforce GTX 680（GK104-400-A2 GPU）：3.09 TFLOPS
AMD Radeon R9 380（Tonga GPU）：3.48 TFLOPS
NVIDIA Geforce GTX 970（GM204 GPU）：3.49 TFLOPS
NVIDIA Geforce GTX 1060（GP106 GPU）：3.85 TFLOPS
SONY PlayStation 4 Pro：4.2TFLOPS
AMD Radeon HD 7970 Ghz Edition（Tahiti XT2 GPU）：4.3 TFLOPS
NVIDIA Geforce GTX Titan（GK110 GPU）：4.5 TFLOPS
NVIDIA Geforce GTX 980（GM204 GPU）：4.61 TFLOPS
AMD Radeon HD 6990（R900 GPU）：4.98 TFLOPS
NVIDIA Geforce GTX 780Ti（GK110 GPU）：5.046 TFLOPS
AMD Radeon R9 390（Grenada GPU）：5.1 TFLOPS
AMD Radeon RX 480（Polaris 10 GPU）：5.1 TFLOPS
NVIDIA Geforce GTX 980 Ti（GM200 GPU）：5.63 TFLOPS
AMD Radeon R9 290X（Hawaii XT GPU）：5.632 TFLOPS
Microsoft Xbox One X：6 TFLOPS
NVIDIA Geforce GTX 1070（GP104 GPU）：6 TFLOPS
NVIDIA Geforce GTX Titan X（GM200 GPU）：7 TFLOPS
NVIDIA Geforce GTX Titan Z（GK110 GPU）：8.122 TFLOPS
NVIDIA Geforce GTX 1070 ti (GP104-300) : 8.168 TFLOPS
AMD Radeon R9 Nano（Fiji XT GPU）：8.19 TFLOPS
AMD Radeon HD 7990（Malta GPU）：8.2 TFLOPS
NVIDIA Geforce GTX 1080（GP104 GPU）：9 TFLOPS
NVIDIA Titan X（GP102 GPU）：11 TFLOPS
NVIDIA Geforce GTX 1080 Ti（GP102 GPU）：11.5 TFLOPS
AMD Radeon R9 295X2（Vesuvius GPU）：11.46 TFLOPS
NVIDIA Tesla P100 (For PCIe) :18.7 TFLOPS
NVIDIA Tesla P100 (for NVLink): 21.2 TFLOPS
Earth Simulator：35.61 TFLOPS
NVIDIA Titan V (GV100 GPU) : 110 TFLOPS
NVIDIA Tesla V100 (GV100 GPU) (For PCIe) :112 TFLOPS
NVIDIA Tesla V100 (GV100 GPU) (for NVLink): 125 TFLOPS
Blue Gene/L：135.5 TFLOPS
中国曙光Dawning 5000A：230 TFLOPS

PFLOPS[编辑]

IBM Roadrunner：1.026 PFLOPS
台湾杉：1.7 PFLOPS
Jaguar：1.75 PFLOPS
天河一号：2.566 PFLOPS
IBM Mira: 8.16 PFLOPS
京：10.51 PFLOPS
IBM Sequoia：16.32 PFLOPS
Cray Titan：17.59 PFLOPS^[3]
BOINC运算平台：28.283 PFLOPS（2018-12-18）
天河二号：33.86 PFLOPS
Folding@home运算平台：92.03 PFLOPS（随时变动）
神威太湖之光：93.01 PFLOPS
Summit : 122.3 PFLOPS

EFLOPS[编辑]

比特币全网算力(2013/5) : 1 EFLOPS
比特币全网算力(2018/5) : 35 EFLOPS

参见[编辑]

注释[编辑]

^ 中文数字使用万进，一万万为一亿，一万亿为一兆，一万兆为一京；此处的兆不是SI词头mega。参见中文数字
^ IBM POWER7超高规格处理器正式发布. 2010年2月9日 [2011年12月18日]. （原始内容存档于2017年4月19日）.
^ Oak Ridge Claims No. 1 Position on Latest TOP500 List with Titan. TOP500. November 12, 2012 [November 15, 2012].

外部链接[编辑]

每秒浮点运算次数flops的更多相关文章

磁盘 IOPS（每秒读写次数）的计算方法
一.磁盘 I/O 的概念 I/O 的概念,从字义来理解就是输入输出.操作系统从上层到底层,各个层次之间均存在 I/O.比如,CPU 有 I/O,内存有 I/O, VMM 有 I/O, 底层磁盘上也有 ...
(转载)CNN 模型所需的计算力（FLOPs）和参数（parameters）数量计算
FLOPS:注意全大写,是floating point operations per second的缩写,意指每秒浮点运算次数,理解为计算速度.是一个衡量硬件性能的指标. FLOPs:注意s小写,是f ...
CNN中计算量FLOPs的计算
1.FLOPs的概念:全称是floating point operations per second,意指每秒浮点运算次数,即用来衡量硬件的计算性能:在CNN中用来指浮点运算次数: 2.计算过程: 如 ...
yolo类检测算法解析——yolo v3
每当听到有人问“如何入门计算机视觉”这个问题时,其实我内心是拒绝的,为什么呢?因为我们说的计算机视觉的发展史可谓很长了,它的分支很多,而且理论那是错综复杂交相辉映,就好像数学一样,如何学习数学?这问题 ...
论文笔记——Deep Residual Learning for Image Recognition
论文地址:Deep Residual Learning for Image Recognition ResNet--MSRA何凯明团队的Residual Networks,在2015年ImageNet ...
Roofline Model与深度学习模型的性能分析
原文链接: https://zhuanlan.zhihu.com/p/34204282 最近在不同的计算平台上验证几种经典深度学习模型的训练和预测性能时,经常遇到模型的实际测试性能表现和自己计算出的复 ...
Efficient and Accurate Arbitrary-Shaped Text Detection with Pixel Aggregation Network（利用像素聚合网络进行高效准确的任意形状文本检测）
PSENet V2昨日刚出,今天翻译学习一下. 场景文本检测是场景文本阅读系统的重要一步,随着卷积神经网络的快速发展,场景文字检测也取得了巨大的进步.尽管如此,仍存在两个主要挑战,它们阻碍文字检测部署 ...
teraflop级、TFLOPS、TOPS
FLOPS 每秒浮点运算次数,TFLOPS表示每秒万亿(10^12)次浮点计算: TFLOPS是floating point operations per second 每秒所执行的浮点运算次数. 1 ...
ShuffleNet系列学习笔记
ShuffleNet是旷世提出的高效轻量化网络,是一款很值得一提的轻量化网络,其相关论文也是很有价值的. ShuffleNet V1 该网络提出于2017年,论文为<ShuffleNet: An ...

随机推荐

PB之常用函数
原文网址:https://www.cnblogs.com/zhaoxiong/p/8082523.html PB之常用函数弹出窗口:messagebox() 基本写法:Messagebox('标题' ...
SPA项目首页导航+左侧菜单
Mock.js是个啥前后端分离之后,前端迫切需要一种机制,不再需要依赖后端接口开发,而今天的主角mockjs就可以做到这一点 Mock.js是一个模拟数据的生成器,用来帮助前端调试开发.进行前后端的 ...
关于memset的赋值（最大值最小值的选择）
memset赋值赋的是ASSCII码转为二进制赋值比如 memset(,0xff,sizeof()),0xff转为二进制11111111,int为4字节所以最后为111111111111111111 ...
[PKUSC2018]主斗地(搜索+贪心)
首先如果对子和三张牌出现在解中,那么全拆成单张显然没有问题,顺子同理.于是真正有用的牌型就只有单牌.三带一.三带二.四带二了. 暴搜jry手中的牌,然后先搜出双方的大牌型(即三张.四张牌的个数),再枚 ...
NetLink通信原理研究、Netlink底层源码分析、以及基于Netlink_Connector套接字监控系统进程行为技术研究
1. Netlink简介 0x1:基本概念 Netlink是一个灵活,高效的”内核-用户态“.”内核-内核“.”用户态-用户态“通信机制.通过将复杂的消息拷贝和消息通知机制封装在统一的socket a ...
CentOS7 安装 Git
环境: 系统版本:CentOS 7.5 Git 版本:2.20.1 一.安装 Git 1.下载编译工具 $ yum -y groupinstall "Development Tools&qu ...
第四篇：python基础之杂货铺
在这一篇中我们将对上几篇的Python零碎的知识进行补充,即字符串的格式化输出,以及深浅拷贝,接下来我们将对这两种进行一一介绍. 一.字符串格式化输出关于字符串的格式化输出,我们需要了解为什么需要字 ...
RHEL/CentOS/Fedora各种源(EPEL、Remi、RPMForge、RPMFusion)
参考:RHEL/CentOS/Fedora各种源(EPEL.Remi.RPMForge.RPMFusion)配置简介 CentOS 默认自带 CentOS-Base.repo 源, 但官方源中去除了 ...
python返回值的缺省设置
有时候并不需要返回所有的值,但是原始函数的return语句中又有较多参数时: 方法一:修改原始返回值,只返回需要的参数方法二:如果原始函数时第三方库或者python自带库,则直接修改可能不太好,于是 ...
Log parser工具使用
Windows日志存放于目录“C:\Windows\System32\winevt\Logs”中, 在目录中可以找到“System”.“Setup”.“Application”.“Security” ...

每秒浮点运算次数flops