AI中各种浮点精度概念集合：fp16，fp32，bf16，tf32，fp24，pxr24，ef32

周荣华 2024-10-08 00:55:29 原文

常见的浮点类型有fp16，fp32，bf16，tf32，fp24，pxr24，ef32，能表达的数据范围主要看exponent，精度主要看fraction。

可以看出表达的数据范围看fp32，bf16，tf32，pxr24和ef32都是一样的，因为大家能表达的都是-2²⁵⁴~2²⁵⁵这个大概范围。fp24到表达范围比上面这些小，是-2¹²⁶~2¹²⁷

从精度上看fp32>pxr24>ef32>tf32>bf16，燧原的ef32都精度比Nvidia的fp32的精度多了一位，但都显著优于google的bf16，燧原的ef32，Nvidia的tf32都是使用fp16的计算性能像fp32的表达范围靠齐的一种尝试。

之前看《Enflame 2.0 Whitepaper_Dorado》的时候，看到描述tf32是1+8+11，还和一位同事纠结了一下，后来才知道燧原白皮书里面说的tf32其实是自己的ef32，并不是Nvidia的tf32，多设计一位精度最初是为了规避专利风险，后面也有精度和性能的折中考虑。

ef32总共20bits，而tf32是19bits，从硬件设计上说20bits的性能应该比19bits更好，当前也不排除Nvidia另外拿一个bit来作为奇偶校验位之类的设计。

另外，AI中也有很多场合用定点数据，就是编程语言里面说的整型，一般用INT8，类似C语言里面的char和byte。

IEEE half-precision

16-bit float

IEEE 754 single-precision

32-bit float

bfloat16

NVidia's TensorFloat(tf32)

AMD's fp24 format

Pixar's PXR24 format

Enflame's ef32

更多参考文档:

AI中各种浮点精度概念集合：fp16，fp32，bf16，tf32，fp24，pxr24，ef32的更多相关文章

PHP中的浮点精度和类型
PHP中的浮点数精度在PHP中,浮点数的字长和平台相关,通常最大值是 1.8e308 并具有 14 位十进制数字的精度(64 位 IEEE 格式). 浮点数的精度有限.尽管取决于系统,PHP 通常 ...
（转）实现AI中LOD优化技术
LOD(Level Of Detail)是3D渲染中用到的概念,按照wikipedia上的翻译,可以译为“细节层次”,它是一种根据与观察点的距离,来减低物体或者模型的复杂度来提升渲染效率的优化技术,因 ...
D3D9 浮点精度的问题
最近在对我们的渲染引擎进行优化的时候,发现一个奇怪的现象,因为我们做了Pre-Z(把比较大的物体先绘制一遍,这个时候关闭颜色写,只开启深度测试和写入,目的是为了减少后面一些不可见像素的计算.),面在绘 ...
Java中浮点数的精度问题【转】
当您在计算Money的时候,请看好了!!!要不损失了别后悔!!! 现象1: public static void main(String[] args) { System.out.println(0. ...
【JVM虚拟机】(8)--深入理解Class中--方法、属性表集合
#[JVM虚拟机](8)--深入理解Class中--方法.属性表集合之前有关class文件已经写了两篇博客: 1.[JVM虚拟机](5)---深入理解JVM-Class中常量池 2.[JVM虚拟机] ...
用人类社会工程学对C语言中的一些基本概念的剖析与理解
最近在学C语言程序设计时总是遇到一些概念理解上的不清晰与混乱的地方,在一次偶然间想到了以前看过的一部电影<我是谁,没有一个系统是安全的>,里面的主角用社会工程学的想法结合黑客知识化险为夷, ...
Android中Cursor类的概念和用法[转]
首页 > 程序开发 > 移动开发 > Android > 正文 Android中Cursor类的概念和用法 2011-09-07 0个评论收藏 ...
JAVA中数组的基本概念与用法
JAVA中数组的基本概念与用法 1. 数组的定义与特点数组的一种引用数据类型数组中可以同时存放多个数据,但是数据的类型必须统一数组的长度在开始时就需要确定,在程序运行期间是不可改变的虽然可以使 ...
大数据学习day19-----spark02-------0 零碎知识点（分区，分区和分区器的区别） 1. RDD的使用（RDD的概念，特点，创建rdd的方式以及常见rdd的算子） 2.Spark中的一些重要概念
0. 零碎概念 (1) 这个有点疑惑,有可能是错误的. (2) 此处就算地址写错了也不会报错,因为此操作只是读取数据的操作(元数据),表示从此地址读取数据但并没有进行读取数据的操作 (3)分区(有时间 ...

随机推荐

Hadoop：什么是Hadoop??
官方讲解: Apache Hadoop 为可靠的,可扩展的分布式计算开发开源软件.Apache Hadoop软件库是一个框架,它允许使用简单的编程模型跨计算机群集分布式处理大型数据集(海量的数据). ...
Leetcode No.121 Best Time to Buy and Sell Stock(c++实现）
1. 题目 1.1 英文题目 You are given an array prices where prices[i] is the price of a given stock on the it ...
vue（17）vue-route路由管理的安装与配置
介绍 Vue Router 是 Vue.js官方的路由管理器.它和 Vue.js 的核心深度集成,让构建单页面应用变得易如反掌.包含的功能有: 嵌套的路由/视图表模块化的.基于组件的路由配置路由参 ...
ArcnLinux安装基础配置（二）
本文为对此ArchLinux安装使用教程网站中部分内容的总结和扩展补充,想看更详细的内容可以去此网站. 添加一个用户 useradd -m -G wheel -s /bin/bash cirry 设置 ...
将make的输出（标准输出/标准错误输出）重定向到文件
方式描述符含义 stdin 0 标准输入 stdout 1 标准输出 stderr 2 标准错误输出 1.想要把make输出的全部信息,输出到某个文件中最常见的办法就是:make xxx > ...
C++ 11 智能指针（shared_ptr）类成员函数详解
C++ 11 模板库的 <memory> 头文件中定义的智能指针,即 shared_ptr 模板类,用来管理指针的存储,提供有限的内存回收函数,可同时与其他对象共享该管理功能. share ...
shell 正则表达式一
正则表达式用于处理文本,精通运用正则表达式可以有效的解决工作的效率正则表达式有基础正则表达式和扩展正则表达式区别 grep支持基础的正则表达式,grep -E (egrep)支持扩展正则表达式 1. ...
学生信息管理系统--基于jsp技术和MySQL的简单增删改查
web实现增删改查的方式有很多啊,对于初学者来说当然是要先了解各部分的传值的方式.本篇博客从jsp技术的最基础方面进行说明. 一.什么是jsp技术首先,我们要了解什么是jsp技术. jsp技术是基于 ...
Java基础00-接口21
1. 接口 1.1 接口概述 1.2 接口的特点 1.3 接口的成员特点 1.3.1 案例:猫和狗 public interface Jumpping { public void jump(); } ...
SLAM十四讲第二版项目代码总结
github地址:https://github.com/gaoxiang12/slambook2/tree/master/ch13 双目视觉里程计头文件所有的类都在myslam命名空间中 1.co ...