fp16 的累加误差有多大

本文地址：https://wanger-sjtu.github.io/fp16-err/

最近在项目中需要实现fp16的数据类型做FFN的计算，算子实现的同学反馈误差与x86上得到的golden数据有比较大误差。开始以为是x86侧做数值模拟仿真的问题。后面也实现了对比了一下，发现误差累计确实挺大。

实测结果对比

int main()

{

    // Seed with a real random value, if available

    std::random_device rd;

    std::mt19937 gen(rd());

    std::uniform_real_distribution<> dist(0, 0.01);

    float16_t lhs[4096] = {0};

    float16_t rhs[4096] = {0};

    for (int i = 0; i < 4096; i++) {

        lhs[i] =  dist(gen);

        rhs[i] =  dist(gen);

    }

    float16_t res_fp16 = 0;

    float res_fp32 = 0;

    for (int i = 0; i < 4096; i++) {

        res_fp16 += lhs[i] * rhs[i];

        res_fp32 += lhs[i] * rhs[i];

    }

    std::cout << "fp16 " << res_fp16 << std::endl;

    std::cout << "fp32 " << res_fp32 << std::endl;

    wirte2file("/data/local/tmp/lhs", reinterpret_cast<char*>(lhs), 8192);

    wirte2file("/data/local/tmp/rhs", reinterpret_cast<char*>(rhs), 8192);

}

结果输出：

fp16 0.0942383

fp32 0.103176

相对误差到8.1%了。难怪反馈有问题。

dim	绝对误差
100	1.63913e-07
1000	-0.00033829
2000	-0.000909835
4000	-0.00924221

golden 数据误差从何而来

实际生成golden数据的时候，也考虑了数值类型差异的影响，那为什么还存在误差呢？

对比了一下dot的视线与直接累加结果

import numpy as np

import torch

lhs = np.fromfile("lhs",dtype=np.float16)

rhs = np.fromfile("rhs",dtype=np.float16)

lhs = torch.from_numpy(lhs)

rhs = torch.from_numpy(rhs)

res = torch.Tensor([1]).half()

res[0] = 0

for i in range(4096):

    res += lhs[i:i+1] * rhs[i:i+1]

print(res)

print(torch.dot(lhs, rhs))

tensor([0.0942], dtype=torch.float16)

tensor(0.1041, dtype=torch.float16)

结果对得上了。torch 的 dot实现的时候很可能用了更高数值类型做累加。

fp16 的累加误差有多大的更多相关文章

浮点数float累加误差解决方式总结
首先是float累加产生误差的原因,该部分转自:http://blog.csdn.net/zhrh0096/article/details/38589067 1. 浮点数IEEE 754表示方法要 ...
html5物理定位误差大解决办法
学生党在做比赛作品,项目中需求要用到定位功能并以地图形式展现.所以思路就是用h5的geolocation 获取经纬度,通过百度地图api将经纬度转换成详细的地址以及地图.在笔记本电脑做测试,定位总有超 ...
【十大经典数据挖掘算法】C4.5
[十大经典数据挖掘算法]系列 C4.5 K-Means SVM Apriori EM PageRank AdaBoost kNN Naïve Bayes CART 1. 决策树模型与学习决策树(de ...
大数据计算：如何仅用1.5KB内存为十亿对象计数
大数据计算:如何仅用1.5KB内存为十亿对象计数 Big Data Counting: How To Count A Billion Distinct Objects Using Only 1.5K ...
[DeeplearningAI笔记]ML strategy_1_3可避免误差与改善模型方法
机器学习策略 ML strategy 觉得有用的话,欢迎一起讨论相互学习~Follow Me 1.8 为什么是人的表现今天,机器学习算法可以与人类水平的表现性能竞争,因为它们在很多应用程序中更有生产 ...
C语言面试题大汇总之华为面试题 Eddy整理
1.局部变量能否和全局变量重名? 答:能,局部会屏蔽全局.要用全局变量,需要使用"::" ;局部变量可以与全局变量同名,在函数内引用这个变量时,会用到同名的局部变量,而不会用到全局 ...
机器学习（3）- 学习建议<误差出现如何解决？>
根据Andrew Ng在斯坦福的<机器学习>视频做笔记,已经通过李航<统计学习方法>获得的知识不赘述,仅列出提纲. 1 学习建议误差太大,如何改进? 使用更多的训练样本→解决 ...
机器学习中的误差 Where does error come from？
误差来自于偏差和方差(bias and variance) 对于随机变量 X,假设其期望和方差分别为 μ 和 σ2.随机采样 N 个随机变量构成样本,计算算术平均值 m,并不会直接得到 μ (除非 ...
对ADC（DAC）的线性度（INL和DNL）的一点理解 [转]
大家在使用ADC的时候,往往最关注位数,而对ADC的线性度往往会忽略. 其实这个线性度也是ADC非常重要的指标,ADC(或DAC,其实ADC也是由DAC组成的)线性度指标有两个: INL:翻译过来叫“ ...
一个 11 行 Python 代码实现的神经网络
一个 11 行 Python 代码实现的神经网络 2015/12/02 · 实践项目 · 15 评论· 神经网络分享到:18 本文由伯乐在线 - 耶鲁怕冷翻译,Namco 校稿.未经许可,禁止转 ...

随机推荐

MySQL 实现 EF Code First TimeStamp/RowVersion 并发控制
在将项目迁移到MySQL 5.6.10数据库上时,遇到和迁移到PostgreSQL数据库相同的一个问题,就是TimeStamp/RowVersion并发控制类型在非Microsoft SQL Serv ...
TIER 2: Archetype
TIER 2: Archetype 扫描 nmap 使用 nmap 进行扫描目标 IP,发现目标是 Windows 服务器,开放 SMB 和 SQL Server 服务. SMB SMB 之前已经接触 ...
python 列表append和的区别？？
python列表中的合并 python列表中append方法是给列表增加一个元素,而'+='是增加上该符号后边的元素,类似于extend方法不知道对错,先记下来.我学的append方法是在列表最后追 ...
VUE系列---深度解析 Vue 优化策略
在前端开发中,性能优化一直是一个重要的课题.Vue.js 提供了多种优化策略,帮助开发者构建高性能的应用.本文将深入解析以下几个优化策略: 使用 v-once.v-if 和 v-show 的区别和优化 ...
elasticsearch初步使用学习
通过使用elasticsearch,我们可以加快搜索时间(直接使用SQL的模糊查询搜索耗时会比较久,而且elasticsearch的响应耗时与数据量关系不大) es主要用于存储,计算,搜索数据依次部 ...
【MySQL】拆分经纬度字段
数据结构: 表中一字段存储经度和纬度: +---------------------------+ | INSTALL_LOLA_NUM | +---------------------------+ ...
【Java】API SecureRandom 安全随机
之前学习的Random工具类只是一个伪随机数类... @Test public void secureRandom() throws Exception { // 个不可预测的安全的随机数 // 无法 ...
（ Ubuntu环境下）Vim插件推荐-Python自动补齐Vim插件jedi-vim的安装（使用插件管理器vundle进行安装）
Ubuntu系统下,为 Vim 安装python自动补齐的插件 jedi-vim . 1. jedi-vim安装依赖首先,jedi-vim插件需要当前Vim版本支持python,在终端输 ...
域名所有权验证 —— DNS TXT 域名验证
参考: https://help.aliyun.com/zh/cdn/getting-started/verify-the-ownership-of-a-domain-name https://blo ...
在WSL Ubuntu中设置sshd自启动
参考: https://blog.csdn.net/android_cai_niao/article/details/128490566 ------------------------------- ...

fp16 的累加误差有多大

实测结果对比

golden 数据误差从何而来

fp16 的累加误差有多大的更多相关文章

随机推荐

热门专题