float double 如何存储计算2 （这个写的也不错）

目前java遵照IEEE制定的浮点数表示法来进行float,double运算。这种结构是一种科学计数法，用符号、指数和尾数来表示，底数定为2——即把一个浮点数表示为尾数乘以2的指数次方再添上符号。

我们来看一段java代码：

public class FloatToBinary {
	public static void main(String[] args) {
		float f1=8.5f;
		System.out.println("f1底层数据(十进制)："+Float.floatToIntBits(f1));
		int int1=Float.floatToIntBits(f1);
		System.out.println("f1底层数据(二进制)："+Integer.toBinaryString(int1));
	}
}

打印结果：
f1底层数据(十进制)：1091043328
f1底层数据(二进制)：1000001000010000000000000000000

我们知道float与double分别在内存中占有32位和64位，见下：

	符号位	阶码	尾数	长度
float	1	8	23	32
double	1	11	52	64

IEEE浮点数表示标准：

V = (-1)^s×M×2^E

E = e-Bias

其中Bias表示偏移量，float的偏移量为Bias=2^k-1-1=2^8-1-1=127，double的偏移量为Bias=2¹⁰-1=1023

浮点数在计算机中存储时，按照二进制科学计数法拆分为三个部分：符号位、指数部分和尾数部分。如下图所示：

存储时，按照最高位存储符号位，次高位存储指数部分，低位存储尾数部分的次序存储。存储时的排列示意图如下：

float类型的内存分布如下图所示：

double类型的内存分布如下图所示：

编码规则

在实际存储时要对使用二进制科学计数法表示的浮点数值的符号位、指数部分和尾数部分进行编码处理。一般需要分为规约形式的浮点数、非规约形式的浮点数和特殊值三种类型进行编码。其编码前后处理如下图所示：

注：非规约浮点数主要用于扩大0值附近的浮点数表示范围，非规约浮点数的绝对值均小于规约浮点数的绝对值，即前者在实数轴上更靠近0，这样可以提高0附近的计算精度；一般C、C++中float和double的取值范围都是按照规约浮点数定义的，MSDN文档和相关教材也是这么说的，但部分编译器按照ANSI/IEEE Std 754-1985标准实现了非规约浮点数，本文末尾留有程序示例说明。

符号位：0表示正数，1表示负数；

指数部分： float的偏移量为2^8 - 1，double的偏移量为2^11 - 1；

尾数部分：实际尾数部分中的小数点后的数值，规约浮点数使用标准的二进制科学计数法表示，其尾数范围在 [1，2），非规约浮点数的尾数部分范围在（0，1）。

上面的理论在哪里都能看到，这只是IEEE754的定义而已，我们来实际用一下它是怎么表达小数的：

①求单精度8.5f 的二进制过程。

首先8.5是正数所以符号位为0；

然后化为二进制，1*2^3+0*2^2+0*2^1+0*2^0 (整数部分) . （小数点） 1*2^-1小数部分简化为1000.1

要把二进制数变成(1.f)*2^(exponent)的形式,其中exponent是指数即1.0001*2^3.

然后我们得到阶码为e=3+127=130 即阶码表示二进制为10000010.

余下小数0001，我们补齐至23位即00010000000000000000000。

这样符合结构符号位 0 阶码 10000010 尾数00010000000000000000000

然后我们来看一下8.5存储在内存中01000001000010000000000000000000

因为java.lang.Integer.toBinaryString() 方法返回一个字符串表示的整数参数，以2为底的无符号整数，所以在开始的程序打印结果我们添加一个0,与我们算出的结果就相同了。

网上有很多关于float、double的转换解说，这里只是我涉及到了这块，然后自己去学习了一下，其实刚开始我看理论知识比较晕，后来看到别人以列子详细解说，然后再回头看理论，就发现也没那么难了。

本文出自 “进击的程序猿” 博客，请务必保留此出处http://zangyanan.blog.51cto.com/11610700/1854836

java基础之float、double底层运算

标签：float ieee754 double

原文地址：http://zangyanan.blog.51cto.com/11610700/1854836

float double 如何存储计算2 （这个写的也不错）的更多相关文章

sql server数据库如何存储数组，int[]float[]double[]数组存储到数据库方法
原文地址:https://www.zhaimaojun.top/Note/5475296 将数组存储到数据库的方法 (本人平时同csharp编写代码,所以本文中代码都是csharp代码,有些地方jav ...
解决java float double 浮点型参与计算失精度
本人前段时间做一个社区电商应用,发现了一个天坑 ...................让我哭会 . 下面听听我的踩坑之路吧 ,电商肯定跟￥打交道了,计算少不了的.由于本人太菜单纯的以为 fl ...
java中float/double浮点数的计算失精度问题(转)
如果我们编译运行下面这个程序会看到什么? public class Test { public static void main(String args[]) { ...
float double 如何存储
类型float大小为4字节,即32位,内存中的存储方式如下: 符号位(1 bit) 指数(8 bit) 尾数(23 bit) 类型double大小为8字节,即64位,内存布局如下: 符号位(1 ...
C语言中 Float 数据结构的存储计算
1.了解float存储结构 float存储结构请看另一篇文章http://blog.csdn.net/whzhaochao/article/details/12885875 2.float最大值 fl ...
Java中浮点型数据Float和Double进行精确计算的问题
Java中浮点型数据Float和Double进行精确计算的问题来源 https://www.cnblogs.com/banxian/p/3781130.html 一.浮点计算中发生精度丢失 ...
C语言中float,double类型,在内存中的结构(存储方式)
C语言中float,double类型,在内存中的结构(存储方式)从存储结构和算法上来讲,double和float是一样的,不一样的地方仅仅是float是32位的,double是64位的,所以doubl ...
C/C++中float和double的存储结构（转）
在C/C++中float是32位的,double是64位的,两者在内存中的存储方式和能够表示的精度均不同,目前C/C++编译器标准都遵照IEEE制定的浮点数表示法来进行float,double运算. ...
C 语言实例 - 计算 int, float, double 和 char 字节大小
C 语言实例 - 计算 int, float, double 和 char 字节大小 C 语言实例 C 语言实例使用 sizeof 操作符计算int, float, double 和 char四种变 ...

随机推荐

MySQL字符集及校对规则的理解
阅读目录:MySQL的字符集和校对规则 MySQL的字符集 MySQL与字符集正确使用字符集 MySQL客户端与字符集字符集编码转换原理字符集常见处理操作字符集的正确实践 MySQL的校对 ...
WPF TextBlock文子超出在最后加上省略号
加上这个属性:TextTrimming="CharacterEllipsis" <TextBlock Text="{Binding filepaths}" ...
Git上传项目失败：Push rejected: Push to origin/master was rejected
解决方案如下: 1.切换到自己项目所在的目录,右键选择GIT BASH Here,Idea中可使用Alt+F12 打开终端 2.在terminl窗口中依次输入命令: git pull git pull ...
grep与egrep的区别
grep与egrep的区别: 在linux系统环境下,我们通常使用grep命令来过滤出需要的行而egrep确很少使用,他们的区别其实很简单,grep默认不支持正则表达式,egrep默认支持正则表达式, ...
SQL Server 合并行
select a.*,b.Organization_Name,c.User_Name sgry,c.renNum,d.User_Name fzr,e.pic_url from dbo.TB_ZYM_L ...
CentOS7最小化安装-Linux-1
CentOS 7的安装其实很简单,主要是网络配置. 选英文.设置时区等最小化安装先启动一个网络 Begin 吧在安装的时候设置好root密码.很简单别去点安装tools. 等待安装完成后,点击 ...
ROS进阶学习笔记（11）- Turtlebot Navigation and SLAM - ROSMapModify - ROS地图修改
ROS进阶学习笔记(11)- Turtlebot Navigation and SLAM - 2 - MapModify地图修改 We can use gmapping model to genera ...
DLL创建与调用（C#调用C++的DLL）
1.C++中需要导出的函数,函数定义处在返回值前加上:extern "C" __declspec(dllexport) C#调用:[DllImport("导出函数所在DL ...
MiniDao_1.6.4 版本发布，轻量级Java持久化框架，Hibernate项目辅助利器
MiniDao 简介及特征 MiniDao 是一款超轻量的JAVA持久层框架,具备Mybatis一样的SQL能力: 支持SQL分离.支持标签.支持注解.MiniDao产生的初衷是为了解决Hiberna ...
【JEECG技术文档】数据权限自定义SQL表达式用法说明
功能介绍数据规则通过配置自定义sql来实现数据权限的控制,自定义SQL支持表达式取值其中自定义sql 条件中字段的名称和数据库表的字段名保持一致. 角色授权用户角色授权,权限测试不要用adm ...

float double 如何存储计算2 （这个写的也不错）

float double 如何存储计算2 （这个写的也不错）的更多相关文章

随机推荐

热门专题