您的位置：首页 > 其它

浮点数在内存中的存储格式

2011-05-22 12:04 281 查看

由一个程序开始

#include <iostream>
using namespace std;
int main(int argc, char* argv[])
{
float a = 1.0f;//浮点数在内存中是以符号+指数+尾数保存的
cout<<(int&)a<<endl;//1.0f在内存中的保存的是0x3f800000，将a地址开始的sizeof（int）个字节当做int类型的输出106535216
int b = 0x3f800000;
cout<<b<<endl;//106535216
cout<<(int)a<<endl;//1
return 0;
}

上例中：1.0的浮点形式，在内存中是这样存的：

0011 1111 1000 0000 0000 0000 0000 0000

符号部分：0（粉红背景处）；

指数部分：127+0=127（黄色背景处）

底数部分：0（蓝色背景处）

转换为十进制就是：106535216

---------------------------------------------------------------------------------------------------------------------------------------

浮点数包括float和double两种类型，float占32位，double占64位。其二进制存储格式遵循IEEE754标准。以float为例：

符号位：正数为0，负数为1
以float型数据123.456为例，分析其二进制存储格式：
首先将十进制数123.456转换为二进制数为：1111011. 01110100101111001
（其中0.456如何转换为二进制？不断乘2取整，顺序排列
如:0.734375转二进制，结果是101111。
0.734375 x 2 = 1.46875
0.46875 x 2 = 0.9375
0.9375 x 2 = 1.875
0.875 x 2 = 1.75
0.75 x 2 = 1.5
0.5 x 2 = 1.0）

1111011. 01110100101111001 即1. 11101101110100101111001乘以2的6次方
首先这是一个正数，则符号位为0
阶码为6，不过要转换成移码。
（如何求6的移码？这里我也不太深究，我见大家都是直接6+127=133，换为2进制为10000101）
（移码与补码的关系： [X]移与[X]补的关系是符号位互为相反数（仅符号位不同））
尾数则为1. 11101101110100101111001的小数部分，即
11101101110100101111001
综上：123.456的二进制存储格式为：01000010111101101110100101111001

-------------------------------------------------以下介绍浮点数的存储------------------------------------------------------

浮点数：
浮点型变量在计算机内存中占用4字节（Byte）,即32-bit。遵循IEEE-754格式标准。一个浮点数由2部分组成：底数m 和指数e。

±mantissa × 2exponent
（注意，公式中的mantissa 和 exponent使用二进制表示）
底数部分使用２进制数来表示此浮点数的实际值。
指数部分占用８-bit的二进制数，可表示数值范围为0－255。
指数应可正可负，所以IEEE规定，此处算出的次方须减去127才是真正的指数。所以float的指数可从 -126到128
底数部分实际是占用24-bit的一个值，由于其最高位始终为 1 ，所以最高位省去不存储，在存储中只有23-bit。
到目前为止，底数部分 23位加上指数部分 8位使用了31位。那么前面说过，float是占用4个字节即32-bit,那么还有一位是干嘛用的呢？还有一位，其实就是4字节中的最高位，用来指示浮点数的正负，当最高位是1时，为负数，最高位是0时，为正数。

浮点数据就是按下表的格式存储在4个字节中：

Address+0 Address+1 Address+2 Address+3

Contents SEEE EEEE EMMM MMMM MMMM MMMM MMMM MMMM
S: 表示浮点数正负，1为负数，0为正数
E: 指数加上127后的值的二进制数
M: 24-bit的底数（只存储23-bit）

注意：这里有个特例，浮点数为0时，指数和底数都为0，但此前的公式不成立。因为2的0次方为1，所以，0是个特例。当然，这个特例也不用认为去干扰，编译器会自动去识别。

举例1：计算机存储中的二进制数如何转换成实际浮点数
通过上面的格式，我们下面举例看下-12.5在计算机中存储的具体数据：
Address+0 Address+1 Address+2 Address+3

Contents 0xC1 0x48 0x00 0x00
接下来我们验证下上面的数据表示的到底是不是-12.5，从而也看下它的转换过程。

由于浮点数不是以直接格式存储，他有几部分组成，所以要转换浮点数，首先要把各部分的值分离出来。

Address+0 Address+1 Address+2 Address+3

格式 SEEEEEEE EMMMMMMM MMMMMMMM MMMMMMMM

二进制 11000001 01001000 00000000 00000000

16进制 C1 48 00 00

可见：

S: 为1，是个负数。

E:为 10000010 转为10进制为130，130-127=3，即实际指数部分为3.

M:为 10010000000000000000000。这里，在底数左边省略存储了一个1，使用实际底数表示为 1.10010000000000000000000

到此，我们吧三个部分的值都拎出来了，现在，我们通过指数部分E的值来调整底数部分M的值。调整方法为：如果指数E为负数，底数的小数点向左移，如果指数E为正数，底数的小数点向右移。小数点移动的位数由指数E的绝对值决定。

这里，E为正3，使用向右移3为即得： 1100.10000000000000000000 至次，这个结果就是12.5的二进制浮点数，将他换算成10进制数就看到12.5了，如何转换，看下面：

小数点左边的1100 表示为 (1 × 23) + (1 × 22) + (0 × 21) + (0 × 20), 其结果为 12 。

小数点右边的 .100… 表示为 (1 × 2-1) + (0 × 2-2) + (0 × 2-3) + ... ，其结果为.5 。

以上二值的和为12.5，由于S 为1，使用为负数，即-12.5 。

所以，16进制 0XC1480000 是浮点数 -12.5 。

举例2：浮点数转换成计算机存储格式中的二进制数。
举例将 17.625换算成float型。
首先，将17.625换算成二进制位：10001.101 ( 0.625 = 0.5+0.125, 0.5即 1/2, 0.125即1/8 如果不会将小数部分转换成二进制，请参考其他书籍)
再将 10001.101 向左移，直到小数点前只剩一位成了 1.0001101 x 2的4次方（因为左移了4位）。此时我们的底数M和指数E就出来了：

底数部分M，因为小数点前必为1，所以IEEE规定只记录小数点后的就好，所以此处底数为 0001101 。
指数部分E，实际为4，但须加上127，固为131，即二进制数 10000011
符号部分S，由于是正数，所以S为0.

综上所述，17.625的 float 存储格式就是：
0 10000011 00011010000000000000000

转换成16进制：0x41 8D 00 00

所以，一看，float还是占用了4个字节。

****************************************************************

double在内存中的保存，double是8个字节64位，其中最高位63位是符号位，1表示该数为负，0正；62-52位，一共11位是指数位；51-0位，一共52位是尾数位。

举例3：按照IEEE浮点数表示法，下面将把double型浮点数38414.4转换为十六进制代码。

把整数部和小数部分开处理:整数部直接化十六进制：960E。小数的处理:
0.4=0.5*0+0.25*1+0.125*1+0.0625*0+……
实际上这永远算不完！这就是著名的浮点数精度问题。所以直到加上前面的整数部分算够53位就行了（隐藏位技术：最高位的1

不写入内存）。
如果你够耐心，手工算到53位那么因该是：38414.4(10)=1001011000001110.0110101010101010101010101010101010101(2)
科学记数法为：1.001……乘以2的15次方。指数为15！
于是来看阶码，一共11位，可以表示范围是-1024 ~ 1023。因为指数可以为负，为了便于计算，规定都先加上1023，在这里，

15+1023=1038。二进制表示为：100 00001110
符号位：正—— 0 ！
合在一起（尾数二进制最高位的1不要）：
01000000 11100010 11000001 11001101 01010101 01010101 01010101 01010101

按字节倒序存储的十六进制数就是：
55 55 55 55 CD C1 E2 40

转自：http://blogold.chinaunix.net/u3/117012/showart_2312474.html

------------------------------------------------------------------------------------------------------------------------------------------------

对于下面的程序，我用VS2003运行的结果第一个是0，第二个是一个很大的数。
#include <stdio.h>
int main()
{
printf("%f",5); //line 1
printf("%d",5.01); //line 2
}

具体原因在论坛上提问后得到结果。引用答案如下

关键你要理解浮点数的存储格式！

printf("%f",5); //line 1
5在内存中是 0x00 00 00 05，按照float格式解释是一个无限接近于0的浮点数数

printf("%d",5.01); //line 2
5.01按照整数去解释，这个数应该是一个非常大的整数

帮1楼补充几句：
这是printf可变参数不做类型检查引起的。
int printf(const char *format, ...);

printf("%f",5); //line 1
编译器在给printf传参的时候，不知道这个5应该传什么类型，所以只能按1楼所说整数的格式传进去。在printf里面使用这个参数的时候却是按照"%f"的要求解释成了浮点数。
前面的"%f"对编译器来说就是一个普通字符串而已，编译器不懂printf的格式。
所以可变参数的函数是很危险的，尽量少用。

如果是一个普通的函数，编译器就会根据函数原型，在传参的时候自动做类型转换。
比如
void foo(float f);
......
foo(5);
在这里编译器知道foo需要一个浮点数，事先就会把5转换成浮点数的格式传进去。

转自：http://blog.csdn.net/zhouxqwh/archive/2008/08/19/2794233.aspx

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航