您的位置：首页 > 其它

浮点数在内存中的存储方式【转】

2013-03-01 12:25 295 查看

转自：http://blog.csdn.net/djsl6071/article/details/1531336

浮点数保存的字节格式如下：

地址 +0 +1 +2 +3

内容 SEEE EEEE EMMM MMMM MMMM MMMM MMMM MMMM

S 代表符号位，1是负，0是正

E 偏移127的幂，二进制阶码=(EEEEEEEE)-127。

M 24位的尾数保存在23位中，只存储23位，最高位固定为1。此方法用最较少的位数实现了

较高的有效位数，提高了精度。

地址 +0 +1 +2 +3

内容0xC1 0x48 0x00 0x00

换。

浮点保存值不是一个直接的格式，要转换为一个浮点数，位必须按上面的浮点数保存格式表

所列的那样分开，例如：

格式 SEEE EEEE EMMM MMMM MMMM MMMM MMMM MMMM

二进制 11000001 01001000 00000000 00000000

十六进制 C1 48 00 00

符号位是1 表示一个负数

幂是二进制10000010或十进制130，130减去127是3，就是实际的幂。

尾数是后面的二进制数10010000000000000000000

在尾数的左边有一个省略的小数点和1,这个1在浮点数的保存中经常省略,加上一个1和小数

点到尾数的开头,得到尾数值如下:

1.10010000000000000000000

指数是3,尾数调整如下:

1100.10000000000000000000

结果是一个二进制浮点数，小数点左边的二进制数代表所处位置的2的幂，例如：1100表示

(1*2^3)+(1*2^2)+(0*2^1)+(0*2^0)=12。

小数点的右边也代表所处位置的2的幂，只是幂是负的。例如：.100...表示(1*2^(-1))+

(0*2^(-2))+(0*2^(-2))...=0.5。

这些值的和是12.5。因为设置的符号位表示这数是负的，因此十六进制值0xC1480000表示-

12.5。

下面给个例子

#include <stdio.h>

union FloatData

{

float f;

unsigned char h[4];

};

void main(void)

{

FloatData t;

float temp = 0;

printf("请输入一个数，输入100表示结束：");

scanf("%f",&temp);

t.f = temp;

printf("%f在内存中的存放为：%2x %2x %2x %2x/n",t.f,t.h[0],t.h[1],t.h[2],t.h[3]);

}

关于多字节数据类型在内存中的存储问题

int ,short 分别是4、2字节。他们在内存中的存储方式下面举个例子说明。

int data = 0xf4f3f2f1;

其中低位存放在编址小的内存单元，高位存放在编址高的内存单元

如下：

地址：0x8000 0x8001 0x8002 0x8003

数据： f1 f2 f3 f4

根据IEEE在1985年制定的标准来处理浮点数

单精度浮点数用4字节，包括1位符号位s(整数为0，负数为1)，8位指数位e，23位有效位f

浮点型使用的是科学计数法，比如十进制的12345可以表示为1.2345 * 10^4(表示10的4次幂)

用二进制表示为 1.1000000111001 * 2^13

所以计算机中用浮点数表示12345这个十进制应该是这样的，s位为0，因为是正数，指数位为13+127=140(127为单精度浮点数偏移值，为了表示只有小数部分的数)，有效位为1000000111001

计算的时候用 (-1)^s * 1.f * 2^(e-127) ，结果就是 1* 1.1000000111001 * 2^(140-127=13) ，和我们刚才表示的一样

还比如，十进制小数0.125转换为二进制小数0.001可以表示为 1* 1.0 * 2^(124-127=-3)

double，双精度浮点数有1位符号位、11位指数位和52位有效数

谢谢，和我找的资料差不多：）

知道公式

n=(-1)^s*m*2^e

e=|E|-bias

bias = 2^(k-1)-1(k为E的位数）

m=|1.M|

知道12345在内存中的10进制表示以后

0x4640e400 = 0(100 0110 0)<100 0000 1110 0100 0000>

括号中的数字为|E| ＝ 140 所以e＝140－127＝13

尖括号中的数字为m=|1.M|＝｜1.100000011100100｜＝1.506958008

ok,

代入公式n = (-1)^0*1.506958008*2^13=12345

完工！！

非规范就看你自己了：

转自：http://www.cppblog.com/aaxron/archive/2011/12/03/161347.html

C语言中float,double类型,在内存中的结构(存储方式)

从存储结构和算法上来讲，double和float是一样的，不一样的地方仅仅是float是32位的，double是64位的，所以double能存储更高的精度。

任何数据在内存中都是以二进制（0或1）顺序存储的，每一个1或0被称为1位，而在x86CPU上一个字节是8位。比如一个16位（2 字节）的short int型变量的值是1000，那么它的二进制表达就是：00000011 11101000。由于Intel CPU的架构原因，它是按字节倒序存储的，那么就因该是这样：11101000 00000011，这就是定点数1000在内存中的结构。

目前C/C++编译器标准都遵照IEEE制定的浮点数表示法来进行float,double运算。

这种结构是一种科学计数法，用符号、指数和尾数来表示，底数定为2——即把一个浮点数表示为尾数乘以2的指数次方再添上符号。

下面是具体的规格：

类型符号位阶码尾数长度

float 1 8 23 32

double 1 11 52 64

临时数 1 15 64 80

由于通常C编译器默认浮点数是double型的，下面以double为例：共计64位，折合8字节。

由最高到最低位分别是第63、62、61、……、0位：最高位63位是符号位，1表示该数为负，0正； 62-52位，一共11位是指数位； 51-0位，一共52位是尾数位。

按照IEEE浮点数表示法，下面将把double型浮点数38414.4转换为十六进制代码。

把整数部和小数部分开处理:整数部直接化十六进制：960E。小数的处理: 0.4=0.5*0+0.25*1+0.125*1+0.0625*0+…… 实际上这永远算不完！这就是著名的浮点数精度问题。所以直到加上前面的整数部分算够53位就行了（隐藏位技术：最高位的1 不写入内存）。

如果你够耐心，手工算到53位那么因该是：38414.4(10)=1001011000001110.0110101010101010101010101010101010101(2)

科学记数法为：1.001……乘以2的15次方。指数为15！于是来看阶码，一共11位，可以表示范围是-1024 ~ 1023。因为指数可以为负，为了便于计算，规定都先加上1023，在这里， 15+1023=1038。

二进制表示为：100 00001110 符号位：正—— 0 ！合在一起（尾数二进制最高位的1不要）： 01000000 11100010 11000001 11001101 01010101 01010101 01010101 01010101 按字节倒序存储的十六进制数就是： 55 55 55 55 CD C1 E2 40。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航