您的位置:首页 > 其它

浮点数在内存中的存储方式【转】

2013-03-01 12:25 295 查看
转自:http://blog.csdn.net/djsl6071/article/details/1531336

浮点数保存的字节格式如下:

地址 +0 +1 +2 +3

内容 SEEE EEEE EMMM MMMM MMMM MMMM MMMM MMMM

S 代表符号位,1是负,0是正

E 偏移127的幂,二进制阶码=(EEEEEEEE)-127。

M 24位的尾数保存在23位中,只存储23位,最高位固定为1。此方法用最较少的位数实现了

较高的有效位数,提高了精度。

地址 +0 +1 +2 +3

内容0xC1 0x48 0x00 0x00

换。

浮点保存值不是一个直接的格式,要转换为一个浮点数,位必须按上面的浮点数保存格式表

所列的那样分开,例如:

格式 SEEE EEEE EMMM MMMM MMMM MMMM MMMM MMMM

二进制 11000001 01001000 00000000 00000000

十六进制 C1 48 00 00

符号位是1 表示一个负数

幂是二进制10000010或十进制130,130减去127是3,就是实际的幂。

尾数是后面的二进制数10010000000000000000000

在尾数的左边有一个省略的小数点和1,这个1在浮点数的保存中经常省略,加上一个1和小数

点到尾数的开头,得到尾数值如下:

1.10010000000000000000000

指数是3,尾数调整如下:

1100.10000000000000000000

结果是一个二进制浮点数,小数点左边的二进制数代表所处位置的2的幂,例如:1100表示

(1*2^3)+(1*2^2)+(0*2^1)+(0*2^0)=12。

小数点的右边也代表所处位置的2的幂,只是幂是负的。例如:.100...表示(1*2^(-1))+

(0*2^(-2))+(0*2^(-2))...=0.5。

这些值的和是12.5。因为设置的符号位表示这数是负的,因此十六进制值0xC1480000表示-

12.5。

下面给个例子

#include <stdio.h>

union FloatData

{

float f;

unsigned char h[4];

};

void main(void)

{

FloatData t;

float temp = 0;

printf("请输入一个数,输入100表示结束:");

scanf("%f",&temp);

t.f = temp;

printf("%f在内存中的存放为:%2x %2x %2x %2x/n",t.f,t.h[0],t.h[1],t.h[2],t.h[3]);

}

关于多字节数据类型在内存中的存储问题

int ,short 分别是4、2字节。他们在内存中的存储方式下面举个例子说明。

int data = 0xf4f3f2f1;

其中低位存放在编址小的内存单元,高位存放在编址高的内存单元

如下:

地址:0x8000 0x8001 0x8002 0x8003

数据: f1 f2 f3 f4

根据IEEE在1985年制定的标准来处理浮点数

单精度浮点数用4字节,包括1位符号位s(整数为0,负数为1),8位指数位e,23位有效位f

浮点型使用的是科学计数法,比如十进制的12345可以表示为1.2345 * 10^4(表示10的4次幂)

用二进制表示为 1.1000000111001 * 2^13

所以计算机中用浮点数表示12345这个十进制应该是这样的,s位为0,因为是正数,指数位为13+127=140(127为单精度浮点数偏移值,为了表示只有小数部分的数),有效位为1000000111001

计算的时候用 (-1)^s * 1.f * 2^(e-127) ,结果就是 1* 1.1000000111001 * 2^(140-127=13) ,和我们刚才表示的一样

还比如,十进制小数0.125转换为二进制小数0.001可以表示为 1* 1.0 * 2^(124-127=-3)

double,双精度浮点数有1位符号位、11位指数位和52位有效数

谢谢,和我找的资料差不多:)

知道公式

n=(-1)^s*m*2^e

e=|E|-bias

bias = 2^(k-1)-1(k为E的位数)

m=|1.M|

知道12345在内存中的10进制表示以后

0x4640e400 = 0(100 0110 0)<100 0000 1110 0100 0000>

括号中的数字为|E| = 140 所以e=140-127=13

尖括号中的数字为m=|1.M|=|1.100000011100100|=1.506958008

ok,

代入公式n = (-1)^0*1.506958008*2^13=12345

完工!!

非规范就看你自己了 :

转自:http://www.cppblog.com/aaxron/archive/2011/12/03/161347.html

C语言中float,double类型,在内存中的结构(存储方式)

从存储结构和算法上来讲,double和float是一样的,不一样的地方仅仅是float是32位的,double是64位的,所以double能存储更高的精度。

任何数据在内存中都是以二进制(0或1)顺序存储的,每一个1或0被称为1位,而在x86CPU上一个字节是8位。比如一个16位(2 字节)的short int型变量的值是1000,那么它的二进制表达就是:00000011 11101000。由于Intel CPU的架构原因,它是按字节倒 序存储的,那么就因该是这样:11101000 00000011,这就是定点数1000在内存中的结构。

目前C/C++编译器标准都遵照IEEE制定的浮点数表示法来进行float,double运算。

这种结构是一种科学计数法,用符号、指数和 尾数来表示,底数定为2——即把一个浮点数表示为尾数乘以2的指数次方再添上符号。

下面是具体的规格:

类型 符号位 阶码 尾数 长度

float 1 8 23 32

double 1 11 52 64

临时数 1 15 64 80

由于通常C编译器默认浮点数是double型的,下面以double为例: 共计64位,折合8字节。

由最高到最低位分别是第63、62、61、……、0位: 最高位63位是符号位,1表示该数为负,0正; 62-52位,一共11位是指数位; 51-0位,一共52位是尾数位。

按照IEEE浮点数表示法,下面将把double型浮点数38414.4转换为十六进制代码。

把整数部和小数部分开处理:整数部直接化十六进制:960E。小数的处理: 0.4=0.5*0+0.25*1+0.125*1+0.0625*0+…… 实际上这永远算不完!这就是著名的浮点数精度问题。所以直到加上前面的整数部分算够53位就行了(隐藏位技术:最高位的1 不写入内存)。

如果你够耐心,手工算到53位那么因该是:38414.4(10)=1001011000001110.0110101010101010101010101010101010101(2)

科学记数法为:1.001……乘以2的15次方。指数为15! 于是来看阶码,一共11位,可以表示范围是-1024 ~ 1023。因为指数可以为负,为了便于计算,规定都先加上1023,在这里, 15+1023=1038。

二进制表示为:100 00001110 符号位:正—— 0 ! 合在一起(尾数二进制最高位的1不要): 01000000 11100010 11000001 11001101 01010101 01010101 01010101 01010101 按字节倒序存储的十六进制数就是: 55 55 55 55 CD C1 E2 40。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: