您的位置：首页 > 其它

float与double类型的内存分布，精度和范围

2011-07-23 17:17 337 查看

float与double类型的内存分布，精度和范围

内存分布：
C/c++的浮点数据类型有float和double两种。
float大小为4字节，内存中的存储方式如下：
符号位(1bit)指数(8bit)尾数(23bit)
double大小为8字节，内存中的存储方式如下：
符号位(1bit)指数(11bit)尾数(52bit)
符号位决定浮点数的正负，0正1负。指数和尾数均从浮点数的二进制科学计数形式中获取。
如，十进制浮点数2.5的二进制形式为10.1，转换为科学计数法形式为(1.01)*(10^1)。
由此可知指数为1，尾数（即科学计数法的小数部分）为01。
根据浮点数的存储标准，指数用移码表示。0的float类型移码为127（0111 1111），0的double类型移码为1023(011 1111 1111)。运算时，在0 的移码基础上加指数，得到的就是内存中指数的表示形式。尾数则直接填入，如果空间多余则以0补齐，如果空间不够则0舍1入。
所以float和 double类型分别表示的2.5如下（二进制）：
符号位               指数                                       尾数
0                     1000 0000                             010 0000 0000 0000 0000 0000
0                     100 0000 0000 0100             0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000

精度：
float和double的精度是由尾数的位数来决定的。
float：2^23 = 8388608，一共七位，这意味着最多能有7位有效数字，但绝对能保证的为6位，也即float的精度为6~7位有效数字； double：2^52 = 4503599627370496，一共16位，同理，double的精度为15~16位。

范围:
float类的指数是8位移码,最大为127最小为-127,127用来作2的指数,为2^127,约等于 1.7014*10^38, 而我们知道,floa示数范围约为- 3.4*10^38-------3.4*10^38, 这是因为尾数都为1时,即1.11..11约为2,因此浮点数的范围就出来了.double的情况与float完全相似.
附：
　移码（又叫增码）是符号位取反的补码，一般用做浮点数的阶码，引入的目的是为了保证浮点数的机器零为全0。
　　①移码的定义：设由1位符号位和n位数值位组成的阶码，则 [X]移=2En + X -2n≤X ≤ 2n
　　例如： X=+1011 [X]移=11011 符号位“1”表示正号
　　X=－1011 [X]移=00101 符号位“0”表示负号
　　②移码与补码的关系： [X]移与[X]补的关系是符号位互为相反数（仅符号位不同），
　　例如： X=+1011 [X]补=01011 [X]移=11011
　　X=－1011 [X]补=10101 [X]移=00101
　　③移码运算应注意的问题：
　　◎对移码运算的结果需要加以修正，修正量为2En ，即对结果的符号位取反后才是移码形式的正确结果。
　　◎移码表示中，0有唯一的编码——1000…00，当出现000…00时（表示－2En），属于浮点数下溢。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： float 存储

相关文章推荐

新的分享

章节导航