您的位置：首页 > 其它

C标准库源码解剖(1)：类型相关的定义

2016-07-29 00:00 435 查看

说明：整个C标准库解剖系列环境为Ubuntu 8.04，编译器为gcc 4.2.4，由于linux系统中只有C标准库的头文件（在/usr/include下），函数库被编译成了程序库，没有源代码，因此对源代码的解剖用的是glibc 2.9，可从GNU的官方站点上下载。
类型相关定义包括limits.h、float.h、stddef.h、stdbool.h、stdarg.h、iso646.h、stdint.h共7个头文件。除了stdint.h外，其余6个文件在gcc编译器的/usr/lib/gcc/i486-linux-gnu/4.2.4/include目录下。stdint.h在/usr/include中，是C99中引入的，提供了扩展整数的基本定义，放到后面再解剖吧。
1、limits.h： 定义了整数类型的范围。/usr/include下也有limits.h，它会自己先定义各个整数类型范围，这样当不用gcc来构建你的程序时就可以使用这些值。如果使用gcc编译器来构建你的程序，则会使用gcc编译器自己的limits.h（前面的定义都会#undef掉）。由于这个limits.h会用到gcc内置的limits.h，因此我们解剖/usr/include下的limits.h。

/* ISO C99 Standard: 7.10/5.2.4.2.1  整数类型的大小  <limits.h> */
#ifndef _LIBC_LIMITS_H_
#define _LIBC_LIMITS_H_	1
#include <features.h> /* 选项的宏，如ISOC99选项、POSIX选项、XOPEN选项等 */
#define MB_LEN_MAX	16  /* 支持区域设置的多字节字符宽度为16位 */
/* 不使用GNU CC时就必须定义下面所有符号，否则使用gcc编译器中的定义（看下面） */
#if !defined __GNUC__ || __GNUC__ < 2
# ifndef _LIMITS_H
#  define _LIMITS_H	1
#include <bits/wordsize.h> /* 定义了表示字的位数的__WORDSIZE宏，64位平台上值为64，32位平台上值为32 */
#  define CHAR_BIT	8 /* char类型的宽度为8位 */
#  define SCHAR_MIN	(-128)  /* signed char的最小值为-2^7，补码表示为10000000，没有对应的正数，其反数还是自己 */
#  define SCHAR_MAX	127     /* signed char的最大值为2^7-1=01111111 */
#  define UCHAR_MAX	255  /* unsigend char的最大值为2^8-1=11111111（最小值为0） */
#  ifdef __CHAR_UNSIGNED__  /* 根据预定义宏来确定是让char=unsigned char还是char=signed char */
#   define CHAR_MIN	0
#   define CHAR_MAX	UCHAR_MAX
#  else
#   define CHAR_MIN	SCHAR_MIN   /* gcc中使用了这个，即char=signed char */
#   define CHAR_MAX	SCHAR_MAX
#  endif
#  define SHRT_MIN	(-32768) /* signed short int的最小值为-2^15 */
#  define SHRT_MAX	32767    /* signed short int的最小值为2^15-1 */
#  define USHRT_MAX	65535  /* unsigned short int的最大值为2^16-1（最小值为0） */
#  define INT_MIN	(-INT_MAX - 1) /* int的最小值为-2^31 */
#  define INT_MAX	2147483647  /* int的最大值为2^31-1 */
#  define UINT_MAX	4294967295U  /* unsigned int的最大值为2^32-1（最小值为0） */
#  if __WORDSIZE == 64  /* 64位的x86平台，这个宏在<bits/wordsize.h>中 */
#   define LONG_MAX	9223372036854775807L  /* signed long int最大值为2^63-1 */
#  else             /* 32位的x86平台 */
#   define LONG_MAX	2147483647L  /* signed long int最大值为2^31-1 */
#  endif
#  define LONG_MIN	(-LONG_MAX - 1L)  /* signed long int最小值为-2^31 */
#  if __WORDSIZE == 64
#   define ULONG_MAX	18446744073709551615UL /* 64平台：unsigend long int最大值为2^64-1 */
#  else
#   define ULONG_MAX	4294967295UL /* 32位平台：unsigned long int最大值为2^32-1 */
#  endif
#  ifdef __USE_ISOC99  /* <feature.h>中宏：long long类型为C99标准引入的 */
#   define LLONG_MAX	9223372036854775807LL  /* signed long long int最大值为2^63-1 */
#   define LLONG_MIN	(-LLONG_MAX - 1LL)  /* signed long long int最小值为-2^63 */
#   define ULLONG_MAX	18446744073709551615ULL /* unsigned long long int最大值为2^64-1 */
#  endif /* ISO C99 */
# endif	/* limits.h  */
#endif	/* GCC 2.  */
#endif	/* !_LIBC_LIMITS_H_ */
/* 获取编译器的limits.h，其中定义几乎所有的ISO常量 */
#if defined __GNUC__ && !defined _GCC_LIMITS_H_  /* _GCC_LIMITS_H_是GCC的文件定义  */
# include_next <limits.h>
#endif
/* 一些gcc版本的<limits.h>没有定义LLONG_MIN、LLONG_MAX和ULLONG_MAX，则这里需要进行定义 */
#if defined __USE_ISOC99 && defined __GNUC__
# ifndef LLONG_MIN
#  define LLONG_MIN	(-LLONG_MAX-1)
# endif
# ifndef LLONG_MAX
#  define LLONG_MAX	__LONG_LONG_MAX__
# endif
# ifndef ULLONG_MAX
#  define ULLONG_MAX	(LLONG_MAX * 2ULL + 1)
# endif
#endif
#ifdef	__USE_POSIX
/* POSIX添加东西到<limits.h>中 */
# include <bits/posix1_lim.h>
#endif
#ifdef	__USE_POSIX2
# include <bits/posix2_lim.h>
#endif
#ifdef	__USE_XOPEN
# include <bits/xopen_lim.h>
#endif

解释：
（1）/usr/include/limits.h的实现中，char=unsigned char占8位，short占16位，int占32位，long在64位平台上占64位，在32位平台上占32位，C99标准引入的long long占64位。它们都有singed和unsigned两种，默认都是带符号整数(signed)。带符号整数在当前大多数体系结构上一般都用二进制补码表示（当然C标准也支持用其他一些编码表示），即正数用直接编码，符号位为0；负数表示为对应正数各位取反然后加1，符号位为1。带符号整数范围为-2**(n-1)~2**(n-1)-1，其中最小负数-2**(n-1)=100...0没有对应正数，其反数还是自己。无符号整数用直接二进制编码，范围为0~2**n-1。如果使用gcc的limits.h，则每个宏的值依赖于gcc编译器内置的定义，一般跟这里的值一致。
（2）UCHAR_MAX必须等于2**CHAR_BIT-1，且对带符号整数一般有MIN=-MAX-1。
（3）feature.h文件中定义了一些表示编译选项的宏，如ISOC99选项、POSIX选项、XOPEN选项等。bits/wordsize.h定义了表示字的位数的__WORDSIZE宏，64位平台上值为64，32位平台上值为32。它们都在/usr/include下。
（4）如果要新遵循C99标准，则有些gcc版本的<limits.h>可能没有定义LLONG_MIN、LLONG_MAX和ULLONG_MAX，则这里需要进行定义。如果使用POSIX标准，则还要添加一些POSIX中的东西。
2、float.h： 定义了浮点数类型的特征。

/* ISO C Standard: 5.2.4.2.2  浮点数类型的特征  <float.h> */
#ifndef _FLOAT_H___
#define _FLOAT_H___
/* 实数浮点数表示：
x=s*(b**e)*[f1*b**(-1)+f2*b**(-2)+...+fp*b**(-p)], emin<=e<=emax,(**表示求幂)
s  是符号(+1或-1)
b  是进制基数（通常为2、8、16）
e  是指数值，取值范围在emin与emax之间
p  是b进制的有效位数
fk  是有效数字，0<=fk<b
*/

/* b：指数表示法的基数 */
#undef FLT_RADIX
#define FLT_RADIX	__FLT_RADIX__  /* 进制基数b，一般为2，适用于所有三种浮点类型 */
/* p：是b进制的有效位数  */
#undef FLT_MANT_DIG
#undef DBL_MANT_DIG
#undef LDBL_MANT_DIG
#define FLT_MANT_DIG	__FLT_MANT_DIG__   /* float的b进制有效位数p */
#define DBL_MANT_DIG	__DBL_MANT_DIG__   /* double的b进制有效位数p */
#define LDBL_MANT_DIG	__LDBL_MANT_DIG__  /* long double的b进制有效位数p */
/* q：精度小数位数。使任何有q个小数位的浮点数能被舍入成有p个b进制位数的浮点数，并且不需要改变这q个小数位
就可以重新转换回来。q的值为：
p * log10(b)			如果b是10的幂
floor((p - 1) * log10(b))	否则
*/
#undef FLT_DIG
#undef DBL_DIG
#undef LDBL_DIG
#define FLT_DIG		__FLT_DIG__  /* float的精度小数位数，通常为6 */
#define DBL_DIG		__DBL_DIG__  /* double的精度小数位数，通常为10 */
#define LDBL_DIG	__LDBL_DIG__  /* long double的精度小数位数，通常为10 */
/* emin：最小负整数x，使b**(x-1)在规格化浮点数类型取值范围内 */
#undef FLT_MIN_EXP
#undef DBL_MIN_EXP
#undef LDBL_MIN_EXP
#define FLT_MIN_EXP	__FLT_MIN_EXP__  /* float的emin */
#define DBL_MIN_EXP	__DBL_MIN_EXP__   /* double的emin */
#define LDBL_MIN_EXP	__LDBL_MIN_EXP__   /* long double的emin */
/* ceil(log10(b)*(emin-1))：最小负整数x，使10**(x-1)在
规格化浮点数类型取值范围内，通常值为-37
*/
#undef FLT_MIN_10_EXP
#undef DBL_MIN_10_EXP
#undef LDBL_MIN_10_EXP
#define FLT_MIN_10_EXP	__FLT_MIN_10_EXP__
#define DBL_MIN_10_EXP	__DBL_MIN_10_EXP__
#define LDBL_MIN_10_EXP	__LDBL_MIN_10_EXP__
/* emax：最大整数x，使b**(x-1)在可表示的有限浮点数取值范围内 */
#undef FLT_MAX_EXP
#undef DBL_MAX_EXP
#undef LDBL_MAX_EXP
#define FLT_MAX_EXP	__FLT_MAX_EXP__  /* float的emax */
#define DBL_MAX_EXP	__DBL_MAX_EXP__  /* double的emax */
#define LDBL_MAX_EXP	__LDBL_MAX_EXP__  /* long double的emax */
/* floor(log10((1 - b**-p) * b**emax))：最大整数x，使10**x在可
表示的有限浮点数取值范围内，通常值为37
*/
#undef FLT_MAX_10_EXP
#undef DBL_MAX_10_EXP
#undef LDBL_MAX_10_EXP
#define FLT_MAX_10_EXP	__FLT_MAX_10_EXP__
#define DBL_MAX_10_EXP	__DBL_MAX_10_EXP__
#define LDBL_MAX_10_EXP	__LDBL_MAX_10_EXP__
/* (1-b**-p)*b**emax：可表示的最大有限浮点数， 通常值为10**37 */
#undef FLT_MAX
#undef DBL_MAX
#undef LDBL_MAX
#define FLT_MAX		__FLT_MAX__
#define DBL_MAX		__DBL_MAX__
#define LDBL_MAX	__LDBL_MAX__
/* b**(1-p)：最小的x(x>0.0)，使1.0+x>1.0，宏定义为允许的最大值，如对
float为10**-5，对double和long double为10**-9  */
#undef FLT_EPSILON
#undef DBL_EPSILON
#undef LDBL_EPSILON
#define FLT_EPSILON	__FLT_EPSILON__
#define DBL_EPSILON	__DBL_EPSILON__
#define LDBL_EPSILON	__LDBL_EPSILON__
/* b**(emin - 1)：最小规格化正数，通常值为10**-37  */
#undef FLT_MIN
#undef DBL_MIN
#undef LDBL_MIN
#define FLT_MIN		__FLT_MIN__
#define DBL_MIN		__DBL_MIN__
#define LDBL_MIN	__LDBL_MIN__
/* 舍入方式：0：向0舍入；1：最近舍入；2：向正无穷大舍入；3：向负无穷d大舍入；-1：不确定，
适用于所有3种浮点类型 */
#undef FLT_ROUNDS
#define FLT_ROUNDS 1 /* 使用最近舍入方式 */
#if defined (__STDC_VERSION__) && __STDC_VERSION__ >= 199901L
/* 浮点表达式求值方法（C99中引入）：
-1  不确定
0  求值时仍保持原类型的精度与取值范围
1  求值时float类型与double类型统一用double类型；long double类型保持不变
2  求值时全部用long double类型
*/
#undef FLT_EVAL_METHOD
#define FLT_EVAL_METHOD	__FLT_EVAL_METHOD__
/* n(C99中引入)：小数位数，使任何有pmax个b进制数位的最宽浮点数类型能被舍入
成有n个小数位的浮点数，并且无需改变这个值就可以重新转换回来。n的值为：
pmax * log10(b)			如果b是10的幂
ceil(1 + pmax * log10(b))	否则
*/
#undef DECIMAL_DIG
#define DECIMAL_DIG	__DECIMAL_DIG__  /* 通常的值为10 */
#endif /* C99 */
#endif /* _FLOAT_H___ */

解释：
（1）浮点数的形式为x=s*(b**e)*[f1*b**(-1)+f2*b**(-2)+...+fp*b**(-p)], emin<=e<=emax(**表示求幂)。s是符号位，b是进制基数，e是指数值，p是b进制的有效位数，0<=fk<b。
（2）IEEE的浮点数表示法：单精度float型有1位符号位S，8位指数E，23位尾数M。转换成数值V=(-1)**S*1.M*2**(E-127)。例如16.5=00010000.1=1.00001*2**4（成为规格化数），则符号位为0，指数位为4+127=131=10000011（因为指数可以为负，8位有符号数的范围为-128~127，为了统一用无符号数表示，要加上127），尾数为00001000000000000000000，拼接起来即得到16.5的内存表示01000001100001000000000000000000。
（3）常用的宏有FLT_DIG/DBL_DIG/LDBL_DIG、FLT_MIN/DBL_MIN/LDBL_MIN、FLT_MAX/DBL_MAX/LDBL_MAX。
3、stddef.h： 定义了ptrdiff_t、size_t、wchar_t、wint_t类型和offsetof。有一大堆兼容不同平台的条件编译宏，这对我们没什么用，略去。

/* ISO C Standard: 7.17  一些通用定义  <stddef.h> */
typedef __PTRDIFF_TYPE__ ptrdiff_t;  /* 定义带符号整数类型ptrdiff_t，这里__PTRDIFF_TYPE__
依赖于平台，通常为long类型 */
#if !(defined (__GNUG__) && defined (size_t))
typedef __SIZE_TYPE__ size_t; /* 定义无符号整型size_t，__SIZE_TYPE__
依赖于平台，通常为unsigned int或unsigned long类型 */
#ifdef __BEOS__
typedef long ssize_t;  /* 只用于BeOS系统中 */
#endif
#endif
typedef _BSD_RUNE_T_ rune_t; /* 只用于老的BSD系统 */
#ifndef _RUNE_T_DECLARED
typedef __rune_t rune_t;  /* 只用于FreeBSD系统中 */
#define _RUNE_T_DECLARED
#endif
#ifndef __WCHAR_TYPE__
#define __WCHAR_TYPE__ int
#endif
#ifndef __cplusplus  /* C中才要定义wchar_t，C++中wchar_t为内置类型 */
typedef __WCHAR_TYPE__ wchar_t; /* 宽字符类型wchar_t也在stddef.h中定义，这里为int类型 */
#endif
#ifndef __WINT_TYPE__
#define __WINT_TYPE__ unsigned int
#endif
typedef __WINT_TYPE__ wint_t;   /* 用于无符号的宽字符类型中 */
#ifndef __cplusplus
#define NULL ((void *)0)  /* C中定义NULL指针常量为(void*)0 */
#else
#define NULL 0   /* C++中定义NULL指针常量为0 */
#endif
#ifdef _STDDEF_H
/* 结构成员的地址偏移字节数，TYPE结构类型，MEMBER为其某个成员 */
#define offsetof(TYPE, MEMBER) __builtin_offsetof (TYPE, MEMBER)
#endif

ptrdiff_t是两个指针相减所得的带符号整型，一般用long类型表示。size_t是sizeof运算得到的无符号整型，一般用unsigned int或unsigned long表示。宽字符类型wchar_t也在stddef.h中定义，这里为int类型。wint_t用于无符号的宽字符类型中，这里为unsigned int类型。offsetof宏用于计算结构成员的地址偏移字节数。
4、stdbool.h： 是C99中增加的，定义了布尔类型bool，及其两个常量false=0、true=1。__bool_true_false_are_defined=1是标识布尔类型定义是否完成的信号。这些定义与C++中的一致，因此标准C++并不需要另外再支持stdbool.h，但GCC提供了这个扩展，使得在C++中可以支持<stdbool.h>。

/* ISO C Standard:  7.16  布尔类型及其值  <stdbool.h>
*/
#ifndef _STDBOOL_H
#define _STDBOOL_H
#ifndef __cplusplus
#define bool	_Bool  /* C中 */
#define true	1
#define false	0
#else /* C++中 */
/* 在C++中支持<stdbool.h>是GCC的一个扩展 */
#define _Bool	bool
#define bool	bool
#define false	false
#define true	true
#endif /* __cplusplus */
/* 标识布尔类型定义是否完成的信号  */
#define __bool_true_false_are_defined	1
#endif	/* stdbool.h */

5、stdarg.h： 访问可变参数表的类型和函数（用宏实现）。当你需要编写有可变参数表的函数时，比如myfunc(int *a,...)，你就可以用stdarg.h中的各个函数来遍历“...”中的各个实参，以完成该函数的功能。略去没有用的一大堆用于兼容不同平台的条件编译宏，如下：

/* ISO C Standard:  7.15  可变参数表  <stdarg.h> */
#ifndef __GNUC_VA_LIST
#define __GNUC_VA_LIST
typedef __builtin_va_list __gnuc_va_list; /* 定义__gnuc_va_list.  */
#endif
#ifdef _STDARG_H
/* var_start(v,l)：初始化用于遍历参数表的状态变量v */
#define va_start(v,l)	__builtin_va_start(v,l)
/* 结束参数表的遍历，对v和参数表做必要的整理操作 */
#define va_end(v)	__builtin_va_end(v)
/* 返回v当前指向的参数值 */
#define va_arg(v,l)	__builtin_va_arg(v,l)
#if !defined(__STRICT_ANSI__) || __STDC_VERSION__ + 0 >= 199900L
/* 本函数C99中引入：将s复制到d中，生成指向当前参数的第二个指针 */
#define va_copy(d,s)	__builtin_va_copy(d,s)
#endif
#define __va_copy(d,s)	__builtin_va_copy(d,s)
typedef __gnuc_va_list va_list; /* 定义va_list类型，用这种类型来定义遍历可变
参数表的状态变量 */

#endif /* _STDARG_H */

解释：

（1）va_list类型：用这种类型来定义遍历可变参数列表的状态变量ap。

（2）va_start(ap,lt)：让ap的内部指针指向第一个可变参数。需要用lt来指定可变参数表前面的最后一个固定参数。遍历开始必须先调用这个函数。

（3）var_arg(ap,type)：获取当前ap内部指针指向的参数值，然后把指针移动下一个参数，下一个参数的类型要用type指定。

（4）va_end(ap)：完成对可变参数表的遍历，会对ap和参数表作必要的整理工作。遍历结束时必须要调用这个函数。

（5）va_copy(dest,src)：c99中引入，将src复制到dest中，dest和src均为va_list型状态变量。这样就生成指向当前参数的第二个状态变量，然后可以独立的使用src和dest来遍历可变参数表。dest中也要像src中一样调用va_end。

6、iso646.h： 为逻辑运算符定义一些方便使用的宏，是C89增补1中增加的。

/* ISO C Standard:  7.9  一些运算符宏  <iso646.h> */
#ifndef _ISO646_H
#define _ISO646_H
#ifndef __cplusplus
#define and	&&
#define and_eq	&=
#define bitand	&
#define bitor	|
#define compl	~
#define not	!
#define not_eq	!=
#define or	||
#define or_eq	|=
#define xor	^
#define xor_eq	^=
#endif
#endif

之所以要为&&、|、!、^等这些运算符定义一个宏，是因为在ISO 646的字符集中要使用这些特殊的符号可能不方便，而用等价的宏名and、bitor、not、xor就比较方便了，在C++中这些宏名是关键字。C89增补1还提供了一些能在ISO 646中方便使用的字符来拼写{、}之类的符号。如<%、%>、<:、:>、%:、%:%分别等价于字符{、}、[、]、#、##。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航