ctype.h和ctype.c在Linux中的实现方式与编码艺术
2015-12-07 20:24
513 查看
在C语言中,有这样几个函数:
?
一般人的实现方法是用宏定义的方法来实现这写函数,比如对于int isdigit()函数:
?
这样定义使函数简洁,使用宏定义省掉了函数调用的开销,提高了效率。
我们来看看linux系统下是如何实现的:
?
这种方法是用映射的方法,将 ASCII 码值映射到 _ctype 数组中的每一项。例如 字符‘0’~‘9’对应的ASCII码为48~57,映射到上面的_ctype数组相应的位置全是_D,_D&_D为真,这样就能判断出参数c的值是不是数字字符。
另外我在这里时对于#define isdigit(c)((_ctype+1)[c]&(_D)) 函数中为什么有_ctype+1不了解,这里若_ctype+1则指向数组的第二个元素_C,为什么要这样呢?
这是因为linux大师们在定义字符时把EOF也定义进去了,而EOF的值为0,多定义了这个元素,而且把他定义在第一位,所以要跳过这一位而从第一个元素开始。还有就是NULL/0其实也是一个控制字符,所以在int
iscntrl(c)函数中如果传进实参为NULL,返回值是1的。
我在VS2008里进行试验,其代码为:
?
结果显示为“e”。也就是说,(word+1)作为一个指针指向word字符串的第二个值。或者说,在数组中,数组名其实就是一个指针,其验证方法如下:
?
显示结果为“h”。
Linux中这几个函数典型的运用了空间换时间的办法,其精华之处在于,对不同种类的字符进行了分类,并使用唯一的二进制来进行标识。这些用法相信一般的人是想不出来的,而这也正体现出大师们的大师之处。看来有时间还是要多看linux内核的代码,从中领悟出大师们的编码艺术思想。
?
1 2 3 4 5 6 7 8 9 10 11 | int isalnum (c) //检查c是否是字母或数字 int isalpha (c) //检查c是否是字母 int iscntrl (c) // 检查c是否控制字符(其ASCII码在0和0x1F之间,数值为 0-31) int isdigit (c) //检测是否是数字 int isgraph (c) //检查c是否可显示字符(其ASCII码在ox21到ox7E之间),不包括空格 int islower (c) int
//检查c是否是可打印字符(包括空格),其ASCII码在ox20到ox7E之间 int
//检查c是否是标点字符(不包括空格),即除字母,数字和空格以外的所有可打印字符 int isspace (c) //检查c是否是空格符和跳格符(控制字符)或换行符 int isupper (c) int isxdigit (c) //检查c是否是一个16进制数学字符(即0-9,或A-F,或a-f) |
?
1 | #define isdigit(c)((c)>=’0’&&(c)<=’9’) |
我们来看看linux系统下是如何实现的:
?
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 | #define _U 0x01 /* upper */ #define _L 0x02 /* lower */ #define _D 0x04 /* digit */ #define _C 0x08 /* cntrl */ #define _P 0x10 /* punct */ #define _S 0x20 /* white space (space/lf/tab) */ #define _X 0x40 /* hex digit */ #define _SP 0x80 /* hard space (0x20) */ extern unsigned char _ctype[]; extern char _ctmp; #define isdigit(c)((_ctype+1)[c]&(_D)) unsigned char _ctype[] = {0x00, /* EOF */ _C,_C,_C,_C,_C,_C,_C,_C, /* 0-7 */ _C,_C|_S,_C|_S,_C|_S,_C|_S,_C|_S,_C,_C, /* 8-15 */ _C,_C,_C,_C,_C,_C,_C,_C, /* 16-23 */ _C,_C,_C,_C,_C,_C,_C,_C, /* 24-31 */ _S|_SP,_P,_P,_P,_P,_P,_P,_P, /* 32-39 */ _P,_P,_P,_P,_P,_P,_P,_P, /* 40-47 */ _D,_D,_D,_D,_D,_D,_D,_D, /* 48-55 */ _D,_D,_P,_P,_P,_P,_P,_P, /* 56-63 */ _P,_U|_X,_U|_X,_U|_X,_U|_X,_U|_X,_U|_X,_U, /* 64-71 */ _U,_U,_U,_U,_U,_U,_U,_U, /* 72-79 */ _U,_U,_U,_U,_U,_U,_U,_U, /* 80-87 */ _U,_U,_U,_P,_P,_P,_P,_P, /* 88-95 */ _P,_L|_X,_L|_X,_L|_X,_L|_X,_L|_X,_L|_X,_L, /* 96-103 */ _L,_L,_L,_L,_L,_L,_L,_L, /* 104-111 */ _L,_L,_L,_L,_L,_L,_L,_L, /* 112-119 */ _L,_L,_L,_P,_P,_P,_P,_C, /* 120-127 */ 0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0, /* 128-143 */ 0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0, /* 144-159 */ 0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0, /* 160-175 */ 0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0, /* 176-191 */ 0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0, /* 192-207 */ 0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0, /* 208-223 */ 0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0, /* 224-239 */ 0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0}; /* 240-255 */ |
另外我在这里时对于#define isdigit(c)((_ctype+1)[c]&(_D)) 函数中为什么有_ctype+1不了解,这里若_ctype+1则指向数组的第二个元素_C,为什么要这样呢?
这是因为linux大师们在定义字符时把EOF也定义进去了,而EOF的值为0,多定义了这个元素,而且把他定义在第一位,所以要跳过这一位而从第一个元素开始。还有就是NULL/0其实也是一个控制字符,所以在int
iscntrl(c)函数中如果传进实参为NULL,返回值是1的。
我在VS2008里进行试验,其代码为:
?
1 2 | char word[]= "chengdu" ; printf ( "%c" ,(word+1)[1]); |
?
1 2 | char word[]= "chengdu" ; printf ( "%c" ,*(word+1)); |
Linux中这几个函数典型的运用了空间换时间的办法,其精华之处在于,对不同种类的字符进行了分类,并使用唯一的二进制来进行标识。这些用法相信一般的人是想不出来的,而这也正体现出大师们的大师之处。看来有时间还是要多看linux内核的代码,从中领悟出大师们的编码艺术思想。
相关文章推荐
- Linux下的变化的主机名步骤
- 在sourceinsight中添加快速注释 Ctrl+/
- 用VBScript写Linux脚本——SecureCRT与VBScript
- Linux多任务编程
- Windows与Linux文件系统互访的几种方法
- Linux学习-等待队列
- memmove函数实现——string.h库函数
- linux等待队列之wait_event和wake_up
- Linux简单命令之二
- Linux命令学习笔记(2)----more命令
- Linux 下查看机器代码
- 《构建高可用LINUX服务器》读书笔记
- LoadRunner监控Linux
- linux程序多线程互斥锁的简单使用
- linux下安装webbench
- CentOS 6.5升级Python2.7
- loadrunner的agent部署在linux下
- sourceinsight 中文支持 解决办法
- Linux下的snmpd.conf配置说明
- Linux 标准目录结构