您的位置:首页 > 编程语言 > C语言/C++

探究printf

2016-04-15 23:35 363 查看
对printf的探究始于几个问题

1、

short a, b;

printf(“a=%d b=%d”, a, b);

%d是用来打印有符号整型int类型,那它这样打印会不会有问题,比如寻址越界,但是发现其实都能够打印正常,所以应该不会有寻址越界问题。

%c打印出的是ASCII码,字符‘8’,十进制是56

unsigned char a = 56;

printf(“a=%c %d”, a, a);

打印结果: 8 56

2、printf的实现原理究竟是怎样的,它是如何实现可变参数的。

现在我们仍然采用汇编语言以及阅读printf源码来解决疑问。

typedef struct Array{

short a;

short b;

short c;

short d;

char e[10];

};

int mani()

{

Array s = {10, 8, 9, 7, 11,12, 13, 14,15,16, 17, 18, 19, 20};

printf(“s.a=%c s.b=%c s.c=%c s.d=%c s.e[%c %c %c %c %c %c %c %c %c %c]”,

s.a, a.b, s.c, s.d, s.e[0], s.e[1], s.e[2], s.e[3], s.e[4], s.e[5], s.e[6], s.e[7], s.e[8], s.e[9]);

}

汇编语言的核心部分:

初始化Array s

movw 10,−80(movw8, -78(%rbp)

movw 9,−76(movw7, -74(%rbp)

movb 11,−72(movb12, -71(%rbp)

….

movb $20, -63(%rbp)

将printf的入参压入栈

movzbl -63(%rbp), %eax

movsbl %al, %r13d

movzbl -62(%rbp), %eax

movsbl %al, %r12d

….

movzwl -80(%rbp), %eax

movl %r13d, 64(%rsp)

movl %r12d, 56(%rsp)

movl %r11d, 48(%rsp)

….

call printf

通过上述汇编语言,我们可以巩固一下很多知识点

1)函数的入参是从右到左入栈的,也就是说第一个参数离着被调用函数最近

2)之所以将十几个参数传入printf,是为了查看入栈的过程,不然几个参数的话都会被放入寄存器中,就不会观察到上面所说是否有越界访问的问题

3)虽然是字符类型,但是入参在栈中是占用8个字节,short、int类型亦是如此,所以根本不会存在越界访问的问题,唯一存在的问题有,%u打印有符号或者有符号打印%u,存在错误,还有就是%s打印字符串时,如果误传入整型,造成程序崩溃

接下来我们看一下Printf的源码

printf的一种实现(libc下printf.c)

int printf(const char *fmt, …)

{

int ret;

va_list ap;

va_start(ap, fmt); //ap指向了第二个入参地址

ret = vfprintf(stdout, fmt, ap);

va_end(ap);

return ret;

}

va_list、va_start的宏定义 #define _INTSIZEOF(n) \ ((sizeof(n)+sizeof(int)-1)&~(sizeof(int) - 1) ) #define va_start(ap,v) ( ap = (va_list)&v + _INTSIZEOF(v) ) #define va_arg(ap,t) \ ( (t )((ap += _INTSIZEOF(t)) - _INTSIZEOF(t)) ) #define va_end(ap) ( ap = (va_list)0 )

typedef char* va_list;

va_arg宏做了两件事情,第一件事情是先把ap指针指向下一个入参,第二件事情是将ap减去当前入参的大小,重新得到当前入参的位置,强制转换成当前入参。一开始对ap如何指向下一个入参存在疑问。原来是先指向下一个,然后再用临时变量返回。

关于vfprintf,没有继续深究,基本原理应该也是按上面的8字节寻址,知道解析完fmt.

<
4000
p>最后贴一个va_list的示例代码:

下面是va_list的用法示例 包含的头文件stdarg.h:

int AveInt(int,…);

void main()

{

printf(“%d/t”,AveInt(2,2,3));

printf(“%d/t”,AveInt(4,2,4,6,8));

return;

}

int AveInt(int v,…)

{

int ReturnValue=0;

int i=v;

va_list ap ;

va_start(ap,v);

while(i>0)

{

ReturnValue+=va_arg(ap,int) ;

i–;

}

va_end(ap);

return ReturnValue/=v;

}

2016/04/21:讲到一个异步信号安全函、可重入函数、线程安全函数,对于printf这类函数,它们使用了全局数据结构(iobuffer),所以不是线程安全的(多个线程同时访问共享资源),也是不可重入的(有共享资源,可能损坏);

一个可重入函数意味着可以被中断,可重入函数与异步信号函数是等价的,是线程安全函数的真子集。

2017/8/25:

工作中遇到一个问题,以为编译器会自动类型转换,其实不是,

我们知道智能指针类对象和指针可以相互赋值,

比如sp p;它其实是对象,内部维护着一个指针

printf(“%p”, p); 我以为可以自动转换成指针,但其实printf的实现可以看出,printf的第一个参数就是一个字符串,和后面的参数没有关联的。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  C++