您的位置：首页 > 其它

C程序的坎坷人生

2016-07-06 23:39 204 查看

C语言的一生可谓此起彼伏，千变万化。

一个.c文件转换成可执行文件大概需要四个阶段：

第一步预处理 gcc -E test.c -o test.i //生成预编译处理文件

第二步编译 gcc -S test.i -o test.s //生成汇编文件

第三步汇编 gcc -c test.s -o test.o //生成目标文件

第四步链接 gcc test.o -o test //生成可执行文件

C语言的编译连接过程就是要把我们编写的一个C程序（源代码）转换成可以在硬件上运行的程序（可执行代码），需要进行预处理、编译、汇编、链接。
预处理相当于根据预处理命令组装成新的C程序，生成.i文件；
编译就是将得到的.i文件编译成汇编代码.s文件；
汇编就是将汇编文件编译成机器指令，并打包成可重定位的.o文件。该文件是二进制文件，字节编码是机器指令；
链接就是将引用的其他.o文件合并到我们程序所在的.o文件中，处理的得到最终的可执行文件。
具体实现流程图如下：

下面就来具体介绍一下C程序的转变过程。
1.预处理
读取C源文件，对其中的伪指令（以#开头的指令）和特殊符号进行处理（不涉及语法检查）
预编译程序所完成的基本上是对源程序的“替换”工作。经过此种替换，生成一个没有宏定义、没有条件编译指令、没有特殊符号的输出文件。这个文件的含义同没有经过预处理的源文件是相同的，但内容有所不同。下一步，此输出文件作为编译程序的输出而被翻译成为机器指令。
（1）.头文件包含指令：#include
在头文件中一般用伪指令#define定义了大量的宏（最常见的是字符常量），同时包含有各种外部符号的声明。
采用头文件的目的：使某些定义可以供多个不同的C源程序使用。因为在需要用到这些定义的C源程序中，只需加上一条#include语句即可，而不必在此文件中将这些定义重复一遍。
预编译程序将头文件中的定义统统加入到它所产生的输出文件中，以供编译程序对之进行处理。
#include<stdio.h>:在系统目录（/user/include/）中找stdio.h文件，若不存在则报错；
#include"stdio.h":先在当前目录中找stdio.h文件，若找不到，则再在系统目录中找，若仍找不到，则报错。
-I+第三方寻找目录，例如：gcc -Wall -O3 main.c test,c -o main -I/root/include
（2）.宏定义指令：#define
宏定义也就是全局变量，主要用于比较大的程序中，改一处，则全部改掉，方便修改和管理，不必一个一个地修改。
（3）.条件编译指令：#ifdef #else #endif
条件编译指令的引入使程序员可以通过定义不同的宏来决定编译程序对哪些代码进行处理。预编译程序将根据有关的文件，将不必要的代码过滤掉。
（4）.特殊符号
预编译程序可以识别一些特殊的符号。例如在源程序中出现的LINE标识将被解释为当前行号（十进制），FILE将被解释为当前被编译的C源程序的名称。预编译程序对于在源程序中出现的这些串将用合适的值进行替换。
2.编译
经过预处理得到的输出文件中，将只有常量。如数字、字符串、变量的定义，以及C语言的关键字。编译程序所要做的就是通过词法分析和语法分析，在确认所有的指令都符合语法规则后，将其翻译成等价的中间代码表示或汇编代码。
gcc -w test.c //关闭警告
gcc -Wall test.c //打开全部警告
优化
优化阶段是编译系统中一项比较艰深的技术。它涉及到的问题不仅痛编译技术本身有关，而且同机器的硬件环境也有很大的关系。
优化一部分是对中间代码的优化，这种优化不依赖于具体的计算机。主要的工作是删除公共表达式、循环优化（代码外提、强度削弱、变换循环控制条件、已知量的合并等）、复写传播，以及无用赋值的删除等等。
另一种优化则主要针对目标代码的生成而进行的，同机器的硬件结构密切相关，最主要的是考虑如何充分利用机器的各个硬件寄存器存放的有关变量的值，以减少对于内存的访问次数。另外，如何根据机器硬件执行指令的特点（如流水线、RISC\CISC\VLIW等），而对指令进行一些调整使目标代码比较短，执行效率比较高。
gcc -O1 test.c一级优化
gcc -O2 test.c二级优化

gcc -O3 test.c三级优化
一级优化即语句调整，公共表达式提取，废代码删除，用汇编重写、指令调整、换一种语言实现、换一个编译器、循环展开、参数传递优化等；
二级优化即新的视角，针对问题的算法，即选择和构造适合于问题的算法很多经典算法都对问题作了一些假设(包括我们当前已经完成的算法实现)，而在面对实际问题时“新的视角”提示我们应该重新检视这些假设，并尝试不同的思考问题的角度，寻求适合于问题的新算法；
三级优化就是将问题抽象为另一种等价的数学模型或假想机器模型，比如构造出某种表驱动状态机；这一级其实是第二级的延伸，只是产生的效果更加明显，但它有其本身的特点（任何算法和优化活动都可以看作是他的投影）；这一级一般可以产生无与伦比的快速程序。

3.汇编
汇编过程实际上指把汇编语言代码翻译成目标机器指令的过程。对于被翻译系统处理的每一个C语言源程序，都将最终经过这一处理而得到相应的目标文件。目标文件中所存放的也就是与源程序等效的目标的机器语言代码。
目标文件由段组成。通常一个目标文件中至少有两个段：

代码段　该段中所包含的主要是程序的指令。该段一般是可读和可执行的，但一般却不可写。
数据段　主要存放程序中要用到的各种全局变量或静态的数据。一般数据段都是可读，可写，可执行的。
4.链接

由汇编程序生成的目标文件并不能立即就被执行，其中可能还有许多没有解决的问题。例如，某个源文件中的函数可能引用了另一个源文件中定义的某个符号（如变量或者函数调用等）；在程序中可能调用了某个库文件中的函数，等等。所有的这些问题，都需要经链接程序的处理方能得以解决。
链接程序的主要工作就是将有关的目标文件彼此相连接，也即将在一个文件中引用的符号同该符号在另外一个文件中的定义连接起来，使得所有的这些目标文件成为一个能够诶操作系统装入执行的统一整体。
根据开发人员指定的同库函数的链接方式的不同，链接处理可分为两种：
（1）.静态链接　在这种链接方式下，函数的代码将从其所在地静态链接库中被拷贝到最终的可执行程序中。这样该程序在被编译时这些代码将被装入到该进程的虚拟地址空间中。静态链接库实际上是一个目标文件的集合，其中的每个文件含有库中的一个或者一组相关函数的代码。
（2）.动态链接在此种方式下，函数的代码被放到称作是动态链接库或共享对象的某个目标文件中。链接程序此时所作的只是在最终的可执行程序中记录下共享对象的名字以及其它少量的登记信息。在此可执行文件被执行时，动态链接库的全部内容将被映射到运行时相应进程的虚地址空间。动态链接程序将根据可执行程序中记录的信息找到相应的函数代码。
（3）.静态链接与动态链接的优缺点
静态链接：代码体积小、执行效率高、不易于升级、编译效率低、易于代码布局
动态链接：代码体积大、执行效率低、易于升级、编译效率高、不易于代码布局
（4）.静态库、动态库的生成
静态库：
ar rcs libtest.a test.o（编译后的.o文件封装到test.a库文件中）
gcc main.c -ltest -L.(当前目录)

动态库：
gcc -shared -fPIC test.c -o libtest.so
gcc main.c ./libtest.so(当前路径)

经过上述四个过程，C源程序就最终被转换成可执行文件了。缺省情况下这个可执行文件的名字被命名为a.out,可采用-o指令对其重命名。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航