您的位置:首页 > 编程语言 > C语言/C++

C语言的编译原理及过程

2016-07-13 10:08 288 查看
前几天有个朋友问我关于C语言的编译原理和编译的过程,当时我也没有说明白,今天特意在书上和网上查阅资料,简单的总结了一下关于C语言的编译原理及过程。

集成开发环境是用于提供程序开发环境的应用程序,一般包括代码编辑器、编译器,调试器和图形用户界面工具。集成了代码编写功能、分析功能、编译功能、调试功能等一体化的开发软件服务套。

编辑器:编写代码的一些窗口。

编译器:检查用户代码的一些语法错误,将其编译成汇编代码。

汇编器:将编译出来的汇编文件编译成一定功能的目标代码。

连接器:将目标代码连接成可执行文件。

一个编译器包括一下几个部分:

1.词法分析:扫描器(Scanner)将源代的字符序列分割成一系列的记号(Token)。lex工具可实现词法扫描。

2.语法分析:语法分析器将记号(Token)产生语法树(Syntax Tree)。yacc工具可实现语法分析(yacc: Yet Another Compiler Compiler)。

3.语义分析:静态语义(在编译器可以确定的语义)、动态语义(只能在运行期才能确定的语义)。

4.源代码优化:源代码优化器(Source Code Optimizer),将整个语法书转化为中间代码(Intermediate Code)(中间代码是与目标机器和运行环境无关的)。中间代码使得编译器被分为前端和后端。编译器前端负责产生机器无关的中间代码;编译器后端将中间代码转化为目标机器代码。

5.目标代码生成:代码生成器(Code Generator).

6.目标代码优化:目标代码优化器(Target Code Optimizer)。

了解了以上几个概念后,正式进入C语言的编译原理及过程:

C语言编译的完整过程:C源程序--->预编译处理--->编译、优化处理--->汇编程序--->链接程序--->可执行文件

以上过程可以简单的分为4大步骤:预处理--->编译--->汇编--->链接

1.预处理:包括以下几个过程

a.宏定义指令:将所有的#define删除,并且展开所有的宏定义

b.条件编译指令:处理所有的条件预编译指令,比如#if #ifdef #elif #else #endif等

c.头文件包含指令:处理#include 预编译指令,将被包含的文件插入到该预编译指令的位置

d.特殊符号指令:预编译器可研识别一些特殊的符号,例如:删除所有注释 “//”和”/*
*/”

e.添加行号和文件标识,以便编译时产生调试用的行号及编译错误警告行号

f.保留所有的#pragma编译器指令,因为编译器需要使用它们

使用以下命令来进行预处理:

gcc -E *.c -o *.i

参数-E表示只进行预处理

2.编译 :编译过程就是把预处理完的文件进行一系列的词法分析,语法分析,语义分析及优化后生成相应的汇编代码

使用一下指令进行编译:

gcc –S *.i –o *.s

3.汇编: 汇编器是将汇编代码转变成机器可以执行的命令,每一个汇编语句几乎都对应一条机器指令。根据汇编指令和机器指令的对照表一一翻译即可。用一下指令进行汇编:

gcc –c *.c –o *.o

4.链接:通过调用链接器ld来链接程序运行需要的一大堆目标文件,以及所依赖的其它库文件,最后生成可执行文件., 链接的主要内容是把各个模块之间相互引用的部分处理好,使得各个模块之间能够正确地衔接,链接分为静态链接和动态链接。

静态链接是指在编译阶段直接把静态库加入到可执行文件中去,这样可执行文件会比较大。静态库文件:是一个二进制文件,存放的功能函数实现,在文件编译时要访问文件,编译之后静态库文件可以删除

而动态链接则是指链接阶段仅仅只加入一些描述信息,而程序执行时再从系统中把相应动态库加载到内存中去,动态库文件:是一个二进制文件,存放的功能函数实现,在文件执行时要访问文件,编译时不需要动态库文件

linux动态库文件后缀名:.so

window动态库文件后缀名:.dll

目标文件:是一个二进制文件,由函数组成,不能单独执行,给主函数的文件调用。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息