您的位置：首页 > 编程语言 > C语言/C++

什么是BSS段和c语言程序如何变成可执行的文件

2017-05-09 21:16 197 查看

一.什么是BSS、test、data段

在采用段式内存管理的架构中（比如intel的80x86系统）,一个程序本质上都是由 bss段、data段、text段三个组成的

BSS段：BSS段（bss segment）通常是指用来存放程序中未初始化的全局变量的一块内存区域。
一般在初始化时bss 段部分将会清零（bss段属于静态内存分配，即程序一开始就将其清零了）BSS段属于静态内存分配。
数据段：数据段（data segment）通常是指用来存放程序中已初始化的全局变量的一块内存区域。数据段属于静态内存分配。
代码段：代码段（code segment/text segment）通常是指用来存放程序执行代码的一块内存区域。这部分区域的大小在程序运行前就已经确定，并且内存区域通常属于只读, 某些架构也允许代码段为可写，即允许修改程序。在代码段中，也有可能包含一些只读的常数变量，例如字符串常量等。
堆（heap）：堆是用于存放进程运行中被动态分配的内存段，它的大小并不固定，可动态扩张或缩减。当进程调用malloc等函数分配内存时，新分配的内存就被动态添加到堆上（堆被扩张）；当利用free等函数释放内存时，被释放的内存从堆中被剔除（堆被缩减）
栈(stack)：栈又称堆栈，是用户存放程序临时创建的局部变量，也就是说我们函数括弧“{}”中定义的变量（但不包括static声明的变量，static意味着在数据段中存放变量）。除此以外，在函数被调用时，其参数也会被压入发起调用的进程栈中，并且待到调用结束后，函数的返回值也会被存放回栈中。由于栈的先进先出特点，所以栈特别方便用来保存/恢复调用现场。从这个意义上讲，我们可以把堆栈看成一个寄存、交换临时数据的内存区。
比如，在C语言程序编译完成之后，已初始化的全局变量保存在.data 段中，未初始化的全局变量保存在.bss 段中。

l text和data段都在可执行文件中（在嵌入式系统里一般是固化在镜像文件中），由系统从可执行文件中加载；
l 而bss段不在可执行文件中，由系统初始化。

编译两个小程序如下：
程序1:
int ar[30000];
void main()
{
......
}

程序2:
int ar[300000] = {1, 2, 3, 4, 5, 6 };
void main()
{
......
}
发现程序2编译之后所得的.exe文件比程序1的要大得多。为什么？
区别很明显，一个位于.bss段，而另一个位于.data段，两者的区别在于：
l 全局的未初始化变量存在于.bss段中，具体体现为一个占位符；全局的已初始化变量存于.data段中；
l 而函数内的自动变量都在栈上分配空间。
l .bss是不占用.exe文件空间的，其内容由操作系统初始化（清零）；
l 而.data却需要占用，其内容由程序初始化，因此造成了上述情况。

注意：
l bss段（未手动初始化的数据）并不给该段的数据分配空间，只是记录数据所需空间的大小。
l data（已手动初始化的数据）段则为数据分配空间，数据保存在目标文件中。
l DATA段包含经过初始化的全局变量以及它们的值。
l BSS段的大小从可执行文件中得到，然后链接器得到这个大小的内存块，紧跟在数据段后面。当这个内存区进入程序的地址空间后全部清零。包含DATA和BSS段的整个区段此时通常称为数据区。

参考：
http://www.360doc.com/content/11/1030/12/1317564_160270893.shtml
http://www.cppblog.com/prayer/archive/2009/08/17/93594.html

二.c语言程序如何变成可执行的文件

C语言是一门计算机语言，有自己一定的语法。但是，C语言并不能直接被对象所理解，需要将C语言转变成可执行代码，即二进制代码。
在C语言转变成二进制可执行代码时，是以工程为单位的。而一个工程中往往会包含多个C文件。因此，需要将每个C文件都编译成二进制代码。
此时，每个C文件所对应的二进制代码是独立的。由于工程是一个系统，所以需要将所有的C文件二进制代码链接到一起，形成一个工程的可执行文件。
综上，编译和链接就是指的将C文件转变成二进制代码，并将各个独立的C文件二进制代码链接到一起，形成一个可执行文件的过程。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航