您的位置：首页 > 编程语言 > C语言/C++

[转]关于C语言中的结构体对齐

2011-02-12 21:05 155 查看

p { margin-bottom: 0.21cm; }
转自：http://wenku.baidu.com/view/fcb1c30d6c85ec3a87c2c584.html，并修正了其中一些笔误。

对结构体内存对齐规则和长度规则做了具体的总结，而且描述了具体的伪算法。

＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝

　　(1)什么是字节对齐

　　一个变量占用 n
个字节，则该变量的起始地址必须能够被
n 整除，即:
存放起始地址 %
n = 0，对于结构体而言，这个 n
取其成员种的数据类型占空间的值最大的那个。

　　(2)为什么要字节对齐

　　内存空间是按照字节来划分的，从理论上说对内存空间的访问可以从任何地址开始，但是在实际上不同架构的CPU为了提高访问内存的速度，就规定了对于某些类型的数据只能从特定的起始位置开始访问。这样就决定了各种数据类型只能按照相应的规则在内存空间中存放，而不能一个接一个的顺序排列。

　　举个例子，比如有些平台访问内存地址都从偶数地址开始，对于一个int型(假设32位系统)，如果从偶数地址开始的地方存放，这样一个读周期就可以读出这个int数据，但是如果从奇数地址开始的地址存放，就需要两个读周期，并对两次读出的结果的高低字节进行拼凑才能得到这个int数据，这样明显降低了读取的效率。

　　(3)如何进行字节对齐

　　每个成员按其类型的对齐参数(通常是这个类型的大小)和指定对齐参数(不指定则取默认值)中较小的一个对齐，并且结构的长度必须为所用过的所有对齐参数的整数倍,不够就补空字节。

　　这个规则有点苦涩，可以把这个规则分解一下，前半句的意思先获得对齐值后与指定对齐值进行比较,其中对齐值获得方式如下：

　　1.
数据类型的自身对齐值为：对于char型数据，其自身对齐值为1，对于short型为2，对于int,
long, float类型，其自身对齐值为4，对于
double 类型其自身对齐值为8，单位为字节。

　　2.结构体自身对齐值：其成员中自身对齐值（而不是长度）最大的那个值。

　　其中指定对齐值获得方式如下：

　　#pragma
pack (value)时的指定对齐值value。

　　未指定则取默认值。

　　后半句的意思是主要是针对于结构体的长度而言，因为针对数据类型的成员，它仅有一个对齐参数，其本身的长度、于这个对齐参数，即1倍。对于结构体而言，它可能使用了多种数据类型，那么这句话翻译成对齐规则：
每个成员的起始地址 %
自身对齐值 =
0，如果不等于 0
则先补空字节直至这个表达式成立。

　　换句话说，对于结构体而言，结构体在在内存的存放顺序用如下规则即可映射出来：

　　(一)每个成员的起始地址
% 每个成员的自身对齐值
= 0，如果不等于
0 则先补空字节直至这个表达式成立；

　　(二)结构体的长度必须为结构体的自身对齐值的整数倍,不够就补空字节。

　　举个例子：

#pragma
pack(8)
struct
A{
　　char
a;
　　long
b;
};
struct
B{
　　char
a;
　　struct
A b;
　　long
c;
};
struct
C{
　　char
a;
　　struct
A b;
　　double
c;
};
struct
D{
　　char
a;
　　struct
A b;
　　double
c;
　　int
d;
};
struct
E{
　　char
a;
　　int
b;
　　struct
A c;
　　double
d;　　
};

　　对于 struct
A 来说，对于char型数据，其自身对齐值为1，对于long类型，其自身对齐值为4,
结构体的自身对齐值取其成员最大的对齐值，即大小4。那么struct
A 在内存中的顺序步骤为：

　　(1)
char a, 地址范围为0x0000~0x0000,起始地址为0x0000,满足
0x0000 % 1 = 0，这个成员字节对齐了。

　　(2)
long b, 地址起始位置不能从0x00001开始，因为
0x0001 % 4 !=
0,　所以先补空字节，直到0x00003结束，即补3个字节的空字节，从0x00004开始存放b,其地址范围为0x00004~0x0007.

　　(3)此时成员都存放结束，结构体长度为8，为结构体自身对齐值的2倍，符合条件(二).

　　此时满足条件(一)和条件(二)，struct
A 中各成员在内存中的位置为：a***
b ,sizeof(struct A) = 8。(每个星号代表一字节，成员各自代表自己所占的字节，比如a占一字节，b占四字节)

　　对于struct
B，里面有个类型为struct
A的成员b自身对齐值为4，对于long类型，其自身对齐值为4.
故struct
B的自身对齐值为4。那么struct
B 在内存中的顺序步骤为：

　　(1)
char a, 地址范围为0x0000~0x0000,起始地址为0x0000,满足
0x0000 % 1 = 0，这个成员字节对齐了。

　　(2)
struct A b, 地址起始位置不能从0x00001开始，因为
0x0001 % 4 !=
0,　所以先补空字节，直到0x00003结束，即补3个字节的空字节，从0x00004开始存放b,其地址范围为0x00004~0x00011.

　　(3)
long c，地址起始位置从0x000012开始，
因为 0x0012 % 4 =
0，其地址范围为0x00012~0x0015.

　　(4)此时成员都存放结束，结构体长度为16，为结构体自身对齐值的4倍，符合条件(二).

　　此时满足条件(一)和条件(二)，struct
B 中各成员在内存中的位置为：a***
b c ,sizeof(struct B) = 16。

　　对于struct
C，里面有个类型为struct
A的成员b自身对齐值为4，对于double
类型，其自身对齐值为8.
故struct
C的自身对齐值为8。那么struct
C 在内存中的顺序步骤为：

　　(1)
char a, 地址范围为0x0000~0x0000,起始地址为0x0000,满足
0x0000 % 1 = 0，这个成员字节对齐了。

　　(2)
struct A b, 地址起始位置不能从0x00001开始，因为
0x0001 % 4 !=
0,　所以先补空字节，直到0x00003结束，即补3个字节的空字节，从0x00004开始存放b,其地址范围为0x00004~0x00011.

　　(3)
double c，地址起始位置不能从0x000012开始，
因为 0x0012 % 8 !=
0，所以先补空字节，直到0x000015结束，即补4个字节的空字节，从0x00016开始存放c,其地址范围为0x00016~0x0023.

　　(4)此时成员都存放结束，结构体长度为24，为结构体自身对齐值的3倍，符合条件(二).

　　此时满足条件(一)和条件(二)，struct
C 中各成员在内存中的位置为：a***
b **** c ,sizeof(struct C) = 24。

　　对于struct
D，自身对齐值为8。前面三个成员与
struct
C 是一致的。对于第四成员d，因为
0x0024
% 4 = 0, 所以可以从0x0024开始存放d,
其地址范围为0x00024~0x00027.此时成员都存放结束，结构体长度为28，28
不是结构体自身对齐值8的倍数，所以要在后面补四个空格，即在0x0028~0x0031上补四个空格。补完了，结构体长度为32,
为结构体自身对齐值的4倍，符合条件(二)。

　　此时满足条件(一)和条件(二)，struct
D 中各成员在内存中的位置为：a***
b **** c d **** ,sizeof(struct D) = 32。

　　对于struct
E 中各成员在内存中的位置为：a***
b c d, sizeof(struct E) = 24。　　
　　

　　通过struct
D 和 struct
E
可以看出，在成员数量和类型一致的情况，后者的所占空间少于前者，因为后者的填充空字节要少。如果我们在编程时考虑节约空间的话，应该遵循将变量按照类型大小从小到大声明的原则,
这样尽量减少填补空间。另外，可以在填充空字节的地方来插入reserved成员,
例如

struct
A
{
　
char
a;
　
char
reserved[3];
　
int
b;
}；

　　这样做的目的主要是为了对程序员起一个提示作用，如果不加则编译器会自动补齐。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： c 语言 struct 编译器 float 算法

相关文章推荐

新的分享

章节导航