您的位置:首页 > 其它

深入研究字节对齐问题 .

2014-01-12 13:15 239 查看
1.      
对齐的原因与作用


1.1. 
对齐的原因

各种硬件平台对存储空间的处理上有很大的不同。一些平台对某些特定类型的数据只能从某些特定地址开始存取。比如有些架构的CPU在访问一个没有进行对齐的变量的时候会发生错误,那么在这种架构下编程必须保证字节对齐。

1.2. 
对齐的作用

最常见的情况是,如果不按照适合其平台要求对数据存放进行对齐,会在存取效率上带来损失。比如有些平台每次读都是从偶地址开始,如果一个int型(假设为32位系统)存放在偶地址开始的地方,那么一个读周期就可以读32bit,而如果存放在奇地址开始的地方,就需2个读周期,并对两次读出的结果的高低字节进行拼凑才能得到32bit数据。显然在读取效率上下降很多。

如果都按照该cpu对齐格式对齐了的话,可以大大减少cpu读周期的数目,明显提高了运算的效率。

在x86上,类似的操作只会影响效率,因为x86支持自动对齐。但是在MIPS或者sparc上,可能就是一个error,因为它们要求必须字节对齐。 

2.      
对齐的实现


通常,我们写程序的时候,不需要考虑对齐问题。编译器会替我们选择适合目标平台的对齐策略。当然,我们也可以通知给编译器传递预编译指令而改变对指定数据的对齐方法。

但是,如果我们从不关心这个问题,在有些情况下可能会出错。比如第三方库、IPC之间发送内存数据、二进制网络协议等等,有可能使用不同的编译器并设置不同的字节对齐方式,因此就有可能带来一些莫名其妙的错误,对于相同的结构体或类对象sizeof出来的大小可能差别很大。 

3.      
字节对齐对程序的影响


先让我们看几个例子吧(32bit,x86环境,gcc编译器):
设结构体如下定义:

struct A

{

    int a;

char b;

    short c;

};

struct B

{

    char b;

    int a;

    short c;

};
现在已知32位机器上各种数据类型的长度如下:

char:1(有符号无符号同)    

short:2(有符号无符号同)    

int:4(有符号无符号同)    

long:4(有符号无符号同)    

float:4    

double:8
那么上面两个结构大小如何呢?
结果是:

sizeof(strcut A)值为8

sizeof(struct B)的值却是12

结构体A中包含了4字节长度的int一个,1字节长度的char一个和2字节长度的short型数据一个,B也一样;按理说A,B大小应该都是7字节。

之所以出现上面的结果是因为编译器要对数据成员在空间上进行对齐。上面是按照编译器的默认设置进行对齐的结果,默认对齐设置为4字节。那么我们是不是可以改变编译器的这种默认对齐设置呢,当然可以.例如:

#pragma pack (2) /*指定按2字节对齐*/

struct C

{

    char b;

    int a;

    short c;

};

#pragma pack () /*取消指定对齐,恢复缺省对齐*/

sizeof(struct C)值是8。

修改对齐值为1:

#pragma pack (1) /*指定按1字节对齐*/

struct D

{

    char b;

    int a;

    short c;

};

#pragma pack () /*取消指定对齐,恢复缺省对齐*/

sizeof(struct D)值为7。

后面我们再讲解#pragma pack()的作用。

4.      
设置默认对齐值


4.1.      
vc设置方法

1.      
在VC IDE中,可以这样修改:[Project]|[Settings],c/c++选项卡Category的Code
Generation选项的Struct Member Alignment中修改,默认是8字节。

2.      
在编码时,可以这样动态修改:#pragma pack .注意:是pragma而不是progma。

4.2.      
gcc设置方面

在代码中添加:#pragma pack (对齐字节值)。 

5.      
字节对齐规则


5.1.      
基本概念

1.数据类型自身的对齐值:

对于 char 型数据,其自身对齐值为 1 ,对于 short 型为 2 ,对于 int,float 类型,其自身对齐值为 4 , double 为 8 ,单位字节。

2.结构体或者类的自身对齐值: 其成员中自身对齐值最大的那个值。

3.指定对齐值 : #pragma pack (value) 时的指定对齐值 value 。

4.数据成员、结构体和类的有效对齐值: 自身对齐值和指定对齐值中小的那个值。

    5.2.
       对齐算法

有了这些概念,我们就可以很方便的来讨论具体数据结构的成员和其自身的对齐方式。有效对齐值N是最终用来决定数据存放地址方式的值,最重要。有效对齐N,就是表示“对齐在N上”,也就是说该数据的"存放起始地址%N=0
" 。而数据结构中的数据变量都是按定义的先后顺序来排放的。第一个数据变量的起始地址就是数据结构的起始地址。结构体的成员变量要对齐排放,结构体本身也要根据自身的有效对齐值圆整(就是结构体成员变量占用总长度需要是对结构体有效对齐值的整数倍,结合下面例子理解)。

示例分析

示例一:
struct B

{

    char b;

    int a;

    short c;

};
假设B从地址空间0x0000开始排放,默认字节对齐值为4。第一个成员变量b的自身对齐值是1,比指定或者默认指定对齐值4小,所以其有效对齐值为1,所以其存放地址0x0000符合0x0000%1=0。第二个成员变量a,其自身对齐值为4,所以有效对齐值也为4,所以只能存放在起始地址为0x0004到0x0007这四个连续的字节空间中,复核0x0004%4=0,且紧靠第一个变量。第三个变量c,自身对齐值为2,所以有效对齐值也是2,可以存放在0x0008到0x0009这两个字节空间中,符合0x0008%2=0。所以从0x0000到0x0009存放的都是B内容。再看数据结构B的自身对齐值为其变量中最大对齐值(这里是b)所以就是4,所以结构体的有效对齐值也是4。根据结构体圆整的要求,0x0009到0x0000=10字节,(10+2)%4=0。所以0x0000A到0x000B也为结构体B所占用。故B从0x0000到0x000B
共有12个字节,sizeof(struct B)=12。

其实如果就这一个就来说它已将满足字节对齐了,
因为它的起始地址是0,因此肯定是对齐的,之所以在后面补充2个字节,是因为编译器为了实现结构数组的存取效率。试想,如果我们定义了一个结构B的数组,那么第一个结构起始地址是0没有问题,但是第二个结构呢?按照数组的定义,数组中所有元素都是紧挨着的,如果我们不把结构的大小补充为4的整数倍,那么下一个结构的起始地址将是0x0000A,这显然不能满足结构的地址对齐了,因此我们要把结构补充成有效对齐大小的整数倍。其实诸如:对于char型数据,其自身对齐值为1,对于short型为2,对于int,float类型,其自身对齐值为4,这些已有类型的自身对齐值也是基于数组考虑的,只是因为这些类型的长度已知了,所以他们的自身对齐值也就已知了。
再分析一个:
#pragma pack (2) /*指定按2字节对齐*/

struct C

{

    char b;

    int a;

    short c;

};

#pragma pack () /*取消指定对齐,恢复缺省对齐*/
第一个变量b的自身对齐值为1,指定对齐值为2,所以,其有效对齐值为1,假设C从0x0000开始,那么b存放在0x0000,符合0x0000%1=
0;第二个变量,自身对齐值为4,指定对齐值为2,所以有效对齐值为2,所以顺序存放在0x0002、0x0003、0x0004、0x0005四个连续字节中,符合0x0002%2=0。第三个变量c的自身对齐值为2,所以有效对齐值为2,顺序存放在0x0006、0x0007中,符合0x0006%2=0。所以从0x0000到0x00007共八字节存放的是C的变量。又C的自身对齐值为4,所以C的有效对齐值为2。又8%2=0,C
只占用0x0000到0x0007的八个字节。所以sizeof(struct C)=8。

5.3.      
其他细节

1 、数组的自身对齐值为元素对齐值。

2 、嵌套结构体对齐值为打散后内部最大的对齐值。

3 、x86
中有个设置是否检查字节对齐的选项,但是windows 都没有设置这个选项,缺省为0 (不检查,自动对齐)。

4 、单个简单数据类型,如int
、long 、double 等字节对齐大小不受编译器影响。

5 、当数组作为函数的参数进行传递时,该数组自动退化为同类型的指针,sizeof
大小为4 。

 6.      
在程序中处理字节对齐问题


1)代码中关于对齐的隐患,很多是隐式的。比如在强制类型转换的时候。

例如:
unsigned int i = 0x12345678;

unsigned char *p=NULL;

unsigned short *p1=NULL;

p=&i;

*p=0x00;

p1=(unsigned short *)(p+1);

*p1=0x0000;
最后两句代码,从奇数边界去访问unsigned short型变量,显然不符合对齐的规定。

2)如果在编程的时候要考虑节约空间的话,那么我们只需要假定结构的首地址是0,然后各个变量按照上面的原则进行排列即可,基本的原则就是把结构中的变量按照类型大小从大到小声明,尽量减少中间的填补空间。还有一种就是为了以空间换取时间的效率,我们显示的进行填补空间进行对齐,比如:有一种使用空间换时间做法是显式的插入reserved成员:

         struct A{

           char a;

           char reserved[3];//使用空间换时间
           int b;

}

reserved成员对我们的程序没有什么意义,它只是起到填补空间以达到字节对齐的目的,当然即使不加这个成员通常编译器也会给我们自动填补对齐,我们自己加上它只是起到显式的提醒作用。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: