内存对齐的影响因素
2006-11-26 21:01
183 查看
一
)
为什么要有内存对齐
以下内容节选自《
Intel Architecture 32 Manual
》。
字,双字,和四字在自然边界上不需要在内存中对齐。(对字,双字,和四字来说,自然边界分别是偶数地址,可以被
4
整除的地址,和可以被
8
整除的地址。)
无论如何,为了提高程序的性能,数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;然而,对齐的内存访问仅需要一次访问。
一个字或双字操作数跨越了
4
字节边界,或者一个四字操作数跨越了
8
字节边界,被认为是未对齐的,从而需要两次总线周期来访问内存。一个字起始地址是奇数但却没有跨越字边界被认为是对齐的,能够在一个总线周期中被访问。
某些操作双四字的指令需要内存操作数在自然边界上对齐。如果操作数没有对齐,这些指令将会产生一个通用保护异常(
#GP
)。双四字的自然边界是能够被
16
整除的地址。其他的操作双四字的指令允许未对齐的访问(不会产生通用保护异常),然而,需要额外的内存总线周期来访问内存中未对齐的数据。
二
)
常见数据类型的内存对齐
为了能使
CPU
对变量进行高效快速的访问,变量的起始地址应该具有某些特性,
即所谓的
“
对齐
”
。例如对于
4
字节的
int
类型变量,其起始地址应位于
4
字节边界上,
即起始地址能够被
4
整除。变量的对齐规则如下(
32
位系统):
Type | Alignment( 默认的自然对齐 ) |
char | 在字节边界上对齐 |
short(16-bit) | 在双字节边界上对齐 |
int long (32-bit) | 在 4 字节边界上对齐 |
float | 在 4 字节边界上对齐 |
double | 在 8 字节边界上对齐 |
structures | 单独考虑结构体的每个成员,它们在不同的字节边界上对齐。 其中最大的字节边界数就是该结构的字节边界数 |
structures
对于结构体
S1
的每个简单成员如果其对齐边界是
x1,
而它又含有结构体
S2,
而
S2
内部的对齐边界是
x2,
则结构体
S1
的对齐边界取
X=max(x1, x2);
对于结构体
S2
中的某一成员
item
,它的对齐边界取
: X=max(sizeof(item)
范例:
struct s1{
short a;
long b;
};
struct s2{
char c;
s1 d;
long long e;
};
问
1.sizeof(s2) = ?
2.s2
的内存布局是怎么样的
?
答:
//modify 2007.3.10
s1,
成员
a
是
short,
按
2byte
自然对齐
;
成员
b
是
int,
按
4byte
自然对齐,取最大成员的
size(int),
因此这个结构体的对齐边界就是
4bytes.
所以
sizeof(s1)=8;
s2,
成员
c
是
char,
按
1byte
自然对齐。但成员
d
则又是个结构体,
sizeof(d)
是
8byte,
结构体
d
内成员的最大是
int,
它的内部对齐由
s1
可知,是按
4byte
对齐。那么这边又按什么对齐呢?下面成员
e
是
long long,
默认按
8byte
对齐。因此
S1
中的成员是按
8BYTE
对齐
,
但
S2
中仍然按照
4BYTE
对齐
.
a b
S1
的内存布局:
11**,1111,
//4byte
对齐, sizeof(s1)=2+[2]+4 = 8
S2
的内存布局:
1***,****,11**,1111,11111111 //8byte
对齐, sizeof(s2)=1+[7]+8+8 = 24byte.
实际gcc下检测得到的是20byte=1+[3]+8+8, 估计是按4byte缺省对齐的。
说明:[ ]表示需要补位的值。Modify on Mar,5,2010.
------------------------------------------------------------------------------------
注意:
1
)
对于空结构体,
sizeof
==
1
;因为必须保证结构体的每一个实例在内存中都
有独一无二的地址。
2
)
结构体的静态成员不对结构体的大小产生影响,因为静态变量的存储位置与
结构体的实例地址无关。
例如:
struct {static int I;} T; struct {char a; static int I;} T1;
sizeof(T) == 1; sizeof(T1) == 1;
三
)
各编译器下内存对齐的影响
上面那种是系统默认的对齐,也就是自然对齐。
现实中,编译器也能按指定的字节进行对齐,这称为指定对齐。如
VC
,
gcc
--------------------------------MSDN VC----------------------------------------------------
使用伪指令
#pragma pack (n)
,编译器将按照
n
个字节对齐;
使用伪指令
#pragma pack ()
,取消自定义字节对齐方式。
#pragma pack(n)
When you use #pragma pack(n), where n is 1, 2, 4, 8, or 16, each structure member after the first is stored on the smaller member type or n-byte boundaries. If you use #pragma pack without an argument, structure members are packed to the value specified by /Zp. The default /Zp packing size is /Zp8.
----------------------------------GCC-----------------------------------------------
__attribute__ ((packed));
相关文章推荐
- C++学习之旅——结构体和联合体的区别,以及数据对齐方式影响内存大小
- 网络编程(9)内存对齐对跨平台通讯的影响
- C++学习之旅——结构体和联合体的区别,以及数据对齐方式影响内存大小
- 内存对齐的影响
- 预处理-分节7(如何避免内存对齐的影响)
- C++学习之旅——结构体和联合体的区别,以及数据对齐方式影响内存大小
- C++ 语言特性的性能分析 之 影响性能的因素
- 影响开机速度因素有哪些
- 翻来覆去:如何做好搜索引擎优化?影响SEO的八项因素
- 结构体内存对齐模式
- 影响百度权重的因素
- c/c++ struct内存对齐
- 信息安全影响因素
- 结构体与内存字节对齐
- 影响网站成败重要因素
- 5分钟搞定内存字节对齐
- RTMP服务器的延迟,多级边缘不影响延迟,gop为最大因素
- c、c++在定义变量,数组时的内存布局及内存字节对齐
- 影响软件性能的因素
- 探讨:内存对齐