您的位置:首页 > 其它

字节对齐的学习笔记

2013-03-19 16:31 239 查看
原文地址:http://bbs.csdn.net/topics/190115138

一、问题的提出

    两年之前我写过一篇可变参数学习笔记,里面曾经简单的解释过一句:
    代码
    ((sizeof(n)+sizeof(int)-1)&~(sizeof(int)-1))
    的作用是在考虑字节对齐的因素下计算第一个可变参数的起始地址。
    当时限于时间和水平,未能做更详细的解释。
    今天(2007-11-26)在csdn论坛上看到了一个帖子
    http://topic.csdn.net/u/20071123/16/c8d17d3f-9f49-49af-a6d8-1d7a7d84dc1c.html?seed=303711257
问题:CRT源码分析中一个关于可变函数参数的问题  
提问者:Sun_Moon_Stars
里面又问到了这个宏,于是决定抽出半天时间,把这个问题详细的说清楚。也算是把我的那篇文章
做一个完美的结尾。
   

二、引子
   先看一个日常生活中的问题,
问题1:假设有要把一批货物放到集装箱里,货物有12件,
一个箱子最多能装6件货物,求箱子的数目。
解答:显然我们需要12/6=2个箱子,并且每个箱子都是满的。这个连小学生都会算:-)

问题2:   把问题1的条件改一下,假设一个箱子最多能装5件货物,那么现在的箱子数是多少?
解答:   12/5=2.4个,但是根据实际情况,箱子的个数必须为整数,(有不知道这个常识的就不要再往下看了,
回小学重读吧,呵呵)自然我们就要取3,
   下面把问题一般化

三、一般数学模型
问题3:设一个箱子最多可以装M件货物,且现有N件货物,
则至少需要多少个箱子,给出一般的计算公式。
这里要注意两点
1、箱子的总数必须为整数
2、N不一定大于M,很显然,即使N<M,也得需要一只箱子       

四、通项公式
1、预备知识
在讨论之问题3的解答之前,我们先明确一下/运算符的含义。
定义/运算为取整运算,即
对任意两个整数N,M,必然有且只有唯一的整数X,满足
X*M <= N < (X+1)*M,那么记N/M=X。
这个也正是c里/运算的确切含义。x的存在性和唯一性的严格证明可以见数论教材。
以后如无额外说明,/运算的含义均和本处一致。

/运算有一个基本的性质
若N=MX+Y,则N/M=X+Y/M,证明略

注意:N不是可以随便拆的,设N=A+B,那么一般情况下N/M 不一定等于 A/M+B/M,
A和B至少有一个是M的倍数才行。

2、分步讨论
根据上面的/运算符的定义,我们可以得到问题三的解答,分情况讨论一下
已知N/M=X,那么当
(1)、当N正好是M的倍数时即N=M*X时,那么箱子数就是X=N/M
(2)、如果N不是M的倍数,即N=M*X+Y(1<=Y<M)时
   那么显然还要多一个箱子来装余下的Y件货物,
   则箱子总数为X+1 = N/M+1

3、一般公式
上面的解答虽然完整,但是用起来并不方便,因为每次都要去判断N和M的倍数关系,
我们自然就要想一个统一的公式,于是,下面的公式出现了
   箱子数目为  (N+M-1)/M
 
这个式子用具体数字去验证是很简单的,留给读者去做。
我这里给一个完整的数学推导:
现在已经假定 /运算的结果为取整(或者说取模),即
N/M=X,则XM <=N <(X+1)M
那么,
(1)、当N=MX时,(N+M-1)/M= MX/M+(M-1)/M=X
(2)、当N=MX+Y(1<=Y<M)时,
   由1<=Y < M,同时加上M-1,得到M <= Y-1+M <= 2M-1 <2M
    根据 /运算的定义 (Y-1+M) /M = 1

  所以 (N+M-1)/M = (MX+Y+M-1)/M= MX/M+(Y+M-1)/M= X+1
显然 公式 (N+M-1)/M与2中的分步讨论结果一致。
可能有的读者还会问,这个公式是怎么想出来的,怎么就想到了加上那个M-1?
这个问题可以先去看看数论中的余数理论。

五、对齐代码的分析    
有了上面的数学基础,我们再来看看开头所说的对齐代码的含义
   ((sizeof(n)+sizeof(int)-1)&~(sizeof(int)-1))
意义就很明显了    
这里。机器字长度sizeof(int)相当于箱子的容量M,变量的真实字节大小相于
货物总数N,整个代码就是求n所占的机器字数目。

顺便仔细的解释一下
~(sizeof(int)-1))

这里用到了一个位运算的技巧,即若M是2的幂,那么
N/M = N &(~(M-1)),
这个读者可以用具体的数自己验证这个结论。
这里给出数学的解释:
设N,M都是二进制数字,且M为2的幂,即M=power(2,Y);
那么必有
N=M*X+Z(1< =Y < M)
而注意到这里的N,M,Z都是二进制表示,所以把N的最右边的Y位数字就是余数Z.
剩下的左边数字就是模X.我们的任务就是把左边的模求出来就可以。

注意:
(1)这里最关键的一点就是M必须是2的幂(有人常常理解成2的倍数也可以,那是不对的),
否则上面的结论是不成立的
(2) ~(M-1)更专业的叫法就是掩码(mask)。因为数字和这个掩码进行与运算后,数字的最右边Y位的
数字被置0("掩抹"掉了).即掩码最右边的0有多少位,数字最右边就有多少位被清0。

小结:
1、字节对齐的数学本质就是数论中的取模运算。在计算机上的含义就是求出一个对象占用的机器字数目。
2、在c中/运算可以用位运算和掩码来实现以加快速度,前提是机器字长度必须为2的幂。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: