您的位置：首页 > 其它

从一道IBM的笔试题看编码规范

2012-10-31 09:14 162 查看

From: http://blog.csdn.net/sailor_8318/article/details/3357766
char* fun1() { cout<<"a"; return "1"; }

char* fun2() { cout<<"b"; return "1"; }

char* fun3() { cout<<"c"; return "1"; }

int main(int argc, char* argv[])

{

cout<<"m"<<fun1()<<fun2()<<fun3()<<endl;

return 0;

}

屏幕输出是多少？

cbam111

为什么不是abcm111呢？或者是ma1b1c1呢？

其实问题的实质上述同一个语句中多个表达式的执行顺序问题。对于<<其实**一般**是从右往左处理的，但实际上并没有规定顺序

cout<<fun1<<fun2<<fun3

即

operator<<(operator<<(operator<<(cout,fun1),fun2),fun3)

有点递归的感觉，第一个〈〈需要后面的结果，最后就相当于从后面开始算起

于是碰到fun()必然先输出字符，然后返回1，于是就变成了

cout<<"m"<<fun1()<<fun2()<<1;

继续往左走，直到 cout<<"m"<<1<<1<<1 ;的时候已经输出了cba，之后就是按顺序输出了m111, 所以看到的结果就是 cbam111

但是问题就在这里：这是个<<表达式。<<本来是位运算，但是这里cout却是来利用运算的“副作用”。所谓副作用，就是计算一个表达式的时候，除了得到它的值以外，对环境产生的影响都是副作用。

比如：

int a=1,b=2,c=3,d;

d=a<<b:

这一步，a<<b计算出1左移2位得到的结果。结果是4。也就是说，赋值表达式结束后，d的值变成4，其它地方都没有改变。这就是说这个<<运算没有副作用。

但是，cout<<"a"就不一样了。这个表达式的值我们根本就不关心。我们只关心，这个表达式“计算”完以后，"a"被输出到屏幕上了。这里“a被输出到屏幕上”就是副作用。

再看这个例子：

int foo(int a, int b) { return a+b; }

int bar(int a, int b) { return a-b; }

int a=1,b=2,c=3,d;

d=foo(a,b)+bar(b,d);

这里，foo()和bar()都没有副作用。因此，这个表达式，不论是先计算foo(a,b)的值，还是先计算bar(b,c)的值，都不会影响计算的结果。

但是，如果是这个例子：

int foo(int* a) { (*a)++; return *a;}

int bar(int* a) { (*a)--; return *a;}

int a=5,b;

b=foo(&a)+bar(&a);

这个表达式，foo()和bar()都有副作用，所以，先计算foo(&a)还是先计算bar(&a)，将直接影响到b的值。

假如先计算foo，再计算bar。

首先，a=5

计算foo(&a)，a变成6，foo(&a)的值是6

计算bar(&a)，a变成5，bar(&a)的值是5

这样，b=6+5=11

假如先计算bar，再计算foo。

首先，a=5

计算bar(&a)，a变成4，foo(&a)的值是4

计算foo(&a)，a变成5，bar(&a)的值是5

这样，b=5+4=9

这就造成了计算结果不一致。

＝＝＝＝

那。。。怎么办

一般来说，编c/c++程序有一个纪律：一个语句中不要有两个表达式有副作用。

典型的这类行为包括：b=(a++)+(a++)+(a++);

这是典型的违反这条纪律的行为。每个a++都有副作用（改变a的值）。整个表达式的值跟求值顺序直接相连。

还有就是

char* fun() { cout<<"q"; return ""; }

cout<<"m"<<fun()<<fun()<<fun()<<endl;

每个fun()都有副作用（向屏幕上显示字符）。因此效果直接与求值顺序相关。（而整个表达式的值我们根本就不关心）。

＝＝＝＝＝＝

在c/c++中，求值顺序是怎么样的？不知道。

C/C++的规范中，求值顺序是不规定的。这是为了给编译器以优化的空间。

比如：b=(a+2)+(a+2);，那么如果只计算一次a+2的值，而不是两次，那么计算量会大大降低。

因此，不要在C语言里面做这种事情：

char* fun() { cout<<"q"; return ""; }

cout<<"m"<<fun()<<fun()<<fun()<<endl;

要这样：

char* fun() { return "q"; }

cout<<"m"<<fun()<<fun()<<fun()<<endl; // 输出的一定是 "mqqq/n"

这样更好：

string fun() { return string("q"); }

cout<<"m"<<fun()<<fun()<<fun()<<endl; // 输出的一定是 "mqqq/n"

这样就更好了：

string f="q"; // 隐式转换

cout<<"m"<<fun()<<fun()<<fun()<<endl; // 输出的一定是 "mqqq/n"

由上面的一系列分析可知，当一个语句含有多个具备副作用的表达式时，程序执行的效果有时会依赖于各个表达式的执行顺序，而这种顺序有时候又是和编译器有一定的关系，尤其是优化后可能带来问题，因此良好的编程规范应该避免在同一个语句中对某个元素多次操作。

在实际的项目开发过程中，由于不同处理器平台编译器的差异，就出现过一样的代码在PPC侧的异常，如：

i = i++%10；

目的其实很简单，就是i递增，周期为10

期望的执行过程是

i = i%10；

i++；此时的i是上一步求余后的i，对其加1

可以从汇编代码证实：

1039: int i = 10;

004012D3 mov dword ptr [ebp-4],0Ah

1040: i = i++%10;

004012DA mov eax,dword ptr [ebp-4]

004012DD cdq

004012DE mov ecx,0Ah

004012E3 idiv eax,ecx

004012E5 mov dword ptr [ebp-4],edx

004012E8 mov edx,dword ptr [ebp-4]
；重取i的值

004012EB add edx,1

004012EE mov dword ptr [ebp-4],edx

但是在PPC上，由于编译优化的影响，实际执行如下：

Register A = i; 将i的值先放到寄存器中

i = A %10；求余后回写道i中

A++；此处是对保存在寄存器中最初的i值进行自加运算，覆盖了上一步的求余运算

因此总体的执行效果就是i++，而并没有进行任何求余运算，问题就在于i = i++%10；语句中对同一个变量i有多次操作，不同编译器优化解释执行的顺序就可能不一样。如果我们明确将其分拆成

i = i%10；

i++；

那么无论是PC还是PPC平台，结果都是一样的

最终一个结论就是，不要在同一个语句中对一个资源多次操作，如果有多个表达式，则最终的执行结果应该不依赖于表达式的求值顺序。良好的编码规范可以有效的避免这些潜在的问题。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航