您的位置:首页 > 编程语言 > C语言/C++

编写高质量代码:改善C++程序的150个建议(十)

2013-07-27 19:11 274 查看
第2章 从C到C++,需要做出一些改变

  C++语言之父当初设计该语言的初衷是“a better C”,所以C++一般被认为是C的超集合,但是不要因此而误以为,“这意味着C++兼容C语言的所有东西”。作为一种欲与C兼容的语言,C++保留了一部分过程式语言的特点,大部分的C代码可以很轻易地在C++中正确编译,但仍有少数差异,导致某些有效的C代码在C++中无法通过编译。

  因此,从C到C++,我们要因为这些差异而做出一些改变,我们应当熟悉这些差异,使用原有的丰富的C库为现在的C++工程更好地服务。

  建议19:明白在C++中如何使用C

  首先,分析下面的代码片段

// Demo.h  
#ifndef SRC_DEMO_H  
#define SRC_DEMO_H  
extern "C"  
{  
...  // do something  
}  
#endif  // SRC_DEMO_H
  显然,头文件中的编译宏“#ifndef SRC_DEMO_H、#define SRC_DEMO_H、#endif”的作用是防止该头文件被重复引用(详见建议9)。那么,extern “C”又有什么特殊的作用呢?暂且先留着这个疑问。

  C++语言被称做“C with classes”、“a better C”或“C的超集合”,但是并非兼容C语言的所有东西,两者之间的“大同”并不能完全抹杀其中的“小异”。最常见的差异就是,C允许从void类型指针隐式转换成其他类型的指针,但C++为了安全考虑明令禁止了此种行为。比如:如下代码在C语言中是有效的:

// 从void* 隐式转换为double*  
double *pDouble = malloc(nCount * sizeof(double));
  但要使其在C++中正确运行,就需要显式地转换:

double *pDouble = (double *)malloc(nCount * sizeof(double));
  除此之外,还有一些其他的可移植问题,比如new和class在 C++中是关键字,而在C中,却可以作为变量名。

  若想在C++中使用大量现成的C程序库,就必须把它放到extern "C" { /* code */ }中。到这里,也许大家会茅塞顿开,明白本建议开始列出的代码片段中那些宏的真实作用了。当然,具有强烈好奇心的读者也许会有了新的问题:为什么加上extern "C" { /* code */ }就好使了呢?这是一个问题。下面就分析一下隐藏在这个现象背后的真实原因:C与C++具有不同的编译和链接方式。C编译器编译函数时不带函数的类型信息,只包含函数符号名字;而C++编译器为了实现函数重载,在编译时会带上函数的类型信息。假设某个函数的原型为:

int Function(int a, float b);
  C编译器把该函数编译成类似_ Function的符号(这种符号一般被称为mangled name),C链接器只要找到了这个符号,就可以连接成功,实现调用。C编译链接器不会对它的参数类型信息加以验证,只是假设这些信息是正确的,这正是C编译链接器的缺点所在。而在强调安全的C++中,编译器会检查参数类型信息,上述函数原型会被编译成_ Function_int_float这样的符号(也正是这种机制为函数重载的实现提供了必要的支持)。在连接过程中,链接器会在由函数原型所在模块生成的目标文件中寻找_ Function_int_float这样的符号。

  解决上述矛盾就成了设置extern "C"这一语法最直接的原因与动力。extern "C"的作用就是告诉C++链接器寻找调用函数的符号时,采用C的方式,让编译器寻找_ Function而不是_ Function_int_float。

  要实现在C++中调用C的代码,具体方式有以下几种:

  (1)修改C代码的头文件,当其中含有C++代码时,在声明中加入extern "C"。代码如下所示:

/*C语言头文件:CDemo.h */  
#ifndef C_SRC_DEMO_H  
#define C_SRC_DEMO_H  
extern "C" int Function(int x,int y);  
#endif  // C_SRC_DEMO_H  

/* C语言实现文件:CDemo.c */  
#include " CDemo.h"  
int Function ( int x, int y )  
{  
  ... // processing code  
}  

// C++调用文件  
#include " CDemo.h"  
int main()  
{  
     Function (2,3);  
     return 0;  
}
(2)在C++代码中重新声明一下C函数,在重新声明时添加上extern "C"。代码如下所示:

/*C语言头文件:CDemo.h */  
#ifndef C_SRC_DEMO_H  
#define C_SRC_DEMO_H  
extern int Function(int x,int y);  
#endif  // C_SRC_DEMO_H  
 
/* C语言实现文件:CDemo.c */  
#include "CDemo.h"  
int Function ( int x, int y )  
{  
  ... // processing code  
}  
 
// C++调用文件  
#include "CDemo.h"  
extern "C" int Function(int x,int y);  
 
int main()  
{  
     Function (2,3);  
     return 0;  
}
  (3)在包含C头文件时,添上extern "C"。代码如下所示:

/*C语言头文件:CDemo.h */  
#ifndef C_SRC_DEMO_H  
#define C_SRC_DEMO_H  
extern int Function(int x,int y);  
#endif  // C_SRC_DEMO_H  
 
/* C语言实现文件:CDemo.c */  
#include "CDemo.h"  
int Function ( int x, int y )  
{  
  ... // processing code  
}  
 
// C++调用文件  
extern "C" {  
#include "CDemo.h"  
}  
 
int main()  
{  
     Function (2,3);  
     return 0;  
}
  使用中,谨记:extern "C"一定要加在C++的代码文件中才能起作用。

  请记住:

  若想在C++中使用大量现成的C程序库,实现C++与C的混合编程,那你必须了解extern "C"是怎么回事儿,明白extern "C"的使用方式。

建议20:使用memcpy()系列函数时要足够小心

  memcpy()、memset()、memcmp()等这些内存操作函数经常会帮我们完成一些数据复制、赋值等操作。因为在C语言中,无论是内置类型,还是自定义的结构类型(struct),其内存模型对于我们来说都是可知的、透明的。所以,我们可以对该对象的底层字节序列一一进行操作,简单而有效。代码片段如下所示:

struct STUDENT  
{  
     char _name[32];  
     int _age;  
     bool _gender;  
};  
 
STUDENT a = {"Li Lei", 20, true};  
STUDENT b = {"Han MeiMei", 19, false};  
 
int len = sizeof(STUDENT);
 
STUDENT c;  
memset(&c, 0, len);  
memcpy(&c, &a, len);  
 
char *data = (char*)malloc(sizeof(char)*len);  
memcpy(data, &b, len);
  在C++中,我们把传统C风格的数据类型叫做POD(Plain Old Data)对象,即一种古老的纯数据。在C的世界里根本没有POD这一概念,因为C的所有对象都是POD。一般来说,POD对象应该满足如下特性:其二进制内容是可以随意复制的,无论在什么地方,只要其二进制内容存在,我们就能准确无误地还原出POD对象。正是由于这个原因,对于任何POD对象,我们都可以放心大胆地使用memset()、memcpy()、memcmp()等函数对对象的内存数据进行操作。

  然而在C++中,每个人都要十二分的注意了。因为C++的对象可能并不是一个POD,所以我们无法像在C中那样获得该对象直观简洁的内存模型。对于POD对象,我们可以通过对象的基地址和数据成员的偏移量获得数据成员的地址。但是C++标准并未对非POD对象的内存布局做任何定义,对于不同的编译器,其对象布局是不同的。而在C语言中,对象布局仅仅会受到底层硬件系统差异的影响。

  针对非POD对象,其序列化会遇到一定的障碍:由于对象的不同部分可能存在于不同的地方,因而无法直接复制,只能通过手工加入序列化操作代码来处理对象数据,很麻烦。但是针对POD对象,这一切将变得不再困难:从基地址开始,直接按对象的大小复制数据,或传输,或存储,随意处理。

  为什么C++中的对象有可能不是一个POD呢?这还要从C++的重要特征之一—动多态说起。动多态的一个基本支撑技术就是虚函数。在使用虚函数时,类的每一次继承都会产生一个虚函数表(vtable),其中存放的是指向虚函数的指针。这些虚函数表必须存放在对象体中,也就是和对象的数据存放在一起。因而,对象数据在内存里并不是以连续的方式存放的,而是被分割成了不同的部分,甚至“身首异处”。既然对象数据不再集中在一起,如果此时再贸然使用memcpy()、memset()函数,那么所带来的后果将不可预计。

  请记住:

  要区分哪些数据对象是POD,哪些是非POD。由于非POD对象的存在,在C++中使用memcpy()系列函数时要保持足够的小心。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  c++