您的位置:首页 > 其它

Visual Studio 2010中文版和GCC对C程序注释里中文的支持小结

2017-03-20 17:33 417 查看
        写了一个只使用标准库函数的C程序,在其中用中文写了一些注释。在 Windows 7 中文版操作系统中,使用 Visual Studio 2010 中文版进行编译。为了测试 Visual Studio 2010 中文版对代码注释里中文的支持情况,使用 EditPlus,将 C 程序源文件转换成不同的编码方式,如下图:



        试验一下采用不同编码方式的 C 源文件在 VS 2010 中文版中显示和编译是否正常,结果如下:

C源程序文件使用的编码在VS 2010中源文件的显示情况编译运行情况
ANSI中文注释能正常显示,无乱码能编译,运行正常
Unicode中文注释能正常显示,无乱码能编译,运行正常
Unicode Big Endian中文注释能正常显示,无乱码能编译,运行正常
UTF-8中文注释能正常显示,无乱码编译报错,不能正确识别源代码
UTF-8 with BOM中文注释能正常显示,无乱码能编译,运行正常
        由上表可以看出,除去采用不带 BOM 的 UTF-8 编码,VS 2010 中文版对于采用其他编码方式的源程序都能正确识别和编译。

---------------------------------------------------------------

        再到 Linux 平台上看一下:

        在 64 位 CentOS 6.8 上,将上面用到的采用不同编码方式 C 源文件使用 4.4.7 版本的 GCC 编译,结果如下:

C源程序文件使用的编码
使用GCC编译运行情况
ANSI能编译,运行正常
UTF-8能编译,运行正常
UTF-8 with BOM能编译,运行正常
        Linux对 Unicode 的支持不好,因此没有必要对采用 Unicode、Unicode Big Endian这两种编码方式的源文件做测试。

        由此可见:如果中文字符只是出现在 C 程序的注释中,并且该程序需要在 Windows、Linux 两种平台上编译,源文件在采用 ANSI、带 BOM 的 UTF-8 这两种编码方式中的任意一种的情况下,都能够编译和运行。但是如果源文件使用 ANSI 编码保存,在 VS 2010 中编译时,会出现如下的警告:

warning C4819: 该文件包含不能在当前代码页(936)中表示的字符。请将该文件保存为 Unicode 格式以防止数据丢失

        因此最好将源文件以带 BOM 的 UTF-8 编码方式保存。


内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  utf-8