您的位置：首页 > 编程语言 > C语言/C++

C语言中的中文处理的问题。

2015-11-03 22:54 134 查看

首先Windows下的默认编码是 ANSI，其中中文就是GBK编码。

Linux下中文编码是UTF-8。

换行符的区别。 Windows下是\r\n，Linux下是\n。

其中我在Windows下建立的文本文件，在Linux下加一个换行后，用getchar( )查看，还是增加了一个\r\n。

由此猜测换行符是什么取决于在哪个系统下建立。但似乎也不太对。。

则比如从UTF-8编码的文本读取汉字，直接输出在Linux下，不会乱码，因为都是UTF-8.

同理，从编码GBK的文件读取，在Windows下也不会乱码。

所以推荐在Windows下保存为GBK，Linux下为没有BOM的UTF-8。

如果汉字直接写在代码里，则汉字的编码就取决于环境，其中vs下为GBK编码，MinGW下为UTF-8编码。

以后了解深入后再补充。

Linux 命令

dos2UNIX  file // 把file文件从dos改成UNIX型。 dos为WIN下文件，换行与Linux不同。
UNIX2dos  file  // 相反。

iconv -f 原本编码  -t 目标编码  filename  -o newfile  //把filename文件从f变成t编码，新文件保存为newfile
eg： iconv  -f big5 -t utf8  xx.big5  -o xx.utf8  //

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航