您的位置:首页 > 编程语言

从校园到工作的路(八)——关于编程中的编码问题

2015-11-13 00:02 260 查看
编码,我们下意识便会想到UTF-8,GKB这些。
关于在SecureCRT中的编码,还有Eclipse中的编码
ASCII编码只支持基础拉丁字符。其设计:用一个字节(8个位)来表示一个字符,并保证最高位的取值永远为’0’.
ISO 8859-1对应西欧语言,Latin-1是ISO 8859-1的别名。它表示整个西欧的字符集范围。
BOM:Byte Order Mark
![关于中文编码的介绍](http://img.blog.csdn.net/20151113000125059)
UTF-8 BOM又叫UTF-8的签名,对UTF-8没有作用,是为了支持UTF-16,UTF-32.BOM签名是为了告诉编辑器当前文件采用何种编码,方便编辑器识别。虽然BOM在编辑器中不显示,但会产生输出,就像多了一个空行。
全世界统一一种编码。为了能够独立表现世界上的所有字符,Unicode采用四个字节表示一个字符。
为什么会有UTF-8的产生,两个原因:
1、Unicode表示汉字或者拉丁字符,其前面两个或三个字节都是0,这是浪费的。
2、计算机不知道四个字节表示的是Unicode字符还是4个ASCII字符
无论是UTF-8,还是Unicode,其与GBK都是不兼容的,两者之间不能通过任何算法加以转换。如需转换,一般通过GBK查表方式进行。


常见问题及解答:

Windows中的NotePad的编码ANSI保存选项代表什么?

ANSI是windows默认的编码方式。对于英文文件是ASCII编码,对于中文是GB2312编码。所以将一个UTF-8的文件存为ANSI格式,中文部分就会产生乱码。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: