您的位置:首页 > 编程语言 > C语言/C++

c++字符集之间转换(UTF-8,UNICODE,Gb2312)

2013-07-15 17:29 351 查看
UTF-8: 3字节一个字符

UNICODE: 2字节一个字符

GB2312: 1字节一个字符

例子:
“你”字的UTF-8编码: E4 BD A0        11100100 10111101 10100000
“你”的Unicode编码: 4F 60          01001111 01100000

按照UTF-8的编码规则,分解如下:xxxx0100 xx111101 xx100000,把除了x之外的数字拼接在一起,就变成“你”的Unicode编码了。
注意UTF-8的最前面3个1,表示整个UTF-8串是由3个字节构成的。
经过UTF-8编码之后,再也不会出现敏感字符了,因为最高位始终为1。

类定义

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: