您的位置:首页 > 其它

文本编码&二进制运算

2017-12-01 16:20 127 查看
1.  char 类型是Unicode编码的16位整数

-Unicode V8 10万+

-java char 类型是 Unicode3.2,65535个字符

2.   互联网或者文件都是按照byte(8位数)进行数据传输的!

3.  字符数据在互联网(文件)传输时必须拆分为byte(8位)进行传输。

-将字符数据拆分为byte数据的过程称为: 编码

-将byte数据重新合并为字符数据分过程称为: 解码

4.  常见编码

      - UTF16-BE: 将字符char从中间拆分两段,两个byte,只能支持65535个字符,英文浪费空间

   -
 GBK  中国标准,1~2字节变长编码,支持字符2万+

            -  UTF-8  :采用变长编码(1~4字节),支持100万+字符,按照字符数值的大小进行编码,英文采用1字节编码。

## UTF-8  是如何编码的

0~127   1字节编码 等同于 ASC II

128~2047  2字节编码

2048~65535  3字节编码


中文是如何实现3个字节编码的呢?如下图:

编码:str.getBytes("UTF-8")

解码:new String(bytes,编码格式)



进制间的问题:




内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  编码 进制