文本编码&二进制运算
2017-12-01 16:20
127 查看
1. char 类型是Unicode编码的16位整数
-Unicode V8 10万+
-java char 类型是 Unicode3.2,65535个字符
2. 互联网或者文件都是按照byte(8位数)进行数据传输的!
3. 字符数据在互联网(文件)传输时必须拆分为byte(8位)进行传输。
-将字符数据拆分为byte数据的过程称为: 编码
-将byte数据重新合并为字符数据分过程称为: 解码
4. 常见编码
- UTF16-BE: 将字符char从中间拆分两段,两个byte,只能支持65535个字符,英文浪费空间
-
GBK 中国标准,1~2字节变长编码,支持字符2万+
- UTF-8 :采用变长编码(1~4字节),支持100万+字符,按照字符数值的大小进行编码,英文采用1字节编码。
## UTF-8 是如何编码的
0~127 1字节编码 等同于 ASC II
128~2047 2字节编码
2048~65535 3字节编码
中文是如何实现3个字节编码的呢?如下图:
编码:str.getBytes("UTF-8")
解码:new String(bytes,编码格式)
进制间的问题:
-Unicode V8 10万+
-java char 类型是 Unicode3.2,65535个字符
2. 互联网或者文件都是按照byte(8位数)进行数据传输的!
3. 字符数据在互联网(文件)传输时必须拆分为byte(8位)进行传输。
-将字符数据拆分为byte数据的过程称为: 编码
-将byte数据重新合并为字符数据分过程称为: 解码
4. 常见编码
- UTF16-BE: 将字符char从中间拆分两段,两个byte,只能支持65535个字符,英文浪费空间
-
GBK 中国标准,1~2字节变长编码,支持字符2万+
- UTF-8 :采用变长编码(1~4字节),支持100万+字符,按照字符数值的大小进行编码,英文采用1字节编码。
## UTF-8 是如何编码的
0~127 1字节编码 等同于 ASC II
128~2047 2字节编码
2048~65535 3字节编码
中文是如何实现3个字节编码的呢?如下图:
编码:str.getBytes("UTF-8")
解码:new String(bytes,编码格式)
进制间的问题:
相关文章推荐
- java 二进制(原码 反码 补码),位运算,移位运算,约瑟夫问题
- CF 244 C. The Brand New Function 思维(二进制,区间或运算不同结果)
- 二进制加乘法运算
- 位运算实例(二):十进制转为二进制
- C语言 二进制左右移运算小程序
- 二进制、八进制、十六进制的概念以及加减运算
- JAVA二进制.位运算.移位运算
- 二进制的逻辑运算
- 位运算总结1. 二进制的逆置
- 二进制乘法和除法与移位运算的关系
- 二进制运算
- 位运算之求整数二进制表示中1的个数
- 位运算的妙用_判断2的乘方和二进制1的个数
- poj 1060 Modular multiplication of polynomials 二进制多项式取余式运算。
- 二进制的原码、反码、补码和程序超出整型限制时的运算
- JavaScript使用IEEE 标准进行二进制浮点运算产生莫名错误的解决方法
- 位运算训练04—输入一个整数a,再输入两个整数p(p<32),v(0|1);将该整数a的p位设置为v,输出修改后的该整数的二进制表示
- C语言位运算运用二:输出二进制序列中所有的偶数位和奇数位
- 二进制运算误差问题
- 二进制128位整数运算