Java常见编码方式简介
2016-03-31 20:53
295 查看
计算机只能识别二进制数据,早期由来是电信号。
为了方便应用计算机,让它可以识别各个国家的文字。
就将各个国家的文字用数字来表示,并一一对应,形成一张表。
ASCII:美国标准信息交换码。
用一个字节的7位可以表示。
ISO8859-1:拉丁码表。欧洲码表
用一个字节的8位表示。
GB2312:中国的中文编码表。
GBK:中国的中文编码表升级,融合了更多的中文文字符号。
GB18030:GBK的取代版本
BIG-5码 :通行于台湾、香港地区的一个繁体字编码方案,俗称“大五码”。
Unicode:国际标准码,融合了多种文字。
所有文字都用两个字节来表示,Java语言使用的就是unicode
UTF-8:最多用三个字节来表示一个字符。
能用一个就用一个(与ASCII码表兼容)
一个表示不了的就用两个
实在不行了采用三个
UTF-8不同,它定义了一种“区间规则”,这种规则可以和ASCII编码保持最大程度的兼容:
它将Unicode编码为00000000-0000007F的字符,用单个字节来表示
它将Unicode编码为00000080-000007FF的字符用两个字节表示
它将Unicode编码为00000800-0000FFFF的字符用3字节表示
为了方便应用计算机,让它可以识别各个国家的文字。
就将各个国家的文字用数字来表示,并一一对应,形成一张表。
ASCII:美国标准信息交换码。
用一个字节的7位可以表示。
ISO8859-1:拉丁码表。欧洲码表
用一个字节的8位表示。
GB2312:中国的中文编码表。
GBK:中国的中文编码表升级,融合了更多的中文文字符号。
GB18030:GBK的取代版本
BIG-5码 :通行于台湾、香港地区的一个繁体字编码方案,俗称“大五码”。
Unicode:国际标准码,融合了多种文字。
所有文字都用两个字节来表示,Java语言使用的就是unicode
UTF-8:最多用三个字节来表示一个字符。
能用一个就用一个(与ASCII码表兼容)
一个表示不了的就用两个
实在不行了采用三个
UTF-8不同,它定义了一种“区间规则”,这种规则可以和ASCII编码保持最大程度的兼容:
它将Unicode编码为00000000-0000007F的字符,用单个字节来表示
它将Unicode编码为00000080-000007FF的字符用两个字节表示
它将Unicode编码为00000800-0000FFFF的字符用3字节表示
相关文章推荐
- 【持久化框架】SpringMVC+Spring4+Mybatis3集成,开发简单Web项目+源码下载
- 深入理解JVM(六)-Java垃圾回收机制GC
- Struts2 Hello World 实例
- Java 中 == 与 equals() 方法的区别
- Spring MVC整合Mybatis实例
- Spring中的设计模式
- java集合HashSet,TreeSet知识点集合
- Spring IOC和DI
- java复习1 java简单介绍
- 生产者/消费者模式 (java)
- java.lang.ClassNotFoundException: org.springframework.web.context.request.RequestContextListener
- SpringMvc与Struts2的对比_2
- java集合,ArrayList,LinkedList知识点总结
- 浅析java反射机制
- Spring配置Hibernate事务的三种方式
- eclipse 中文注释的乱码问题解决方案
- java学习笔记-面向对象(三)
- Java中的文件读写字节流,字符流
- 20145239 《Java程序设计》第5周学习总结
- 【LeetCode从零单排(Java)】No1.Two Sum