字符编码地址空间
2015-06-11 12:44
176 查看
一个字节8位。一个int占4个字节。
一个char存一个字节,UTF-8用char数组来存,每个char可能存“半个字”或者“三分之一个字”等等。
Unicode表示方式由很多种。每个字按8位(一个字节)为一个“整体”来拆分,叫做UTF-8编码。每个字按16位(两个字节)为一个“整体”来拆分,叫做UTF-16编码。每个字按32位(四个字节)为一个“整体”来拆分,叫做UTF-32编码。
只有UTF-32是定长的,其他都是不固定长度的。
一个UTF-8占1至4个“整体”,所以是1至4个字节。
一个UTF-16字符占1至2个“整体”,所以是占用2个或4个字节。
一个UTF-32只占一个“整体”,所以都是四个字节。
Windows上的wchar_t类型占两个字节,所以用wchar_t数组来存UTF-16编码的文字,其中每个wchar_t储存一个字或半个字。
Linux上的wchar_t类型占4个字节,所以用wchar_t数组来存UTF-32编码的文字,其中每个wchar_t储存一个字。
一个char存一个字节,UTF-8用char数组来存,每个char可能存“半个字”或者“三分之一个字”等等。
Unicode表示方式由很多种。每个字按8位(一个字节)为一个“整体”来拆分,叫做UTF-8编码。每个字按16位(两个字节)为一个“整体”来拆分,叫做UTF-16编码。每个字按32位(四个字节)为一个“整体”来拆分,叫做UTF-32编码。
只有UTF-32是定长的,其他都是不固定长度的。
一个UTF-8占1至4个“整体”,所以是1至4个字节。
一个UTF-16字符占1至2个“整体”,所以是占用2个或4个字节。
一个UTF-32只占一个“整体”,所以都是四个字节。
Windows上的wchar_t类型占两个字节,所以用wchar_t数组来存UTF-16编码的文字,其中每个wchar_t储存一个字或半个字。
Linux上的wchar_t类型占4个字节,所以用wchar_t数组来存UTF-32编码的文字,其中每个wchar_t储存一个字。
相关文章推荐
- xcode6制作framework(使用第三方依赖框架)
- 深入理解Java:类加载机制及反射
- Apache Shiro(二)Shiro 认证
- 一般框架中有一个空的index .html,是干什么用的?
- 百度移动搜索测试电面
- Algorithm --> Kruskal算法和Prim算法
- GRE考试背单词的几个禁忌
- Android实现两次按下返回键退出
- SM37 后台调试
- POJ 1509 循环同构的最小表示法
- Shiro(一) Shiro架构介绍
- Oracle插入或修改 报ORA-01704: 文字字符串太长
- 你走了 --2004-08-27 博客搬家
- http-only的作用
- SAT数学:常用公式之几何
- 找出排序数组中和为给定值的两个数字
- 系统吞吐量(TPS)、用户并发量、性能测试概念和公式
- GMAT语法复习需要掌握的基础能力有哪些
- linux 段错误调试方法
- 来往网页版扫码自动登录的实现原理