utf-8中的汉字占用多少字节
2014-10-08 10:59
274 查看
占2个字节的:0
占3个字节的:基本等同于GBK,含21000多个汉字
占4个字节的:中日韩超大字符集里面的汉字,有5万多个
一个utf-8数字和英文字母都占1个字节
在查找 UTF-8 编码资料时发现,很多的帖子说的 UTF-8 编码里,一个汉字占用3个字节,有的还做了个证明,大概是这样的,创建一个没有BOM的UTF-8编码的文本文件,里面保存了几个汉字,然后查看文件的大小。我觉得这样的证明没有一点说服力,因为 UTF-8 是变长的,1-6个字节,少量的汉字检测是不能说明所有的汉字都是的。
后来又查看了字符映射表-汉语,找到了正确的答案,少数是汉字每个占用3个字节,多数占用4个字节。
占3个字节的:基本等同于GBK,含21000多个汉字
占4个字节的:中日韩超大字符集里面的汉字,有5万多个
一个utf-8数字和英文字母都占1个字节
在查找 UTF-8 编码资料时发现,很多的帖子说的 UTF-8 编码里,一个汉字占用3个字节,有的还做了个证明,大概是这样的,创建一个没有BOM的UTF-8编码的文本文件,里面保存了几个汉字,然后查看文件的大小。我觉得这样的证明没有一点说服力,因为 UTF-8 是变长的,1-6个字节,少量的汉字检测是不能说明所有的汉字都是的。
后来又查看了字符映射表-汉语,找到了正确的答案,少数是汉字每个占用3个字节,多数占用4个字节。
相关文章推荐
- utf-8中的汉字占用多少字节
- utf-8中的汉字占用多少字节
- UTF-8 编码里,一个汉字占用多少个字节 -转
- utf-8中的汉字占用多少字节
- utf-8中的汉字占用多少字节
- utf-8中的汉字占用多少字节
- utf-8中的汉字占多少个字节
- 测试utf-8 汉字和字符等一般占多少个字节
- 请问utf-8的中文是一个汉字占三个字节长度吗?
- 汉字UTF8编码占用几个字节
- Oracle中文汉字占用字节
- C++中一个class类对象占用多少内字节
- JDBC读取Oracle的US7ASCII编码中文乱码及不同编码下汉字占用字节的问题
- Oracle一个中文汉字占用几个字节
- Oracle 汉字占用几个字节问题
- utf-8的中文:一个汉字占三个字节长度
- 1MB有多少字节,1mb有多少个汉字,流量就这样被把握住
- 在UTF-8中,一个汉字为什么需要三个字节?
- JAVA 汉字在UTF-8和GBK编码中占用位数
- 汉字在UTF-8中的需要几个字节表示