您的位置:首页 > 其它

【转】bit、byte、位、字节、汉字的关系

2013-07-30 09:02 274 查看
UTF-8和UTF-16的区别?Unicode和UTF是什么关系?Unicode转义字符(\u+4个十六进制)。遇到多个引号的时候转义?
解释:

unicode是一种编码方式,和ascii是同一个概念,而UTF是一种存储方式(格式)。


数据存储是以“字节”(Byte)为单位,数据传输是以“位”(bit)为单位,一个位就代表一个0或1(即二进制),每8个位(bit)组成一个字节(Byte)。1KB=1024B,1KB=1024Byte=1024*8bit
===========================
下面这段解释引用自他人的博客:
bit、byte、位、字节、汉字的关系

1 bit = 1 二进制数据
1 byte = 8 bit
1 字母 = 1 byte = 8 bit
1 汉字 = 2 byte = 16 bit

1. bit:位
一个二进制数据0或1,是1bit;

2. byte:字节
存储空间的基本计量单位,如:MySQL中定义 VARCHAR(45) 即是指 45个字节;
1 byte = 8 bit

3. 一个英文字符占一个字节;
1 字母 = 1 byte = 8 bit

4. 一个汉字占2个字节;
1 汉字 = 2 byte = 16 bit

5. 标点符号
A>. 汉字输入状态下,默认为全角输入方式;
B>. 英文输入状态下,默认为半角输入方式;

C>. 全角输入方式下,标点符号占2字节;
D>. 半角输入方式下,标点符号占1字节;

故:汉字输入状态下的字符,占2个字节 (但不排除,自己更改了默认设置);
英文输入状态下的字符,占1个字节 (但不排除,自己更改了默认设置);

引用结束

==================
以下这段文字引用字百度知道

英文一个字母是一字节。中国字比较复杂,1字节=8位,8位从0000 0000到1111 1111只能表示256个字符,2个字节是2*8=16位,从0000 0000 0000 0000到1111 1111 1111 1111可以表示65535个字符。
6万多个足以表示我们经常用的那些字了。所以我们用2字节表示汉字。
如果用3个字节有很多不常用的字又占了很多不必要的存储空间,所以我们用2个字节而不是1个或者3个表示汉字的国际码。



引用结束
==================

为什么1KB=1024B?
一开始我也感觉有点怪,KB和B之间不是应该是1000么?其实计算机就是这么规定的,就像  1 byte  = 8  bit  没有什么理由,规定了你拿来用就好了。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: