您的位置：首页 > 其它

关于文字编码方面的知识点的一些整理

2016-07-12 13:58 295 查看

先来说说最近学习时候接触的一些编码方式：

1.首先当然是最经典的ascii码

2.big5 繁体中文

3.gb2312 简体中文

4.gbk 中文编码扩展包含简体中文和繁体中文

4.utf-8 世界通用的编码

首先遇到的问题是曾经在写HTML+CSS的时候head便签里总会有这么一句:

<meta charset="utf-8">

有一天去掉了之后发现在网页上出现乱码后来查阅资料才发现写网页的时候用的编码方式是gb2312 而网页读取时是用的utf-8

出现乱码的原因是这两种不同的编码方式对应的每一个字符对应的字节数都不同所以读取时按照各自的读取字节数读取自然造成乱码

然后上网查阅资料发现在本机上操作时都采用Unicode编码相关资料如下：

点击打开链接

而Unicode与utf-8有所区别知乎上有一篇文解释的个人认为很清楚这里给出链接

而在计算机中本机在用文字编辑器如记事本中使用的Unicode编码

而当这些内容需要上传到网络或者写入到磁盘中去时计算机将以utf-8的编码方式将之写入

这里写入一点个人想法欢迎大神指教

个人的想法是应该是以标准化方式写入而为了可移植性和文件传阅所以上文提到的情况下将之装换为utf-8

总之之前一直迷惑的问题在这里终于算透彻理解了字符编码的一些规则和方式在这里做一下简略的笔记

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： 编码

相关文章推荐

新的分享

章节导航