关于文字编码方面的知识点的一些整理
2016-07-12 13:58
295 查看
先来说说最近学习时候接触的一些编码方式:
1.首先当然是最经典的ascii码
2.big5 繁体中文
3.gb2312 简体中文
4.gbk 中文编码扩展 包含简体中文和繁体中文
4.utf-8 世界通用的编码
首先遇到的问题是曾经在写HTML+CSS的时候head便签里总会有这么一句:
<meta charset="utf-8">
有一天去掉了之后发现在网页上出现乱码 后来查阅资料才发现 写网页的时候用的编码方式是gb2312 而网页读取时是用的utf-8
出现乱码的原因是 这两种不同的编码方式 对应的每一个字符对应的字节数都不同 所以读取时按照各自的读取字节数读取 自然造成乱码
然后上网查阅资料 发现在本机上操作时都采用Unicode编码 相关资料如下:
点击打开链接
而Unicode与utf-8有所区别 知乎上有一篇文解释的个人认为很清楚 这里给出链接
而在计算机中 本机在用文字编辑器 如记事本中 使用的Unicode编码
而当这些内容需要上传到网络或者写入到磁盘中去时 计算机将以utf-8的编码方式将之写入
这里写入一点个人想法 欢迎大神指教
个人的想法是 应该是以标准化方式写入 而为了可移植性和文件传阅 所以上文提到的情况下将之装换为utf-8
总之之前一直迷惑的问题 在这里终于算透彻理解了字符编码的一些规则和方式 在这里做一下简略的笔记
1.首先当然是最经典的ascii码
2.big5 繁体中文
3.gb2312 简体中文
4.gbk 中文编码扩展 包含简体中文和繁体中文
4.utf-8 世界通用的编码
首先遇到的问题是曾经在写HTML+CSS的时候head便签里总会有这么一句:
<meta charset="utf-8">
有一天去掉了之后发现在网页上出现乱码 后来查阅资料才发现 写网页的时候用的编码方式是gb2312 而网页读取时是用的utf-8
出现乱码的原因是 这两种不同的编码方式 对应的每一个字符对应的字节数都不同 所以读取时按照各自的读取字节数读取 自然造成乱码
然后上网查阅资料 发现在本机上操作时都采用Unicode编码 相关资料如下:
点击打开链接
而Unicode与utf-8有所区别 知乎上有一篇文解释的个人认为很清楚 这里给出链接
而在计算机中 本机在用文字编辑器 如记事本中 使用的Unicode编码
而当这些内容需要上传到网络或者写入到磁盘中去时 计算机将以utf-8的编码方式将之写入
这里写入一点个人想法 欢迎大神指教
个人的想法是 应该是以标准化方式写入 而为了可移植性和文件传阅 所以上文提到的情况下将之装换为utf-8
总之之前一直迷惑的问题 在这里终于算透彻理解了字符编码的一些规则和方式 在这里做一下简略的笔记
相关文章推荐
- ASP编码必备的8条原则
- XML指南——XML编码
- C#中字符串编码处理
- ExtJS中文乱码之GBK格式编码解决方案及代码
- 程序员趣味读物 谈谈Unicode编码
- 文本文件编码方式区别
- C语言安全编码之数值中的sizeof操作符
- C#实现获取文本文件的编码的一个类(区分GB2312和UTF8)
- VC中BASE64编码和解码使用详解
- 计算机中的字符串编码、乱码、BOM等问题详解
- Base64编码解码原理及C#编程实例
- C#编码好习惯小结
- javascript编码的几个方法详细介绍
- UTF8编码开发中页面空白问题的解决方法
- php生成固定长度纯数字编码的方法
- 重新restore了mysql到另一台机器上后mysql 编码问题报错
- c# Base64编码和图片的互相转换代码
- java自动根据文件内容的编码来读取避免乱码
- PHP写入WRITE编码为UTF8的文件的实现代码
- 设置php页面编码的两种方法示例介绍