idea 中 GBK 和 UTF-8 编码问题
2018-01-26 00:00
537 查看
背景:在idea中,有的时候会出现乱码问题;这个时候可以通过idea右下角提供的转换编码功能来解决。
如果一个文件使用的是GBK编码,在idea中通过UTF-8的方式加载的文件,就会出现乱码。这个时候可采用:先通过reload方式进行将编码格式变为GBK,这个时候看到的文件就不再是乱码;如果希望文件采用UTF-8编码,则再通过convert方式将文件转为UTF-8.(这个时候文件的字节流已经发生了变化)
idea转换编码时的概念说明
如上图所示: 1. reload的含义: 按照指定的编码(如GBK、UTF-8)来加载文件,这个时候文件的二进制文件没有发生任何变化,只是读取方式发生了变化;如将2个字节解析为一个字符变成将3个字节解析为一个字符。 2. convert的含义: 将A编码文件转换为B编码文件,这个时候文件的二进制内容是发生了变化。
如果一个文件使用的是GBK编码,在idea中通过UTF-8的方式加载的文件,就会出现乱码。这个时候可采用:先通过reload方式进行将编码格式变为GBK,这个时候看到的文件就不再是乱码;如果希望文件采用UTF-8编码,则再通过convert方式将文件转为UTF-8.(这个时候文件的字节流已经发生了变化)
UTF-8 和 GBK区别:
1. GBK的文字编码是双字节来表示的,即不论中、英文字符均使用双字节来表示,只不过为区分中文,将其最高位都定成1。 2. UTF-8编码则是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24位(三个字节)来编码。对于英文字符较多的论坛则用UTF-8节省空间。 所以对于同一个中文文件,如果使用GBK,它所占用的空间比UTF-8要小一些。 大小关系为:1.5 * GBK = UTF-8。
相关文章推荐
- Python中GBK, UTF-8和Unicode的编码问题
- Python 处理GBK编码转UTF-8读写乱码问题
- PHP中转换编码问题 GBK/UTF-8等
- java使用gbk编码读取utf-8的js文件吃掉回车问题
- python 处理中文文件时的编码问题,尤其是utf-8和gbk
- 编码问题,utf-8、gbk、ascii码,懂了下面的例子,一切就懂了
- java和jsp中文编码问题的解决方法(ISO8859_1、GBK、UTF-8)(精品)
- java中编码Unicode及utf-8,gbk问题
- java GBK UTF-8编码与自动识别与统一(乱码问题)
- 中文乱码问题 ? 原因:JSP中默认使用iso-8859-1字符编码方式,不支持中文 ? 常见的支持中文的编码方式:gb2312(常用简体汉字)、gbk(简体和繁体汉字)、utf-8 ? 解决中文乱码
- Python中GBK, UTF-8和Unicode的编码问题
- python中文的编码问题(使用decode('gbk').encode('utf-8')和decode('utf-8').encode('gbk'))
- 中文编码问题(Unicode UTF-8 GBK ...)
- Java 读文件写入数据库 编码问题 utf-8、 GBK
- 字符串编码问题(Ascii、Unicode、UCS-2、GBK、UTF-8)
- UTF-8编码的页面向GBK页面提交表单乱码问题的解决办法
- 中文编码问题(Unicode UTF-8 GBK ...) .
- GB2312、GBK和UTF-8三种编码以及QT中文显示乱码问题
- coco2d-x中编码问题。GBK转UTF-8
- ascii gbk utf-8 编码问题