Java Web开发中文乱码总结
2017-02-27 00:00
197 查看
摘要: 在开发过程中,经常遇到中文乱码问题,以前总是解决就好,并没有对该问题总结一下,现在来总结一下开发过程中常见的中文乱码问题。
一、有必要了解一些基本的编码知识
这篇字符编码笔记是必读的
jsp的三次编码
第一阶段:JVM将.jsp文件编译为.java文件。JVM先读取pageEncoding的值,根据该值去读取.jsp文件,然后由指定的编码方案生成UTF-8的.java文件。
第二阶段:JVM将.java文件转换为.class文件,从UTF-8至UTF-8。这个过程就与任何编码的设置都没有关系了,经过这个阶段后.java文件就转换成了统一的UTF-8编码的.class文件了。
第三阶段:服务器将处理的结果返回给浏览器,这个阶段则依靠contentType的charset,如果设置了charset则浏览器就会使用指定的编码格式进行解码,否则采用默认的ISO-8859-1编码格式进行解码处理。
jsp中的编码设置
pageEncoding:<%@ page pageEncoding=”UTF-8”%>
上文中第一阶段,使用该值去读取jsp文件,为避免中文乱码,跟jsp文件编码一致;对服务器响应进行重新编码,即jsp的输出流在浏览器中显示的编码(不是主要作用)。
contentType: <%@ page contentType=”text/html;charset=UTF-8”%>
使用该值对服务器响应进行重新编码,即jsp的输出流在浏览器中显示的编码;对表单get和post请求数据编码;上文中第一阶段,使用该值去读取jsp文件(不是主要作用)。
< META http-equiv=”Content-Type” content=”text/html;charset=UTF-8”>
网页的编码信息 ,说明页面制作所使用的编码。
request.setCharacterEncoding()
可用在servlet和jsp页面中,作用是设置对客户端请求进行重新编码的编码,即post方式提交的数据进行编码。
response.setCharacterEncoding()
与<%@ page contentType=”text/html;charset=UTF-8”%>一样。
response.setContentType()
与<%@ page contentType=”text/html;charset=UTF-8”%>一样。
response.setHeader(“Content-Type”,”text/html;charset=UTF-8”)
与< META http-equiv=”Content-Type” content=”text/html; charset=UTF-8”>一样。
注意:上文1,2,3中有部分功能是一样的,是有优先级的,在读取jsp文件时,1>2;在对服务器响应进行编码的时候,2>1>3,一般情况下,1,2都写。
http请求默认以”ISO-8859-1”的编码来传送URL的。
二、中文乱码的几种情况及最简单的解决方案:
pageEncoding设置错误
pageEncoding设置为jsp文件的编码类型。
查询字符串包含中文
中文的编码方式取决于浏览器,chrome为UTF-8,IE为GB2312,这是由于浏览器并没有遵循URI编码规范。有两种解决方法:
开发过程中,将查询字符串提前编码,
如: http://www.baidu.com/demo?demo=%D6%D0%B9%FA (UTF-8编码)
在Servlet的doGet()方法中添加
String value = new String(request.getParameter("parameterName").getBytes("ISO-8859-1"),"浏览器的编码方式");
表单中的get和post数据包含中文
中文的编码方式取决于上文的contentType中的charset,有两种解决办法:
在Servlet的doPost()方法中添加request.setCharacterEncoding(“charset的值”);(仅对post有用)
在Servlet的doPost()方法中添加
String value = new String(request.getParameter("parameterName").getBytes("ISO-8859-1"),"charset的值");
三、原理
我们通过上面的方法可以解决乱码问题,下面讲讲原理:
客户端发到服务器的数据需要在客户端进行编码,类似于:String parameterName = "中国".getBytes("UTF-8")然后将编码后的数据发到服务器。
客户端接受数据,request.getParameter(“”)的作用就是对接收到的数据进行解码,默认使用ISO-8859-1进行解码,可以使用request.setCharacterEncoding(“”)进行设置,但仅对post有用。假如我们使用默认的ISO-8859-1,肯定乱码,因为编码跟解码不一致,那此时怎么办呢,引出了上文中的两种解决方案:使用request.setCharacterEncoding(“”)改变request.getParameter(“”)的解码方式或者new String(request.getParameter("parameterName").getBytes("ISO-8859-1"),"charset的值")将request.getParameter(“”)解码的数据重新编码再解码。
四、其他
在jsp中的页面使用response.setContentType()等设置字符集会破坏jsp容器自身的页面编码,会引起html中字符乱码,脚本不会乱,所以不建议设置。在开发中多采用page指令设置字符集。
一、有必要了解一些基本的编码知识
这篇字符编码笔记是必读的
jsp的三次编码
第一阶段:JVM将.jsp文件编译为.java文件。JVM先读取pageEncoding的值,根据该值去读取.jsp文件,然后由指定的编码方案生成UTF-8的.java文件。
第二阶段:JVM将.java文件转换为.class文件,从UTF-8至UTF-8。这个过程就与任何编码的设置都没有关系了,经过这个阶段后.java文件就转换成了统一的UTF-8编码的.class文件了。
第三阶段:服务器将处理的结果返回给浏览器,这个阶段则依靠contentType的charset,如果设置了charset则浏览器就会使用指定的编码格式进行解码,否则采用默认的ISO-8859-1编码格式进行解码处理。
jsp中的编码设置
pageEncoding:<%@ page pageEncoding=”UTF-8”%>
上文中第一阶段,使用该值去读取jsp文件,为避免中文乱码,跟jsp文件编码一致;对服务器响应进行重新编码,即jsp的输出流在浏览器中显示的编码(不是主要作用)。
contentType: <%@ page contentType=”text/html;charset=UTF-8”%>
使用该值对服务器响应进行重新编码,即jsp的输出流在浏览器中显示的编码;对表单get和post请求数据编码;上文中第一阶段,使用该值去读取jsp文件(不是主要作用)。
< META http-equiv=”Content-Type” content=”text/html;charset=UTF-8”>
网页的编码信息 ,说明页面制作所使用的编码。
request.setCharacterEncoding()
可用在servlet和jsp页面中,作用是设置对客户端请求进行重新编码的编码,即post方式提交的数据进行编码。
response.setCharacterEncoding()
与<%@ page contentType=”text/html;charset=UTF-8”%>一样。
response.setContentType()
与<%@ page contentType=”text/html;charset=UTF-8”%>一样。
response.setHeader(“Content-Type”,”text/html;charset=UTF-8”)
与< META http-equiv=”Content-Type” content=”text/html; charset=UTF-8”>一样。
注意:上文1,2,3中有部分功能是一样的,是有优先级的,在读取jsp文件时,1>2;在对服务器响应进行编码的时候,2>1>3,一般情况下,1,2都写。
http请求默认以”ISO-8859-1”的编码来传送URL的。
二、中文乱码的几种情况及最简单的解决方案:
pageEncoding设置错误
pageEncoding设置为jsp文件的编码类型。
查询字符串包含中文
中文的编码方式取决于浏览器,chrome为UTF-8,IE为GB2312,这是由于浏览器并没有遵循URI编码规范。有两种解决方法:
开发过程中,将查询字符串提前编码,
如: http://www.baidu.com/demo?demo=%D6%D0%B9%FA (UTF-8编码)
在Servlet的doGet()方法中添加
String value = new String(request.getParameter("parameterName").getBytes("ISO-8859-1"),"浏览器的编码方式");
表单中的get和post数据包含中文
中文的编码方式取决于上文的contentType中的charset,有两种解决办法:
在Servlet的doPost()方法中添加request.setCharacterEncoding(“charset的值”);(仅对post有用)
在Servlet的doPost()方法中添加
String value = new String(request.getParameter("parameterName").getBytes("ISO-8859-1"),"charset的值");
三、原理
我们通过上面的方法可以解决乱码问题,下面讲讲原理:
客户端发到服务器的数据需要在客户端进行编码,类似于:String parameterName = "中国".getBytes("UTF-8")然后将编码后的数据发到服务器。
客户端接受数据,request.getParameter(“”)的作用就是对接收到的数据进行解码,默认使用ISO-8859-1进行解码,可以使用request.setCharacterEncoding(“”)进行设置,但仅对post有用。假如我们使用默认的ISO-8859-1,肯定乱码,因为编码跟解码不一致,那此时怎么办呢,引出了上文中的两种解决方案:使用request.setCharacterEncoding(“”)改变request.getParameter(“”)的解码方式或者new String(request.getParameter("parameterName").getBytes("ISO-8859-1"),"charset的值")将request.getParameter(“”)解码的数据重新编码再解码。
四、其他
在jsp中的页面使用response.setContentType()等设置字符集会破坏jsp容器自身的页面编码,会引起html中字符乱码,脚本不会乱,所以不建议设置。在开发中多采用page指令设置字符集。
<!DOCTYPE html PUBLIC> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> <title>Insert title here</title> </head> <body> <% response.setContentType("text/html;charset=UTF-8"); String str = new String("你好".getBytes("iso-8859-1"), "utf-8"); %> <p>你好</p> <br><%=str%> </body> </html>
相关文章推荐
- 【分享】Java开发过程中中文乱码问题总结
- java web 开发中文乱码的一般解决方案
- 最近在Ubuntu9.04下用tomcat发布一个用java开发的WEB项目(tomcat6+mysql)。在windows下编码完全没问题,到了linux下后,到处一大堆得乱码(主要是针对中文)。上
- Java Web开发中文乱码问题
- 浅谈java web开发中的中文乱码的解决方法
- 【分享】Java开发过程中中文乱码问题总结
- Java开发过程中中文乱码问题总结
- java开发中中文乱码总结
- javaweb开发中关于字符编码出现乱码问题的总结
- JavaWeb开发中的中文乱码问题
- java web 开发中的乱码解决方案自我总结
- java web 开发乱码总结
- Java WEB开发中的中文乱码问题解决之终极之道
- Java Web项目中解决中文乱码方法总结
- Java Web项目中解决中文乱码方法总结
- JQuery中使用Ajax传中文参数乱码解决方案(javaweb开发)
- javaweb开发中文乱码问题
- java web开发时表单提交引起的一些中文乱码问题
- Java Web开发项目中中文乱码解决方法汇总
- 使用eclipse开发web项目中常见的中文乱码问题总结