您的位置:首页 > 运维架构 > Tomcat

jsp tomcat7.0 网页post/get乱码 详细分析

2011-03-27 19:35 211 查看
jsp的网页在提交表单时有乱码。本文详细分析了原因及解决办法。

需要提前知道简单的编码的知识。

1.jsp的pageEncoding和contentType属性


关于JSP页面中的pageEncoding和contentType两种属性的区别:

pageEncoding是jsp文件本身的编码

contentType的charset是指服务器发送给客户端时的内容编码

JSP要经过两次的“编码”,第一阶段会用pageEncoding,第二阶段会用utf-8至utf-8,第三阶段就是由Tomcat出来的网页, 用的是contentType。

第一阶段是jsp编译成.java,它会根据pageEncoding的设定读取jsp,结果是由指定的编码方案翻译成统一的UTF-8 JAVA源码(即.java),如果pageEncoding设定错了,或没有设定,出来的就是中文乱码。

第二阶段是由JAVAC的JAVA源码至java byteCode的编译,不论JSP编写时候用的是什么编码方案,经过这个阶段的结果全部是UTF-8的encoding的java源码。

JAVAC用UTF-8的encoding读取java源码,编译成UTF-8 encoding的二进制码(即.class),这是JVM对常数字串在二进制码(java encoding)内表达的规范。

第三阶段是Tomcat(或其的application container)载入和执行阶段二的来的JAVA二进制码,输出的结果,也就是在客户端见到的,这时隐藏在阶段一和阶段二的参数contentType就发挥了功效

contentType的设定.

pageEncoding 和contentType的预设都是 ISO8859-1.

jsp文件不像.java(直接写java本地程序产生),.java在被编译器读入的时候默认采用的是操作系统所设定的locale所对应的编码,比如中国大陆就是GBK,台湾就是BIG5或者MS950。而一般我们不管是在记事本还是在ue中写代码,如果没有经过特别转码的话,写出来的都是本地编码格式的内容。所以编译器采用的方法刚好可以让虚拟机得到正确的资料。

encodinga.jsp

<%@ page language="java" contentType="text/html; charset=utf-8"%>

<form action="encodingb.jsp">

name:<input type=text name=name>

<input type=submit value="中文">

</form>

encodingb.jsp

<%@ page language="java" contentType="text/html; charset=utf-8">

<%

String name=request.getParameter("name");

%>

<%=name %>

2.post过程。


浏览器上显示的页面的编码是utf-8,则用户输入到文本框中的文本的编码较复杂(应该由系统决定,跟locale一致)。post时,浏览器会将locale字符串转成ISO8859-1字符串送至tomcat服务器。这也是request.getParameter()得到的字符串。由encodingb.jsp产生的class处理这个字符串产生html页面,给浏览器显示。



Tomcat默认POST的编码方式为ISO-8859-1这种西文方式,而非需要的UTF-8,或者GB2312,GBK等。因此在POST传值的时候产生了乱码。

3解决方法


解决这个问题的方法有不少,较为简单,但非长久之策的一个方法如下:将类似于

String
name=request.getParameter
(
"name")
;

这样的语句改成

String
name=new
String
(
(
request.getParameter
(
"name"
)
)
.getBytes
(
"ISO-8859-1"
)
,"utf8"
)
;

即可。这里UTF-8可以换成其他合适的编码。

4附录(函数说明)

String.getBytes(String encoding);

将一个字符串以指定的字符集解码为字节序列。

String.String(byte [], String charsetName)

使用指定的字符集解码一个字节序列。

对于第一个函数来说,一个String是有其本身的编码的,给定了一个字符串,就给定了一块内存和以什么样的解码方式读取这块内存中的内容。getBytes则强致去掉了String原有的解码方式而以指定的encoding来解码这块内存。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: