您的位置:首页 > 其它

servlet,page指令,meta三者的Content-Type的区别与联系

2015-06-11 22:58 411 查看


一.引子

下面的servlet能显示中文吗?

public class SimpleServlet extends HttpServlet{

public void doGet(HttpServletRequest req, HttpServletResponse resp) throws ServletException,

java.io.IOException{

resp.setContentType("text/html");

PrintWriter w = resp.getWriter();

System.out.println("响应的输出编码器:" + resp.getCharacterEncoding());

w.println("<html>");

w.println("<!DOCTYPE html PUBLIC /"-//W3C//DTD XHTML 1.0 Strict//EN/" /"http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd/">");

w.println("<head>");

w.println("<title>文字与图片</title>");

w.println("</head>");

w.println("<body>");

w.println("文字与图片");

w.println("<hr />");

//w.println("<img src="gif/aa.jpg" />");

w.println("</body>");

w.println("</html>");

w.flush();

}

}

结果是:

?????


二.看服务器传回浏览器的原始包

[第一部份,包头(以字串方式显示)]

HTTP/1.1 200 OK

Server: Apache-Coyote/1.1

Content-Type: text/html;charset=ISO-8859-1

Transfer-Encoding: chunked

Date: Wed, 22 Oct 2008 08:37:29 GMT

[第二部分,包体(以二进制方式显示)]

c7[第一个包体长度]



0[第二个包体长度]

从Content-Type中看出包体的编码方式是ISO-8859-1,这是Servlet的默认编码方式.以ISO-8859-1来翻译第一个包体的内容:

<html>

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/x

html1/DTD/xhtml1-strict.dtd">

<head>

<title>?????</title>

</head>

<body>

?????

<hr />

</body>

</html>


三.原因

尽管我们在Servlet中设置了中文,但容器框架会把中文翻成ISO-8859-1编码,而ISO-8859-1并不支持中文,所以翻成了?????


四.解决

1.设置编码方式来解决问题:

public class SimpleServlet extends HttpServlet{

public void doGet(HttpServletRequest req, HttpServletResponse resp) throws ServletException,

java.io.IOException{

resp.setContentType("text/html;charset=gb2312");

...

}

}

结果:

文字与图片

原始包:



CEC4D7D6D3EBCDBCC6AC正是"文字与图片"的gb2312编码

2.一定得设成gb2312吗?再试试UTF-8

public class SimpleServlet extends HttpServlet{

public void doGet(HttpServletRequest req, HttpServletResponse resp) throws ServletException,

java.io.IOException{

resp.setContentType("text/html;charset=UTF-8");

...

}

}

结果:

文字与图片

仍是正确的,这是由于UTF-8支持汉字,不会以3f3f3f3f3f来代替.

原始包:

HTTP/1.1 200 OK

Server: Apache-Coyote/1.1

Content-Type: text/html;charset=UTF-8

Transfer-Encoding: chunked

Date: Wed, 22 Oct 2008 08:48:14 GMT

db



0

E69687E5AD97E4B88EE59BBEE78987是"图片与文字"的UTF-8编码


五.meta数据中的Content-Type

1.我们也可以在页面的<head>中通过<meta>来设置文件编码



<html>

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/x

html1/DTD/xhtml1-strict.dtd">

<head>

<meta http-equiv="Content-Type" content="text/html;charset=UTF-8"/>

<title>图片与文字</title>

</head>

<body>

图片与文字

<hr />

</body>

</html>

浏览器会按UTF-8来解析页面.

2.resp.setContentType("text/html;charset=gb2312")与<meta>都指定了,并且不一致.哪一个有效呢?

HTTP/1.1 200 OK

Server: Apache-Coyote/1.1

author: holly

Content-Type: text/html;charset=gb2312

Transfer-Encoding: chunked

Date: Thu, 23 Oct 2008 07:45:49 GMT

经过测试,浏览器依据前者来显示.


六.客户端提交的表单数据

我们可能也会希望,浏览器上送的request的包头的Content-Type项也指明表单数据的编码方式.可是没有:

Content-Type: application/x-www-form-urlencoded


servlet在解码的时候,同样会按照默认的编码来解,可能是ISO-8859-1.这样就造成了?.

所以在HttpServletRequest.getParameter之前,必须先设置HttpServletRequest.setCharacterEncoding("...")


也许会纳闷,怎么知道浏览器上送数据的编码方式呢?产生上送数据的页面不也是从服务器上传下去的吗?该页面的Content-Type中charset是什么,浏览器就会严格按照这个来编码.所以自始至终都应该主动设置每个页面的字符编码.



七.jsp的page指令

<%@page contentType="text/html;charset=gb2312" pageEncoding="gb2312"%>

1.contentType

jsp文件会被tomcat转换成servlet.

page指令中的contentType正好是HttpServletResponse.setContentType()语句,也就是响应包包头的Content-Type: text/html;charset=gb2312

2.pageEncoding

jsp文件本身是用什么编码方式保存的,这样转成servlet时,就能正确的解析文件中的汉字



八.结论

1.请通过HttpServletResponse.setContentType("text/html;charset=gb2312") 或HttpServletResponse.setCharacterEncoding("gb2312")来指定服务器下传内容的编码.

2.编码能支持汉字即可,不一定非为gb2312.
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: