您的位置:首页 > 其它

解决Servlet的乱码问题

2016-01-09 21:19 316 查看
在使用原生的Servlet进行web开发时,经常会遇到一些中文乱码问题。这儿简单总结一下:

造成乱码问题的原因只有一个:即客户端与服务端的字符编码不一致所导致。

服务器获取客户端传递过来的数据出现乱码的问题(即使用get获取post向服务器发送请求时出现乱码):

这里首先明确一下 get与post的乱码处理是不一致的,当get请求时,其传递给服务器的数据是附加在URL地址之后的;而post的请求时,其传递给服务器的数据是作为请求体的一部分传递给服务器。

post请求的乱码处理 :

用户在表单中填写的内容在http体中被提交给Servlet。当我们在表单中输入中文时,servlet的request的编码与客户端不一致,则服务器无法解析,则会出现乱码。解决方法是改变http请求体中的字符编码(对于get无效,因为get提交在请求头中)

改变http请求体中的字符编码为UTF8 : request.setCharacterEncoding(“UTF-8”);

解决get提交时的乱码方法一 :

URL的参数没有使用编码(即使用了ISO-8859-1等),则在服务器端获取get的参数的时候使用String一个可以指定编码的构造函数。

[code]String username = request.getParameter("username");

String resultName = new String(username.getBytes("ISO-8859-1"),"utf-8");


解决get提交时的乱码方法二 :

有时提交的一些信息在地址栏显示的是“%2C%C6%CC%C6”的字样,其实这就是对URL进行了如下的编码。

java有两个类用来修改编码:

进行编码:URLEncoder.encode(String s,”UTF-8”)

进行解码:URLDecoder.decode(String s,”UTF-8”);

这样就可以得到传递过来的中文参数了,许多网站用的都是这种方式解决中参数的。

使用这个类把URL修改为:

[code]
    http://127.0.0.1:8080/test?username=<%=URLEncoder.eccode("乱码","UTF8")%>


这样服务器获取username这个参数使用:

[code]String username = URLDecoder.decode(request.getParameter("username"),"UTF8");


解决get提交时的乱码方法三 :修改Tomcat的编码

在上述的get请求所导致乱码问题中,还有一种解决的方案,我们常用Tomcat作为运行Servlet和JSP的容器,而Tomcat内部默认的编码是ISO-8859-1,所以对于get请求方式,其传递的数据(URI)会附加在访问的资源后面,其编码是Tomcat默认的,如果修改该URI的编码,那么对于所有的get请求方式便不会出现乱码了包括上边说的重定向和超链接,在Tomcat的配置文件server.xml中找到修改Tomcat的端口的地方,在其内部加入URIEncoding属性,设置为和你的项目中所设的编码一样的值,这里全部都是UTF-8。如下所示:

[code]<Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443"  URIEncoding="UTF-8" />


以上就是处理服务端获取客户端传递过来的数据出现乱码的问题:现在我们来看客户接受服务器响应的数据时出现乱码:

返回浏览器显示的乱码:

在Servlet编程中,经常需要通过response对象将一些信息返回给浏览器(response.getWriter().write(“xxx”)),给我们的客户端,而我们在服务器端显示的中文,但是响应给客户端浏览器却是乱码。这主要是由于response对象的getWriter()方法返回的PrintWriter对象默认使用“ISO-8859-1”字符集编码进行Unicode字符串到字节数组的转换,由于ISO8859-1字符集中根本就没有包含中文字符,所以Java在进行转换的时候会将无效的字符编码输出给客户端,于是便出现了乱码,为此ServletResponse接口中便定义了setCharacterEncoding、setContentType等方法来指定getWriter方法返回的PrintWriter对象所使用的字符集编码,所以我们在写Servlet程序中,在调用getWriter方法之前设置这些方法的值。我们为了防止乱码,经常将以下两条语句一起写上:

[code]response.setContentType(“text/html;charset=utf-8”);
response. setCharacterEncoding(“UTF-8”);


只要编写Servlet文件中含有响应给客户端的信息,那么就要写上这两句话。最好写上第二句话,因为它的优先级高,它的设置结果将覆盖setContentType等方法设置的字符编码集。

通过Filter解决乱码问题:

在web.xml 文件中:

[code]<filter>  
        <filter-name>EncodingFilter</filter-name>  
        <filter-class>com.example.SysFilter</filter-class>  
        <init-param>  
            <param-name>encoding</param-name>  
            <param-value>UTF-8</param-value>  
        </init-param>  
    </filter>  
    <filter-mapping>  
        <filter-name>EncodingFilter</filter-name>  
        <url-pattern>*.do</url-pattern>  
    </filter-mapping>


com.example.SysFilter类:

[code]public class SysFilter implements Filter {   
    protected String encodingName;   

    protected FilterConfig sysFilter;   

    public void destroy() {   

    }   

    public void doFilter(ServletRequest arg0, ServletResponse arg1,   
            FilterChain arg2) throws IOException, ServletException {   
        // TODO Auto-generated method stub   
            try {     
                arg0.setCharacterEncoding(this.sEncodingName);   
                arg1.setContentType("text/html;charset=" + this.sEncodingName);   
                arg1.setCharacterEncoding(this.sEncodingName);   
                arg2.doFilter(arg0, arg1);   
            } catch (Exception e) {   
            //....
            }  finally{
                 arg2.doFilter(arg0, arg1);   
            }
    }   

    public void init(FilterConfig arg0) throws ServletException {   
        // TODO Auto-generated method stub   
        this.sysFilter = arg0;   
        this.sEncodingName = this.sysFilter.getInitParameter("encoding");   
    }   
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: