您的位置：首页 > 产品设计 > UI/UE

request/response解决中文乱码

2021-11-07 12:53 936 查看

Request中文乱码问题以及解决方案

补充三个知识点：

Get是URL解码方式。默认解码格式是Tomcat编码格式。所以URL解码是UTF-8，覆盖掉了request容器解码格式
Post是实体内容解码方式。默认解码格式是request编码格式。与Tomcat编码格式无关
解决request乱码问题是在代码中用
```
System.out.println(request.getCharacterEncoding());
```
看看接收过来的request是用什么方式编码的。我的编码方式是UTF-8，所有就没有出现乱码问题
下面提供通用的解决乱码问题，如果还没有解决可以结合上面三条自己尝试解决。

对于Post请求的中文乱码问题：

// 在 HttpServletRequest 接口中提供了一个 setCharacterEncoding() 方法，该方法用于设置 request 对象的解码方式。
request.setCharacterEncoding("utf-8");  //设置request对象的解码方式，这个要在所有获取对象之前

GET 提交时出现的中文乱码：

// 可以先使用错误码表 ISO-8859-1 将用户名重新编码变成字节，然后使用码表 UTF-8 进行解码。再次对 RequestParamsServlet 进行修改
// 因为get请求是在url后面进行传值，传进来的值已经是iso8859-1的编码形式了，所有要按照iso8859-1重新编码成二进制字节，然后按照utf-8的形式在进行解码
name = new String(name.getBytes("iso8859-1"),"utf-8");

Response中文乱码问题以及解决方案

下面通过案例演示乱码问题的产生原因以及解决方式。

@WebServlet("/jsp/test")
public class TestServlet extends HttpServlet {

public void doGet(HttpServletRequest request, HttpServletResponse response)throws ServletException, IOException {

String data = "麻瓜";
PrintWriter out = response.getWriter();
out.println(data);
}
}

当这样不做任何处理的时候，页面显示出来的中文一般都是乱码

由于计算机中的数据都是以二进制形式存储的，因此，当传输文本数据时，会发生字符和字节之间的转换。字符与字节之间的转换是通过查码表完成的，将字符转换成字节的过程称为编码，将字节转换成字符的过程称为解码，如果编码和解码使用的码表不一致，则会导致乱码问题。

知道了原理就很好解决中文乱码问题了，首先在浏览器控制台

document.charset

查看自己浏览器的默认解码表是啥，我这里使用Edge浏览器默认是

GBK

，然后在代码中使用

response.getCharacterEncoding()

，查看自己响应到浏览器的编码是什么，我这里为

UTF-8

，当然一般都是使用

UTF-8

进行开发所以响应回去的就是自己编写代码时使用的编码表，上面出现的乱码问题本质就是用

UTF-8

编码的中文，然后到浏览器中使用

GBK

进行解码，最后肯定出现乱码问题。

补充几个知识点：

```
response.setCharacterEncoding(“UTF-8”)
```
的作用是指定服务器响应给浏览器的编码。但是浏览器会以默认的方式进行解码。
```
response.setContentType(“text/html;charset=utf-8”)
```
的作用是指定服务器响应给浏览器的编码。同时，浏览器也是根据这个参数来对其接收到的数据进行重新编码（或者称为解码）。

对于发送数据，服务器按照

response.setCharacterEncoding<—contentType<—pageEncoding

的优先顺序，对要发送的数据进行编码，也就是说

setCharacterEncoding

的优先级高于

contentType

。

JSP要经过两次的“编码”，第一阶段会用pageEncoding，第二阶段会用utf-8至utf-8，第三阶段就是由Tomcat出来的网页， 用的是contentType。
第一阶段是jsp转译(翻译)成.Java，它会根据pageEncoding的设定读取jsp，结果是由指定的编码方案翻译成统一的UTF-8 JAVA源码（即.java），如果pageEncoding设定错了，或没有设定，出来的就是中文乱码。
第二阶段是从源码(.java)编译到字节码文件(.class)，不论JSP编写时候用的是什么编码方案，经过这个阶段的结果全部是UTF-8的encoding的java源码。
JAVAC用UTF-8的encoding读取java源码，编译成UTF-8 encoding的二进制码（即.class），这是JVM对常数字串在二进制码（java encoding）内表达的规范。
第三阶段是Tomcat（或其的application Container）载入和执行阶段二的来的JAVA二进制码，输出的结果，也就是在客户端见到的，这时隐藏在阶段一和阶段二的参数contentType就发挥了功效

解决办法有三种：

第一种方式以浏览器为标准，将代码中的编码方式改为浏览器的编码方式（不推荐，因为不同的用户浏览器编码方法很可能不一样）

@WebServlet("/jsp/test")
public class TestServlet extends HttpServlet {

public void doGet(HttpServletRequest request, HttpServletResponse response)throws ServletException, IOException {
// 我这里将响应回到浏览器的编码和浏览器保持一致，就可以解决浏览器乱码问题
response.setCharacterEncoding("gbk");    //设置响应回的中文使用gbk编码，浏览器再使用默认的gbk解码就不会出现问题
String data = "麻瓜";
PrintWriter out = response.getWriter();
out.println(data);
}
}

第二种方式是以代码为标准，通知浏览器中的解码方式改为代码中的编码方式，一般编码方式都是

utf-8，

这种比第一种好，但是也有人可能使用系统默认的

gbk

进行编码（不过这种情况下可能就没有乱码问题了(￣▽￣)"），所以也有可能出问题

@WebServlet("/jsp/test")
public class TestServlet extends HttpServlet {

public void doGet(HttpServletRequest request, HttpServletResponse response)throws ServletException, IOException {
response.setContentType("text/html;charset=utf-8"); //通知浏览器使用utf-8解码
// 这两种方式效果一样，都是设置浏览器的内容类型，当然不同的浏览器可以效果有些差距，我这里使用的是edge
// response.setHeader("Content-Type", "text/html;charset=utf-8");
String data = "麻瓜";
PrintWriter out = response.getWriter();
out.println(data);
}
}

中间插入一个测试

@WebServlet("/jsp/test")
public class TestServlet extends HttpServlet {

public void doGet(HttpServletRequest request, HttpServletResponse response)throws ServletException, IOException {
System.out.println(response.getCharacterEncoding()); // UTF-8，这里是编码默认的大写UTF-8
response.setContentType("text/html;charset=gbk");

System.out.println(response.getCharacterEncoding());// gbk
response.setCharacterEncoding("utf-8");

System.out.println(response.getCharacterEncoding());// 我修改后为小写utf-8

String data = "麻瓜";
PrintWriter out = response.getWriter();
out.println(data);
// 最后浏览器控制台document.charset：'UTF-8'
// 如果将setContentType和setCharacterEncoding调换位置，那么最后浏览器控制台document.charset：'GBK'
// 出现这种情况和网上一些说setCharacterEncoding优先级高的有些区别，我这里就以实测为标准，是因为代码顺序决定的优先级，有大佬知道原因的求指导
// 但是如果没有设置setContentType，那么setCharacterEncoding只会修改代码中的编码方式，不会修改浏览器的默认解码方式
}
}

由上面测试可以看出，如果不设置

setContentType

，那么

setCharacterEncoding

也不会有效果，那么

理论上统一编码方式为

utf-8

，这种方式基本可以解决所有问题了

@WebServlet("/jsp/test")
public class TestServlet extends HttpServlet {

public void doGet(HttpServletRequest request, HttpServletResponse response)throws ServletException, IOException {

response.setCharacterEncoding("utf-8");
response.setContentType("text/html;charset=utf-8");

String data = "麻瓜";
PrintWriter out = response.getWriter();
out.println(data);
}
}

不过这种方式和第二种方式效果一样，最后还是推荐第二种方式，程序员都是懒人嘛，写的少就是yyds。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航