您的位置:首页 > 运维架构 > Tomcat

TOMCAT下的JIVE2的中文问题分析及解决

2001-09-21 18:12 676 查看
TOMCAT下的JIVE2的中文问题的报告

原文摘自jive论坛用户shyguy的帖子。

翻译者:cherami

XXX 注意 XXX:
所有的结论都是基于一下平台:

Winnt4.0(简体中文版) + Sun JDK1.3 + Tomcat4.0-b7 + jive2.0.1 + mysql3.23.38 + org.gjt.mm.mysql.Driver-2.04

在这样的条件下,安装在TOMCAT下的Jive2.0不能像其他JSP应用那样不做任何修改就可以正确的显示中文。我不敢确定但是几个测试的结果告诉我tomcat核心的编码总是8859_1,无论是否在双字节的操作系统下。当客户端输入一些中文,request.getParameter()请求返回的字符串是8859_1,因此如果你使用System.out.println()将输入打印到控制台,它看上去就像"??x?"。如果你在每个JSP文件的开始加上 <%@ page contentType="text/html;charSet=gb2312" %> 标签,中文就可以正确显示,因为tomcat知道它的内核编码是8859_1而输出到客户端的PrintWriter(它是JSP的输出对象)的编码是gb2312,因此PrintWriter在内部做了令人愤怒的8859_1到gb2312的转换。这就是为什么我们总是添加contentType解决中文问题的原因。
但是不幸的是,当我们通过JDBC从数据库提取字符串的时候事情就不一样了。

看看下面的虚拟的代码:
str=rec.getString(field);
你能告诉我字符串str的编码吗?

答案是: gb2312!!!

(就像mysql jdbc驱动一样,很多包都根据平台返回字符串的编码,例如 SimpleDateFormat 和
JavaMail。)因此,当你将字符串传递到PrintWrite时,愚蠢的PrintWriter将再次使用8859_1-->gb2312的转换。可怜的客户端别无选择的看到丑陋的????。

令我困惑的是:

request.getParameter()的返回字符串的编码是8859_1,因此向控制台打印时它看上去像??x?,但是Jive可以将字符串用gb2312编码存入数据库!!!

例如,在post.jsp里面,在消息创建发生以前,我将中文主题和内容输出到控制台,它看上去是??x?,但是在mysql数据库里面,SELECT * FROM jiveMessage将返回正确的中文!

同时我也发现response.setLocale()对中文输出没有作用。

如何解决呢:

1. 在输出前使用String.getBytes()反向转换gb2312字符串,这是最愚蠢的方法。

2. 在英文平台下运行服务器。

3. 最最最最好的方法是: 使用其他的 java服务器!

对于TOMCAT用户的建议是:

如果你确实想在一个双字节的操作系统(例如简体中文版的Winnt)上运行TOMCAT,你最好:
(1)添加<%@ page contentType="text/html;charSet=gb2312"%>到
/include/brankding/style.jsp 和
/admin/include/global.jsp的第一行(路径是相对TOMCAT的主目录)

(2)反向转换从数据库返回的所有字符串为8859_1编码。这需要修改JIVE核心的所有DBxxxx类,
或者修改JDBC驱动的"result.getString()"进行反向转换,

或者修改TOMCAT内核中的"out"对象进行反向转换。

(3)如果你修改了tomcat内核中的"out对象,在将中文信息传递到jive/index.jsp时你最好使用URLEncode(/dir/URL.jsp?gb2312_msg)。

附:Rexip AppServer 有Record-Breaking Benchmark Results处理Java应用的服务器端中文问题。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: