初接触JAVA国际化问题-解决JAVA中文字符乱码
2006-02-22 02:16
393 查看
刚写了一个struts,以前写程序不太关注国际化问题,今天就翻了翻资料,终于了解了一些
以下为小弟的理解,只是从页面编码的环节说起,并未涉及到提取数据库数据、页面传值不足之处请指正!
如果要支持国际化,那么页面的编码必须为UTF-8,因为客户端的浏览器都支持UTF-8编码。
下面做个简单的测试:
建立一个html文件,内容很简单,如下
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML>
<HEAD>
<TITLE> New Document </TITLE>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
</HEAD>
<BODY>
这是一个中文字符串<BR>
这是一个中文字符串
</BODY>
</HTML>
以上代码保存后,在IE中打开,你可以看到
这是一个中文字符串
Β???
第二行显示的可能不同机器显示不一样,但是应该都是乱码。
下面进行第二步,返回刚才的页面,修改浏览器的编码方式,可以看得到
无论怎么改变编码方式,第一行永远现实的是“这是一个中文字符串”,只有在编码方式为简体中文的时候,第二行才不显示乱码。
所以,如果要你的web站点支持国际化,那么除了编码方式要为UTF-8,而且页面中的中文部分(包括中文的标点符号)都要经过UNICODE编码。
UTF-8编码工具:
方法一: 请参考文章利用Eclipse编辑中文资源文件,文章中介绍了JDK的native2ascii工具
方法二: UTF-8 转换工具,这是一个JS脚本,保存后可以对输入的字符串进行转换,代码如下
<html>
<head>
<title>UTF8 转换工具</title>
<div align=center>
<center>
<table border=0 cellpadding=0 cellspacing=0 style="border-collapse: collapse" width=600 id=AutoNumber1 height=26>
<tr>
<td width=100% height=26>
<p align=center><font face=黑体 size=5 color=#FF0000>UTF-8 转换工具</font></p>
<p>使用方法:</p>
<p> 在下面的文本框中输入中文文字,按“转化”,即可将其转化为UTF-8字符。</p>
<p> 再按“还原”,即可将其还原为简体中文。</td>
</tr>
</table>
</center>
</div>
<p align=center>
<textarea cols=82 rows=10 id=code>
</textarea> </p>
<p align=center>
<input type=button onclick=encode(code,this) value=转化>
<script>
var mode="zhuan";
function encode(obj,btn){
if(mode=="zhuan"){
obj.value=obj.value.replace(/[^/u0000-/u00FF]/g,function($0){return escape($0).replace(/(%u)(/w{4})/gi,"$2;")});
btn.value="还原";
mode="huan";
}else{
obj.value=unescape(obj.value.replace(//g,'%u').replace(/;/g,''));
btn.value="转化";
mode="zhuan";
}
}
</script></p>
以下为小弟的理解,只是从页面编码的环节说起,并未涉及到提取数据库数据、页面传值不足之处请指正!
如果要支持国际化,那么页面的编码必须为UTF-8,因为客户端的浏览器都支持UTF-8编码。
下面做个简单的测试:
建立一个html文件,内容很简单,如下
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML>
<HEAD>
<TITLE> New Document </TITLE>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
</HEAD>
<BODY>
这是一个中文字符串<BR>
这是一个中文字符串
</BODY>
</HTML>
以上代码保存后,在IE中打开,你可以看到
这是一个中文字符串
Β???
第二行显示的可能不同机器显示不一样,但是应该都是乱码。
下面进行第二步,返回刚才的页面,修改浏览器的编码方式,可以看得到
无论怎么改变编码方式,第一行永远现实的是“这是一个中文字符串”,只有在编码方式为简体中文的时候,第二行才不显示乱码。
所以,如果要你的web站点支持国际化,那么除了编码方式要为UTF-8,而且页面中的中文部分(包括中文的标点符号)都要经过UNICODE编码。
UTF-8编码工具:
方法一: 请参考文章利用Eclipse编辑中文资源文件,文章中介绍了JDK的native2ascii工具
方法二: UTF-8 转换工具,这是一个JS脚本,保存后可以对输入的字符串进行转换,代码如下
<html>
<head>
<title>UTF8 转换工具</title>
<div align=center>
<center>
<table border=0 cellpadding=0 cellspacing=0 style="border-collapse: collapse" width=600 id=AutoNumber1 height=26>
<tr>
<td width=100% height=26>
<p align=center><font face=黑体 size=5 color=#FF0000>UTF-8 转换工具</font></p>
<p>使用方法:</p>
<p> 在下面的文本框中输入中文文字,按“转化”,即可将其转化为UTF-8字符。</p>
<p> 再按“还原”,即可将其还原为简体中文。</td>
</tr>
</table>
</center>
</div>
<p align=center>
<textarea cols=82 rows=10 id=code>
</textarea> </p>
<p align=center>
<input type=button onclick=encode(code,this) value=转化>
<script>
var mode="zhuan";
function encode(obj,btn){
if(mode=="zhuan"){
obj.value=obj.value.replace(/[^/u0000-/u00FF]/g,function($0){return escape($0).replace(/(%u)(/w{4})/gi,"$2;")});
btn.value="还原";
mode="huan";
}else{
obj.value=unescape(obj.value.replace(//g,'%u').replace(/;/g,''));
btn.value="转化";
mode="zhuan";
}
}
</script></p>
相关文章推荐
- JAVA 编程小技巧之UDP发送中文字符乱码问题解决
- java 向 mysql插入中文字符乱码问题解决
- java 解决全站字符乱码(POST和GET中文编码问题)
- ReadString在UNICODE下中文乱码的解决办法(Char型字符和Unicode字符的转换问题)
- java web中的中文字符乱码问题的解决
- Java中按照行读取和写入文件 日志常用操作 解决中文乱码问题
- 中文乱码问题及其解决方法(java中)
- java 中文乱码问题的解决
- 解决java程序中文乱码问题
- Java与C之间通过JNI传递中文字符乱码解决
- Java读写文件中文乱码问题折腾一个周末重要解决
- 黑马程序员_解决读取web.xml中文字符乱码问题
- java中文乱码问题解决
- javadbf 实现解决中文乱码问题
- java程序向mysql数据库插入数据中文 乱码问题解决
- java : JSP页面上中文乱码问题的解决经验
- 解决ubuntu中java1.6显示中文乱码问题
- java写入中文乱码的问题解决
- JAVA ,SSH中文及其乱码问题的解决 6大配置点 使用UTF-8编码
- java实现中文文件下载,解决乱码问题,亲测无问题~~