备忘:几种中文乱码处理转码情况
2008-09-07 15:24
375 查看
备忘:几种中文乱码处理转码情况
一般中文转码情况如下:
public class HelloWorld {
public static void main(String[] argv){
try{
System.out.println("中文");//1
System.out.println("中文".getBytes());//2
System.out.println("中文".getBytes("GB2312"));//3
System.out.println("中文".getBytes("ISO8859-1"));//4
System.out.println(new String("中文".getBytes()));//5
System.out.println(new String("中文".getBytes(),"GB2312"));//6
System.out.println(new String("中文".getBytes(),"ISO8859-1"));//7
System.out.println(new String("中文".getBytes("GB2312")));//8
System.out.println(new String("中文".getBytes("GB2312"),"GB2312"));//9
System.out.println(new String("中文".getBytes("GB2312"),"ISO8859-1"));//10
System.out.println(new String("中文".getBytes("ISO8859-1")));//11
System.out.println(new String("中文".getBytes("ISO8859-1"),"GB2312"));//12
System.out.println(new String("中文".getBytes("ISO8859-1"),"ISO8859-1"));//13
}
catch(Exception e){
e.printStackTrace();
}
}
}
js中escape,encodeURI,encodeURIComponent三个函数的区别
js对文字进行编码涉及3个函数:escape,encodeURI,encodeURIComponent,相应3个解码函数:
unescape,decodeURI,decodeURIComponent
1、
传递参数时需要使用encodeURIComponent,这样组合的url才不会被#等特殊字符截断。
例如:<script language="javascript">
document.write('<a href="http://passport.baidu.com/?logout&aid=7&u='+encodeURIComponent
("http://cang.baidu.com/bruce42")+'">退出</a>');
</script>
2、
进行url跳转时可以整体使用encodeURI
例如:Location.href=encodeURI("http://cang.baidu.com/do/s?word=百度&ct=21");
3、
js使用数据时可以使用escape
[Huoho.Com编辑]
例如:搜藏中history纪录。
4、
escape对0-255以外的unicode值进行编码时输出%u****格式,其它情况下escape,encodeURI,encodeURIComponent编码结果
相同。
最多使用的应为encodeURIComponent,它是将中文、韩文等特殊字符转换成utf-8格式的url编码,所以如果给后台传递参数
需要使用encodeURIComponent时需要后台解码对utf-8支持(form中的编码方式和当前页面编码方式相同)
escape不编码字符有69个:*,+,-,.,/,@,_,0-9,a-z,A-Z
encodeURI不编码字符有82个:!,#,$,&,',(,),*,+,,,-,.,/,:,;,=,?,@,_,~,0-9,a-z,A-Z
encodeURIComponent不编码字符有71个:!, ',(,),*,-,.,_,~,0-9,a-z
一般中文转码情况如下:
public class HelloWorld {
public static void main(String[] argv){
try{
System.out.println("中文");//1
System.out.println("中文".getBytes());//2
System.out.println("中文".getBytes("GB2312"));//3
System.out.println("中文".getBytes("ISO8859-1"));//4
System.out.println(new String("中文".getBytes()));//5
System.out.println(new String("中文".getBytes(),"GB2312"));//6
System.out.println(new String("中文".getBytes(),"ISO8859-1"));//7
System.out.println(new String("中文".getBytes("GB2312")));//8
System.out.println(new String("中文".getBytes("GB2312"),"GB2312"));//9
System.out.println(new String("中文".getBytes("GB2312"),"ISO8859-1"));//10
System.out.println(new String("中文".getBytes("ISO8859-1")));//11
System.out.println(new String("中文".getBytes("ISO8859-1"),"GB2312"));//12
System.out.println(new String("中文".getBytes("ISO8859-1"),"ISO8859-1"));//13
}
catch(Exception e){
e.printStackTrace();
}
}
}
js中escape,encodeURI,encodeURIComponent三个函数的区别
js对文字进行编码涉及3个函数:escape,encodeURI,encodeURIComponent,相应3个解码函数:
unescape,decodeURI,decodeURIComponent
1、
传递参数时需要使用encodeURIComponent,这样组合的url才不会被#等特殊字符截断。
例如:<script language="javascript">
document.write('<a href="http://passport.baidu.com/?logout&aid=7&u='+encodeURIComponent
("http://cang.baidu.com/bruce42")+'">退出</a>');
</script>
2、
进行url跳转时可以整体使用encodeURI
例如:Location.href=encodeURI("http://cang.baidu.com/do/s?word=百度&ct=21");
3、
js使用数据时可以使用escape
[Huoho.Com编辑]
例如:搜藏中history纪录。
4、
escape对0-255以外的unicode值进行编码时输出%u****格式,其它情况下escape,encodeURI,encodeURIComponent编码结果
相同。
最多使用的应为encodeURIComponent,它是将中文、韩文等特殊字符转换成utf-8格式的url编码,所以如果给后台传递参数
需要使用encodeURIComponent时需要后台解码对utf-8支持(form中的编码方式和当前页面编码方式相同)
escape不编码字符有69个:*,+,-,.,/,@,_,0-9,a-z,A-Z
encodeURI不编码字符有82个:!,#,$,&,',(,),*,+,,,-,.,/,:,;,=,?,@,_,~,0-9,a-z,A-Z
encodeURIComponent不编码字符有71个:!, ',(,),*,-,.,_,~,0-9,a-z
相关文章推荐
- 利用jdbc向数据库存数据时避免中文乱码的几种情况
- Nokogiri 中文乱码的几种情况
- 页面几种处理中文乱码方法
- java解决几种情况下的中文乱码问题
- MyEclipse软件中中文乱码情况的处理
- URIEncoding与useBodyEncodingForURI 在tomcat中文乱码处理上的区别及CharacterEncodingFilter(备忘)
- ajax异步从前台传值给后天中文乱码的几种情况及解决办法
- (备忘)tomcat处理url参数中文乱码问题
- PHP的数据库显示中文乱码有几种情况?
- 中文乱码的几种情况以及解决方法
- URIEncoding与useBodyEncodingForURI 在tomcat中文乱码处理上的区别及CharacterEncodingFilter(备忘)
- 在浏览器传中文参数时在本地上转码是正常的,到服务器上出现乱码情况时解决方法
- Nokogiri 中文乱码的几种情况
- java解决中文乱码的几种情况
- django项目运行因中文而乱码报错的几种情况解决
- Servlet编程中可能出现中文乱码的几种情况
- 处理get中的中文乱码情况
- JAVAWEB开发模式之JSP的几种开发模式、处理Cookie中文乱码
- javaWed项目中用过滤器实现转码功能,敏感词汇过滤更能,处理Get和Post接收数据中的中文乱码问题以及敏感词汇的处理
- 在浏览器传中文参数时在本地上转码是正常的,到服务器上出现乱码情况时解决方法