您的位置:首页 > Web前端 > JavaScript

decodeURI解码,由URIEncoder.encode("","GBK")编码的中文,问题解决

2013-08-05 19:18 525 查看
一、js内置编码,解码函数的介绍:

@.JavaScript中有三个可以对字符串编码的函数,分别是: escape,encodeURI,encodeURIComponent,相应3个解码函数:

unescape,decodeURI,decodeURIComponent 。

使用介绍:

escape()函数

定义和用法

1 escape() 函数可对字符串进行编码,这样就可以在所有的计算机上读取该字符串。

语法

escape(string)

参数 描述

string 必需。要被转义或编码的字符串。

返回值

已编码的 string 的副本。其中某些字符被替换成了十六进制的转义序列。

说明

该方法不会对 ASCII 字母和数字进行编码,也不会对下面这些 ASCII 标点符号进行编码: - _ . ! ~ * ' ( ) 。其他所有的字符都会被转义序列替换。

2 encodeURI()函数 decodeURI() 函数

定义和用法

encodeURI() 函数可把字符串作为 URI 进行编码(decodeURI解码)。

语法

encodeURI(URIstring)

参数 描述

URIstring 必需。一个字符串,含有 URI 或其他要编码的文本。

返回值

URIstring 的副本,其中的某些字符将被十六进制的转义序列进行替换。

说明

该方法不会对 ASCII 字母和数字进行编码,也不会对这些 ASCII 标点符号进行编码: - _ . ! ~ * ' ( ) 。

该方法的目的是对 URI 进行完整的编码,因此对以下在 URI 中具有特殊含义的 ASCII 标点符号,encodeURI() 函数是不会进行转义的:;/?:@&=+$,#

3 encodeURIComponent() 函数/ decodeURIComponent() 函数

定义和用法

encodeURIComponent() 函数可把字符串作为 URI 组件进行编码( decodeURIComponent() 解码)。

语法

encodeURIComponent(URIstring)

参数 描述

URIstring 必需。一个字符串,含有 URI 组件或其他要编码的文本。

返回值

URIstring 的副本,其中的某些字符将被十六进制的转义序列进行替换。

说明

该方法不会对 ASCII 字母和数字进行编码,也不会对这些 ASCII 标点符号进行编码: - _ . ! ~ * ' ( ) 。

其他字符(比如 :;/?:@&=+$,# 这些用于分隔 URI 组件的标点符号),都是由一个或多个十六进制的转义序列替换的。

提示和注释

提示:请注意 encodeURIComponent() 函数 与 encodeURI() 函数的区别之处,前者假定它的参数是 URI 的一部分(比如协议、主机名、路径或查询字符串)。
因此 encodeURIComponent() 函数将转义用于分隔 URI 各个部分的标点符号。

注意点:

1 encodeURI和decodeURI 主要用于URL(网址)的编码、解码,是JavaScript的自身函数,采用UTF-8编码格式对指定的字符串进行编码或解码

说明:

  本项功能只是用于 encodeURI编码和decodeURI解码 的对照,可以识别和研究网址<URL地址>中被编码过的汉字。

  encodeURI函数不能编码的字符:@ ~ ! @ # $ & * ( ) _ + : ? - = ; ' , . / 英文 数字

  由于目前各国网页字符集的不同造成了URL编码的多种形式,例如 GBK和UTF 这2种字符集的网页中汉字URL编码方式就不一样。

 encodeURI编码和decodeURI解码只能针对UTF-8字符集的网页,不能识别GBK网页编码过的汉字编码。

2 encodeURIComponent和decodeURIComponent 主要用于URL(网址)的编码、解码,是JavaScript的自身函数,

采用UTF-8编码格式对指定的字符串进行编码或解码。

与encodeURI和decodeURI的区别:

说明:

  本项功能只是用于 encodeURIComponent编码和decodeURIComponent解码 的对照,可以识别和研究网址<URL地址>中被编码过的汉字。

  encodeURIComponent函数相对于encodeURI函数来说,可以对更多的字符进行编码,

包括:@ # $ & + : ? = ; , / 等字符。

  encodeURIComponent函数不能编码的字符:@ ~ ! * ( ) _ - ' . 英文 数字

  由于目前各国网页字符集的不同造成了URL编码的多种形式,例如 GBK和UTF 这2种字符集的网页中汉字URL编码方式就不一样。

 encodeURIComponent编码和decodeURIComponent解码只能针对UTF-8字符集的网页,不能识别GBK网页编码过的汉字编码。

总结:由上得知js再进行解码中文时,只能解码由utf-8格式编码的中文;如果解码GBK格式编码的中文,js会抛出“被解码的 URI 不是合法的编码“的异常;

网上http://blog.csdn.net/cuixiping/article/details/1723741这个博客重写了js类库中的方法,实现了解码GBK格式的中文,但是使用他的方法后解码utf-8格式的中文时会抛出同样的错。

具体解决方案有待研究,,如果有大牛已经有了解决方法,希望留言,,,,,,
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  编码 URL uri JavaScript d
相关文章推荐