您的位置:首页 > Web前端 > JavaScript

Js和C#中的字符串编码解码

2013-12-14 14:59 337 查看
在用javascript对URL字符串进行编码中,虽然escape()、encodeURI()、encodeURIComponent()三种方法都能对一些影响URL完整性的特殊字符进行过滤。但后两者是将字符串转换为UTF-8的方式来传输,解决了页面编码不一至导致的乱码问题。例如:发送页与接受页的编码格式(Charset)不一致(假设发送页面是GB2312而接收页面编码是UTF-8),使用escape()转换传输中文字串就会出现乱码问题。

以下是JS下对URL进行编/解码的各种方法:

1、escape 方法:返回一个可在所有计算机上读取的编码 String 对象。

function escape(charString : String) : String

不会被此方法编码的字符: @ * / +

说明:escape 方法返回一个包含 charstring 内容的字符串值(Unicode 格式)。所有空格、标点、

重音符号以及任何其他非 ASCII 字符都用 %xx 编码替换,其中 xx 等于表示该字符的十六进制数。

例如,空格返回为“%20”。(字符值大于 255 的字符以 %uxxxx 格式存储。)

注意:escape 方法不能用来对“统一资源标识符”(URI) 进行编码。对其编码应使用 encodeURI 和encodeURIComponent 方法。

2、encodeURI 方法:返回编码为有效的统一资源标识符 (URI) 的字符串。

function encodeURI(URIString : String) : String

不会被此方法编码的字符:! @ # $ & * ( ) = : / ; ? + '

说明:encodeURI 方法返回一个已编码的 URI。如果将编码结果传递给 decodeURI,则将返回初始的字符串。encodeURI 不对下列字符进行编码:“:”、“/”、“;”和“?”。请使用

encodeURIComponent 对这些字符进行编码。

3、encodeURIComponent方法:返回编码为统一资源标识符 (URI) 的有效组件的字符串。

function encodeURIComponent(encodedURIString : String) : String

不会被此方法编码的字符:! * ( ) '

说明:encodeURIComponent 方法返回一个已编码的 URI。如果将编码结果传递给decodeURIComponent,则将返回初始的字符串。因为 encodeURIComponent 方法将对所有字符编码,

请注意,如果该字符串代表一个路径,例如 /folder1/folder2/default.html,则其中的斜杠也将被编码,这样,当该字符串作为请求发送到 Web 服务器时它将是无效的。如果字符串中包含多个 URI 组件,请使用 encodeURI 方法进行编码。

4、unescape方法:从用 escape 方法编码的 String 对象中返回已解码的字符串。

function unescape(charString : String) : String

说明:unescape 方法返回一个包含 charstring 内容的字符串值。所有以 %xx 十六进制形式编码的

字符都用 ASCII 字符集当中等效的字符代替。(以 %uxxxx 格式(Unicode 字符)编码的字符用十六

进制编码 xxxx 的 Unicode 字符代替。)

注意:unescape 方法不应用于解码“统一资源标识符”(URI)。请改用 decodeURI 和 decodeURIComponent 方法。

5、decodeURI 方法:返回一个已编码的统一资源标识符 (URI) 的非编码形式。

function decodeURI(URIstring : String) : String

decodeURIComponent 方法:返回统一资源标识符 (URI) 的一个已编码组件的非编码形式。

function decodeURIComponent(encodedURIString : String) : String

BTW:C#中对URL编码的方法。。。

编码:Server.UrlEncode(string)

解码:Server.UrlDecode(string) 前面三种客户端编码都可以用这个方法在后台解码。

关于HttpUtility.UrlEncode,HttpUtility.UrlDecode,Server.UrlEncode,Server.UrlDecode

HttpUtility.UrlEncode 方法:

对 URL 字符串进行编码,以便实现从 Web 服务器到客户端的可靠的 HTTP 传输。

重载列表

将字节数组转换为已编码的 URL 字符串,以便实现从 Web 服务器到客户端的可靠的 HTTP 传输。

[C#] public static string UrlEncode(byte[]);

对 URL 字符串进行编码,以便实现从 Web 服务器到客户端的可靠的 HTTP 传输。

[C#] public static string UrlEncode(string);

使用指定的编码对象对 URL 字符串进行编码,以便实现从 Web 服务器到客户端的可靠 HTTP 传输。

[C#] public static string UrlEncode(string, Encoding);

从数组中的指定位置开始一直到指定的字节数为止,将字节数组转换为 URL 编码的字符串,以便实现从 Web 服务器到客户端的可靠的 HTTP 传输。

[C#] public static string UrlEncode(byte[], int, int);

HttpUtility.UrlDecode 方法:

将已经为在 URL 中传输而编码的字符串转换为解码的字符串。

重载列表

将已经为在 URL 中传输而编码的字符串转换为解码的字符串。

[C#] public static string UrlDecode(string);

使用指定的解码对象将 URL 编码的字节数组转换为已解码的字符串。

[C#] public static string UrlDecode(byte[], Encoding);

使用指定的编码对象将 URL 编码的字符串转换为已解码的字符串。

[C#] public static string UrlDecode(string, Encoding);

使用指定的编码对象,从数组中的指定位置开始到指定的字节数为止,将 URL 编码的字节数组转换为已解码的字符串。

[C#] public static string UrlDecode(byte[], int, int, Encoding);

Server是HttpServerUtility类的实例,是System.Web.UI.Page的属性。

HttpServerUtility.UrlEncode 方法:

编码字符串,以便通过 URL 从 Web 服务器到客户端进行可靠的 HTTP 传输。

重载列表

对字符串进行 URL 编码,并返回已编码的字符串。

[C#] public string UrlEncode(string);

URL 对字符串进行编码,并将结果输出发送到 TextWriter 输出流。

[C#] public void UrlEncode(string, TextWriter);

例:

String TestString = "This is a <Test String>.";

StringWriter writer = new StringWriter();

Server.UrlEncode(TestString, writer);

String EncodedString = writer.ToString();

HttpServerUtility.UrlDecode 方法:

对字符串进行解码,该字符串为了进行 HTTP 传输而进行编码并在 URL 中发送到服务器。

重载列表

对字符串进行 URL 解码并返回已解码的字符串。

[C#] public string UrlDecode(string);

对在 URL 中接收的 HTML 字符串进行解码,并将结果输出发送到 TextWriter 输出流。

[C#] public void UrlDecode(string, TextWriter);

需要注意的几点:

1、HttpUtility.UrlEncode,HttpUtility.UrlDecode是静态方法,而Server.UrlEncode,Server.UrlDecode是实例方法。

2、Server是HttpServerUtility类的实例,是System.Web.UI.Page的属性。

3、用HttpUtility.UrlEncode编码后的字符串和用Server.UrlEncode进行编码后的字符串对象不一样:

例如:

string url="http://search.99read.com/index.aspx?book_search=all&main_str=奥迷尔";

Response.Write(HttpUtility.UrlEncode(url));

Response.Write("<br>");

Response.Write(Server.UrlEncode(url));

输出结果是:

http%3a%2f%2fsearch.99read.com%2findex.aspx%3fbook_search%3dall%26main_str%3d%e5%a5%a5%e8%bf%b7%e5%b0%94

http%3a%2f%2fsearch.99read.com%2findex.aspx%3fbook_search%3dall%26main_str%3d%b0%c2%c3%d4%b6%fb

原因:Server.UrlEncode的编码方式是按照本地程序设置的编码方式进行编码的,而HttpUtility.UrlEncode是默认的按照.net的utf-8格式进行编码的。

如果改一下程序:

string url1="http://search.99read.com/index.aspx?book_search=all&main_str=奥迷尔";

Response.Write(HttpUtility.UrlEncode(url1,System.Text.Encoding.GetEncoding("GB2312")));

Response.Write("<br>");

Response.Write(Server.UrlEncode(url1));

输出的结果是:

http%3a%2f%2fsearch.99read.com%2findex.aspx%3fbook_search%3dall%26main_str%3d%b0%c2%c3%d4%b6%fb

http%3a%2f%2fsearch.99read.com%2findex.aspx%3fbook_search%3dall%26main_str%3d%b0%c2%c3%d4%b6%fb

4、有时候可能别的系统传递过来的url是用别的编码方式编码的。

介绍自己编写的一个方法,可以获取指定编码格式的QueryString。

public string GetNonNullQueryString(string key,Encoding encoding)

{

//引用System.Collections.Specialized和System.Text命名空间

string stringValue;

System.Collections.Specialized.NameValueCollection encodingQueryString;

//该方法是在2.0中新增的

encodingQueryString = HttpUtility.ParseQueryString(Request.Url.Query,encoding);

//'里面的key就是你提交的参数的Key

return encodingQueryString[key] != null ? encodingQueryString[key].Trim() : "";

}

调用:

string url = GetNonNullQueryString("url",Encoding.UTF8).Trim();

在对URL进行编码时,该用哪一个?这两都使用上有什么区别吗?

测试:

string file="文件上(传)篇.doc";

string Server_UrlEncode=Server.UrlEncode(file);

string Server_UrlDecode=Server.UrlDecode(Server_UrlEncode);

string HttpUtility_UrlEncode=System.Web.HttpUtility.UrlEncode(file);

string HttpUtility_UrlDecode=System.Web.HttpUtility.UrlDecode(HttpUtility_UrlEncode);

Response.Write("原数据:"+file);

SFun.WriteLine("Server.UrlEncode:"+Server_UrlEncode);

SFun.WriteLine("Server.UrlDecode:"+Server_UrlDecode);

SFun.WriteLine("HttpUtility.UrlEncode:"+HttpUtility_UrlEncode);

SFun.WriteLine("HttpUtility.UrlDecode:"+HttpUtility_UrlDecode);

输出:

原数据:文件上(传)篇.doc

Server.UrlEncode:%ce%c4%bc%fe%c9%cf%a3%a8%b4%ab%a3%a9%c6%aa.doc

Server.UrlDecode:文件上(传)篇.doc

HttpUtility.UrlEncode:%e6%96%87%e4%bb%b6%e4%b8%8a%ef%bc%88%e4%bc%a0%ef%bc%89%e7%af%87.doc

HttpUtility.UrlDecode:文件上(传)篇.doc

区别在于:HttpUtility.UrlEncode()默认是以UTF8对URL进行编码,而Server.UrlEncode()则以默认的编码对URL进行编码。

在用 ASP.Net 开发页面的时候, 我们常常通过 System.Web.HttpUtility.UrlEncode 和 UrlDecode 在页面间通过 URL 传递参数. 成对的使用 Encode 和 Decode 是没有问题的.

但是, 我们在编写文件下载的页面的时候, 常常用如下方法来指定下载的文件的名称:

Response.AddHeader("Content-Disposition","attachment; filename=" + HttpUtility.UrlEncode(fileName, Encoding.UTF8));

之所以转换成 UTF8 是为了支持中文文件名.

这 时候问题就来了, 因为 HttpUtility.UrlEncode 在 Encode 的时候, 将空格转换成加号('+'), 在 Decode 的时候将加号转为空格, 但是浏览器是不能理解加号为空格的, 所以如果文件名包含了空格, 在浏览器下载得到的文件, 空格就变成了加号.

一个解决办法是, 在 HttpUtility 的 UrlEncode 之后, 将 "+" 替换成 "%20"( 如果原来是 "+" 则被转换成 "%2b" ) , 如:

fileName = HttpUtility.UrlEncode(fileName, Encoding.UTF8);

fileName = fileName.Replace("+", "%20");

不明白微软为什么要把空格转换成加号而不是"%20". 记得 JDK 的 UrlEncoder 是将空格转换成 "%20"的.

经检查, 在 .Net 2.0 也是这样.

有时候默认aspx是以utf-8为编码的,你的程序默认编码(<globalization requestEncoding="gb2312" responseEncoding="gb2312"/>),问题出现了,以前没有问题的HttpUtility.UrlDecode在Page.Request回的值是乱码这就是上面说的HttpUtility.UrlDecode默认以UTF8对URL进行编码,这种情况下面只需将HttpUtility.UrlDecode改成Server.UrlEncode即可。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: