获取运用了GZIP技术进行压缩的网页的Html代码
2013-04-03 16:52
543 查看
一些网站的页面是通过GZIP技术进行压缩传输的,这样会加快加载速度。但是通过WebClient获取到的html代码则是乱码,所以需要通过GZIP解压来正常显示html代码。
通过上述代码解压,即可获取到正确的html代码字符串。
byte[] btArrWebHtmlCode = this.GetWebHtmlBytes(url); if (btArrWebHtmlCode.Length == 0) { return string.Empty; } Encoding webEncoding = Encoding.UTF8; MemoryStream msWebCode = new MemoryStream(btArrWebHtmlCode); GZipStream gzipstreamWebHtml = new GZipStream(msWebCode, CompressionMode.Decompress); MemoryStream msTemp = new MemoryStream(); int iCount = 0; byte[] btTemp = new byte[btArrWebHtmlCode.Length]; while ((iCount = gzipstreamWebHtml.Read(btTemp, 0, btTemp.Length)) > 0) { msTemp.Write(btTemp, 0, iCount); } btArrWebHtmlCode = msTemp.ToArray(); return webEncoding.GetString(btArrWebHtmlCode, 0, btArrWebHtmlCode.Length);
通过上述代码解压,即可获取到正确的html代码字符串。
相关文章推荐
- 两行代码取得当前网站的(无交互状态下的)网页html源代码就够了,不用对asp.net网页设计技术进行一点点倒退
- 爬取网页时自动获取网页编码信息,并对特殊的乱码页面(压缩过的网页内容)用gzip进行解码。
- ASP函数 获取域名解析后的IP 获取远程网页的HTML代码
- JS获取整个网页html代码
- C#获取指定网页HTML原代码
- PHP压缩html网页代码 : 清除空格,制表符,注释标记
- PHP压缩html网页代码原理(清除空格,换行符,制表符,注释标记)
- java获取网页HTML代码
- IIS上启用Gzip对网页进行压缩(图文)
- 启用IIS Gzip 页面压缩技术 加速网页的浏览速度
- 获取本站点网页的html代码与任意URL网页的html代码
- JS获取整个HTML网页代码 - Android 集美软件园 - 博客频道 - CSDN.NET
- PHP压缩html网页代码(清除空格,换行符,制表符,注释标记)
- 启用IIS Gzip 页面压缩技术 加速网页的浏览速度
- 爬虫技术 -- 进阶学习(九)使用HtmlAgilityPack获取页面链接(附c#代码及插件下载)
- Tomcat下通过配置提高网页访问速度[gzip压缩技术]
- java---GZIP压缩技术演示(结合XML文档配置,网页显示)
- 全面解析Linux空间用Gzip对网页内容进行压缩
- JS获取整个网页html代码
- js获取网页上选中的部分,包含html代码